Saltar al contenido principal
InicioTutorialesHojas de cálculo

Prueba Chi-cuadrado en hojas de cálculo

En este tutorial, aprenderás a realizar la prueba chi-cuadrado en hojas de cálculo.
may 2024  · 10 min leer

Si está interesado en aprender más sobre estadística en hojas de cálculo, siga el curso de DataCamp Estadísticas en hojas de cálculo.

En 1900, Karl Pearson publicó un artículo sobre la prueba de la χ2, que se considera uno de los fundamentos de la estadística moderna. En este trabajo, Pearson investigó la prueba de bondad de ajuste(Fuente). La prueba Chi-cuadrado es una prueba no paramétrica (una prueba estadística no paramétrica es una prueba cuyo modelo no especifica condiciones sobre el parámetro de la población de la que se extrae la muestra). Se utiliza para identificar la relación entre una variable categórica y se denota por χ2.

La prueba chi-cuadrado se construye a menudo a partir de una suma de errores al cuadrado o a través de la varianza de la muestra. Se trata de una prueba de hipótesis estadística en la que la distribución muestral de los estadísticos de la prueba es un chi-cuadrado cuando la hipótesis nula es verdadera. Surge del supuesto de que los datos son independientes y se distribuyen normalmente.

Empieza a aprender ciencia de datos gratis

Data Analysis in Google Sheets

BeginnerSkill Level
3 hr
14.7K learners
Learn to use Google Sheets to clean, analyze, and draw insights from data. Discover how to sort, filter, and use VLOOKUP to combine data.
See DetailsRight Arrow

Prueba Chi-cuadrado

La prueba chi-cuadrado es una prueba estadística que puede utilizarse para determinar qué frecuencias observadas son significativamente diferentes de las frecuencias esperadas o no en una o más categorías(Fuente). En la expresión matemática, es la relación entre los resultados/frecuencias observados experimentalmente (O) y los resultados esperados teóricamente (E) sobre la base de determinadas hipótesis, o se calcula dividiendo la desviación global de las frecuencias observadas y esperadas por las frecuencias esperadas.

Prueba Chi-cuadrado en hojas de cálculo

Si no hay diferencia entre las frecuencias observadas y las esperadas, entonces el valor de chi-cuadrado sería cero. Si existe una diferencia, entonces el valor de chi-cuadrado sería superior a cero.

Al comparar el valor calculado con los valores de la tabla, hay que calcular el grado de libertad. Entonces podrás comparar y sacar una conclusión.

Prueba Chi-cuadrado en hojas de cálculo

Gráfico de distribución de probabilidad chi-cuadrado: Fuente de la imagen:

Existen tres tipos de pruebas chi-cuadrado:

  • Bondad de ajuste
  • Prueba de independencia
  • Prueba de homogeneidad

Terminología

  • Tabla de contingencias: Se trata de una tabla cruzada o de dos direcciones. Se utiliza para mostrar una variable en una fila y otra en una columna con su recuento de frecuencias. Es un tipo de tabla de distribución de frecuencias de las variables categóricas.

  • Frecuencias observadas: Son recuentos realizados a partir de datos experimentales. En otras palabras, se observan los datos que se producen y se toman medidas. (Fuente)

  • Frecuencias previstas: Son recuentos calculados mediante la teoría de la probabilidad. Las frecuencias esperadas se calculan para cada celda de la tabla de contingencia.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Dónde,

  • Eij: Frecuencia esperada para la i-ésima fila y la j-ésima columna
  • Ti: Total de la fila i
  • Tj: Total de la fila j
  • N: Total general

O puede verlo como (total de filas * total de columnas) / total general

  • Hipótesis nula (H0): Afirma que no existe asociación entre las dos variables cruzadas en la población. Por lo tanto, las variables son estadísticamente independientes. Por ejemplo, si se comparan dos métodos A y B por su bondad o por cuál funciona mejor, y si la hipótesis es que ambos métodos son igual de buenos, entonces esta hipótesis se conoce como hipótesis nula.
  • Hipótesis alternativa (HA): Propone que las dos variables estén relacionadas con la población. Si se supone que de dos métodos, el método A es superior al método B o el método B es superior al método A, esta suposición se conoce como Hipótesis Alternativa.

  • Grado de libertad: El número de variables independientes que componen el estadístico se conoce como grado de libertad de dicho estadístico.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Dónde,

  • r=número de filas
  • c=número de columnas

Esto se utilizará en la prueba de independencia y la prueba de homogeneidad, no en la bondad del ajuste.

  • Prueba Chi-cuadrado Estadística: Un estadístico chi-cuadrado es un número único que indica cuánta diferencia existe entre los recuentos observados y los recuentos que cabría esperar si no existiera ninguna relación en la población.
  • Chi-cuadrado p-valor: El valor P de Chi-cuadrado le indicará si los resultados de la prueba son significativos o no.

Tipos de pruebas Chi-cuadrado

  1. Bondad de ajuste: La prueba de bondad de ajuste Chi-cuadrado es una prueba no paramétrica que se utiliza para averiguar en qué medida el valor observado de un fenómeno dado es significativamente diferente del valor esperado. En esta prueba, sólo tiene una variable de una única población(Fuente).

    • Hipótesis nula (H0): En la prueba de bondad de ajuste Chi-cuadrado, la hipótesis nula asume que no existe una diferencia significativa entre el valor observado y el esperado(Fuente).

    • Hipótesis alternativa (Ha): En la prueba de bondad de ajuste Chi-cuadrado, la hipótesis alternativa asume que existe una diferencia significativa entre el valor observado y el esperado(Fuente).

      Por ejemplo, tomemos un ejemplo sencillo: se lanza un dado de 6 caras 120 veces y se obtienen las frecuencias observadas.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Por lo tanto,

  • H0 = Las probabilidades son iguales de obtener todos los números en la misma frecuencia, o los datos son coherentes con la esperada.
            p1 = p2 = p3 = p4 = p5 = p6 = 1/6
    
  • Ha = Al menos una p no es igual a 1/6, o los datos no coinciden con la esperada.

    • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (k-1) grados de libertad. (k =número de categorías) Rechace H0 si χ2calulated > χ2tabulated DOF = k-1
  • Prueba de independencia se utiliza para probar si dos variables categóricas son independientes o no. p. ej., independencia de género frente a opinión.

H0: La variable de fila es independiente de la variable de columna, o no hay relación significativa entre las variables Ha: La relación es significativa.

  • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (r-1)(c-1) grados de libertad. (r = número de filas, c = número de columnas)

    Rechace H0 si χ2calculado > χ2tabulado.

    DOF = (r-1)(c-1)

  1. Prueba de homogeneidad: Siempre que se quiera comprobar si esas frecuencias de poblaciones diferentes se distribuyen de forma idéntica o no. En tales casos, se realiza la prueba de homogeneidad. Veamos un ejemplo para comprenderlo de forma más práctica. En una encuesta, se preguntaba por los ingresos como bajos, medios o altos. En esta encuesta, ambas poblaciones son diversas, como hombres y mujeres. En estos casos, se realiza una prueba chi-cuadrado de homogeneidad para determinar si los ingresos de hombres y mujeres difieren significativamente o no.

H0: El recuento de frecuencias en toda la población es el mismo. Ha: El recuento de frecuencias en la población es diferente.

  • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (r-1)(c-1) grados de libertad. (r = número de filas, c = número de columnas)

    Rechace H0 si χ2calculado > χ2tabulado.

    DOF = (r-1)(c-1)

Ejemplo de la prueba Chi-cuadrado

Supongamos que desea clasificar los defectos de los muebles producidos por una planta de fabricación en función del tipo de defectos y del turno de producción. Se registró un total de 390 muebles defectuosos, y los defectos se clasificaron como uno de los cuatro tipos A, B, C y D. Al mismo tiempo, cada mueble defectuoso se identificó según el turno de producción.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Fuente: Libro de Estadística en Ingeniería

Solución: hay que ver si los tipos de defectos dependen del turno de producción o no. Así que vamos a resolver esto usando Excel.

Resolver el ejemplo utilizando la prueba Chi-cuadrado en hojas de cálculo

Pongamos primero estos datos en la hoja de cálculo

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Definición de la hipótesis nula y de la hipótesis alternativa

Definir las hipótesis nula y alternativa en la sección anterior. El objetivo principal es comprobar si los defectos de los muebles son independientes del turno de producción o no:

  • H0 = El tipo de defecto y el turno de fabricación son independientes
  • Ha = El tipo de defecto y el turno de fabricación son dependientes

Frecuencias esperadas calculadas

  • Antes de calcular las frecuencias esperadas. En primer lugar, calcule la suma por filas de los elementos de cada fila y la suma por columnas de los elementos de cada columna mediante la función SUM(), lo que se conoce como total de filas y total de columnas, respectivamente. Además, calcula el total del total de filas y el total de columnas. El total de filas y columnas será el mismo.
Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo
  • Como sabe, la frecuencia esperada = (total de filas * total de columnas) / total
Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

No olvides hacer absolutas las celdas mientras aplicas la fórmula, para que puedas copiar y pegar la fórmula para todos los valores esperados.

Calcular el valor del estadístico Chi

Antes de calcular el valor del estadístico Chi o el valor p, supongamos primero el nivel de significación. Esto significa a qué nivel de significación desea conocer la respuesta. Supongamos un nivel de significación α = 0,05. Además, el grado de libertad sería = (r-1)(c-1) = (3-1)(4-1) = 6.

Ahora hay dos maneras de calcular el valor estadístico chi-cuadrado uno por la fórmula χ^2= ∑(O-E)^2/E o utilizar la función excel para obtener el valor estadístico chi-cuadrado.

Calculemos primero utilizando la fórmula. Para ello, necesitas calcular ∑(O-E)^2/E usando excel. Para ello, siga los pasos que se indican a continuación.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Puedes obtener todos los valores copiando y pegando esta fórmula en todas las celdas.

Para obtener los valores de χ^2 para tomar la suma de todos los valores, esto nos daría la estadística chi-cuadrado valor calculado.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Basándose en el valor tabulado y calculado, puede concluir que los tipos de defecto y los tiempos de turno son dependientes.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Ahora vamos a calcular utilizando la función de Excel. La función CHISQ.TEST() proporcionará el valor p, que puede compararse directamente con el nivel de significación para concluir los resultados.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Basándose en el valor p, puede concluir que el defecto depende del tiempo del turno de fabricación.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Ventajas e inconvenientes

Pros:

  • Es más fácil de calcular.
  • También puede utilizarse con datos nominales.
  • No asume nada sobre la distribución de los datos.

Contras:

  • El número de observaciones debe ser superior a 20.
  • Los datos deben ser de frecuencia.
  • Supone un muestreo aleatorio. Significa que la muestra debe seleccionarse aleatoriamente.
  • Es sensible a las pequeñas frecuencias, lo que lleva a conclusiones erróneas.
  • También es sensible al tamaño de la muestra.

Conclusión

Enhorabuena, has llegado al final de este tutorial.

En este tutorial, se han cubierto muchos detalles de la prueba Chi-cuadrado. Ha aprendido qué es la prueba Chi-cuadrado, terminología utilizada en la prueba Chi-cuadrado, tipos de pruebas Chi-cuadrado, ejemplos de pruebas Chi-cuadrado y un ejemplo sobre cómo resolver una prueba Chi-cuadrado en hojas de cálculo. Además, has examinado sus pros y sus contras.

Esperamos que ahora pueda utilizar los conceptos de Chi-cuadrado para probar la hipótesis. Gracias por leer este tutorial.

Consulta nuestro tutorial Introducción a las hojas de cálculo.

Si está interesado en aprender más sobre estadística en hojas de cálculo, siga el curso de DataCamp Estadísticas en hojas de cálculo.

Temas

Cursos de hojas de cálculo

Course

Introduction to Google Sheets

2 hr
25.3K
Bring your Google Sheets to life by mastering fundamental skills such as formulas, operations, and cell references.
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

tutorial

Tutorial de pruebas T en R: Aprende a realizar pruebas T

Determina si existe una diferencia significativa entre las medias de los dos grupos utilizando t.test() en R.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Tutorial de tablas de contingencia en R

En este tutorial, aprenderás a crear tablas de contingencia y a probar y cuantificar las relaciones visibles en ellas.
Łukasz Deryło's photo

Łukasz Deryło

10 min

tutorial

Tutorial de cálculo de Power BI

Aprenda a utilizar la función CALCULAR de Power BI con ejemplos de uso.
Joleen Bothma's photo

Joleen Bothma

6 min

tutorial

Las 15 fórmulas básicas de Excel que todo el mundo debe conocer

Aprende a añadir fórmulas aritméticas, de cadena, de series temporales y complejas en Microsoft Excel.
Abid Ali Awan's photo

Abid Ali Awan

15 min

tutorial

Cómo calcular la desviación típica en Excel

Para calcular la desviación típica en Excel, introduce tus datos en un rango de celdas y utiliza =STDEV.S() para datos de muestra o =STDEV.P() para datos de población.
Arunn Thevapalan's photo

Arunn Thevapalan

10 min

tutorial

Tutorial de regresión lineal en R

En este tutorial aprenderás los fundamentos de un modelo estadístico muy popular: la regresión lineal.

Eladio Montero Porras

15 min

See MoreSee More