Saltar al contenido principal
InicioTutorialesHojas de cálculo

Prueba Chi-cuadrado en hojas de cálculo

En este tutorial, aprenderás a realizar la prueba chi-cuadrado en hojas de cálculo.
may 2024  · 10 min leer

Si está interesado en aprender más sobre estadística en hojas de cálculo, siga el curso de DataCamp Estadísticas en hojas de cálculo.

En 1900, Karl Pearson publicó un artículo sobre la prueba de la χ2, que se considera uno de los fundamentos de la estadística moderna. En este trabajo, Pearson investigó la prueba de bondad de ajuste(Fuente). La prueba Chi-cuadrado es una prueba no paramétrica (una prueba estadística no paramétrica es una prueba cuyo modelo no especifica condiciones sobre el parámetro de la población de la que se extrae la muestra). Se utiliza para identificar la relación entre una variable categórica y se denota por χ2.

La prueba chi-cuadrado se construye a menudo a partir de una suma de errores al cuadrado o a través de la varianza de la muestra. Se trata de una prueba de hipótesis estadística en la que la distribución muestral de los estadísticos de la prueba es un chi-cuadrado cuando la hipótesis nula es verdadera. Surge del supuesto de que los datos son independientes y se distribuyen normalmente.

Empieza a aprender ciencia de datos gratis

Data Analysis in Google Sheets

BeginnerSkill Level
3 hr
12.3K learners
Learn to use Google Sheets to clean, analyze, and draw insights from data. Discover how to sort, filter, and use VLOOKUP to combine data.

Prueba Chi-cuadrado

La prueba chi-cuadrado es una prueba estadística que puede utilizarse para determinar qué frecuencias observadas son significativamente diferentes de las frecuencias esperadas o no en una o más categorías(Fuente). En la expresión matemática, es la relación entre los resultados/frecuencias observados experimentalmente (O) y los resultados esperados teóricamente (E) sobre la base de determinadas hipótesis, o se calcula dividiendo la desviación global de las frecuencias observadas y esperadas por las frecuencias esperadas.

Prueba Chi-cuadrado en hojas de cálculo

Si no hay diferencia entre las frecuencias observadas y las esperadas, entonces el valor de chi-cuadrado sería cero. Si existe una diferencia, entonces el valor de chi-cuadrado sería superior a cero.

Al comparar el valor calculado con los valores de la tabla, hay que calcular el grado de libertad. Entonces podrás comparar y sacar una conclusión.

Prueba Chi-cuadrado en hojas de cálculo

Gráfico de distribución de probabilidad chi-cuadrado: Fuente de la imagen:

Existen tres tipos de pruebas chi-cuadrado:

  • Bondad de ajuste
  • Prueba de independencia
  • Prueba de homogeneidad

Terminología

  • Tabla de contingencias: Se trata de una tabla cruzada o de dos direcciones. Se utiliza para mostrar una variable en una fila y otra en una columna con su recuento de frecuencias. Es un tipo de tabla de distribución de frecuencias de las variables categóricas.

  • Frecuencias observadas: Son recuentos realizados a partir de datos experimentales. En otras palabras, se observan los datos que se producen y se toman medidas. (Fuente)

  • Frecuencias previstas: Son recuentos calculados mediante la teoría de la probabilidad. Las frecuencias esperadas se calculan para cada celda de la tabla de contingencia.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Dónde,

  • Eij: Frecuencia esperada para la i-ésima fila y la j-ésima columna
  • Ti: Total de la fila i
  • Tj: Total de la fila j
  • N: Total general

O puede verlo como (total de filas * total de columnas) / total general

  • Hipótesis nula (H0): Afirma que no existe asociación entre las dos variables cruzadas en la población. Por lo tanto, las variables son estadísticamente independientes. Por ejemplo, si se comparan dos métodos A y B por su bondad o por cuál funciona mejor, y si la hipótesis es que ambos métodos son igual de buenos, entonces esta hipótesis se conoce como hipótesis nula.
  • Hipótesis alternativa (HA): Propone que las dos variables estén relacionadas con la población. Si se supone que de dos métodos, el método A es superior al método B o el método B es superior al método A, esta suposición se conoce como Hipótesis Alternativa.

  • Grado de libertad: El número de variables independientes que componen el estadístico se conoce como grado de libertad de dicho estadístico.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Dónde,

  • r=número de filas
  • c=número de columnas

Esto se utilizará en la prueba de independencia y la prueba de homogeneidad, no en la bondad del ajuste.

  • Prueba Chi-cuadrado Estadística: Un estadístico chi-cuadrado es un número único que indica cuánta diferencia existe entre los recuentos observados y los recuentos que cabría esperar si no existiera ninguna relación en la población.
  • Chi-cuadrado p-valor: El valor P de Chi-cuadrado le indicará si los resultados de la prueba son significativos o no.

Tipos de pruebas Chi-cuadrado

  1. Bondad de ajuste: La prueba de bondad de ajuste Chi-cuadrado es una prueba no paramétrica que se utiliza para averiguar en qué medida el valor observado de un fenómeno dado es significativamente diferente del valor esperado. En esta prueba, sólo tiene una variable de una única población(Fuente).

    • Hipótesis nula (H0): En la prueba de bondad de ajuste Chi-cuadrado, la hipótesis nula asume que no existe una diferencia significativa entre el valor observado y el esperado(Fuente).

    • Hipótesis alternativa (Ha): En la prueba de bondad de ajuste Chi-cuadrado, la hipótesis alternativa asume que existe una diferencia significativa entre el valor observado y el esperado(Fuente).

      Por ejemplo, tomemos un ejemplo sencillo: se lanza un dado de 6 caras 120 veces y se obtienen las frecuencias observadas.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Por lo tanto,

  • H0 = Las probabilidades son iguales de obtener todos los números en la misma frecuencia, o los datos son coherentes con la esperada.
            p1 = p2 = p3 = p4 = p5 = p6 = 1/6
    
  • Ha = Al menos una p no es igual a 1/6, o los datos no coinciden con la esperada.

    • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (k-1) grados de libertad. (k =número de categorías) Rechace H0 si χ2calulated > χ2tabulated DOF = k-1
  • Prueba de independencia se utiliza para probar si dos variables categóricas son independientes o no. p. ej., independencia de género frente a opinión.

H0: La variable de fila es independiente de la variable de columna, o no hay relación significativa entre las variables Ha: La relación es significativa.

  • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (r-1)(c-1) grados de libertad. (r = número de filas, c = número de columnas)

    Rechace H0 si χ2calculado > χ2tabulado.

    DOF = (r-1)(c-1)

  1. Prueba de homogeneidad: Siempre que se quiera comprobar si esas frecuencias de poblaciones diferentes se distribuyen de forma idéntica o no. En tales casos, se realiza la prueba de homogeneidad. Veamos un ejemplo para comprenderlo de forma más práctica. En una encuesta, se preguntaba por los ingresos como bajos, medios o altos. En esta encuesta, ambas poblaciones son diversas, como hombres y mujeres. En estos casos, se realiza una prueba chi-cuadrado de homogeneidad para determinar si los ingresos de hombres y mujeres difieren significativamente o no.

H0: El recuento de frecuencias en toda la población es el mismo. Ha: El recuento de frecuencias en la población es diferente.

  • Criterios y regla de decisión: La región de rechazo es siempre de cola derecha utilizando la distribución χ2 con (r-1)(c-1) grados de libertad. (r = número de filas, c = número de columnas)

    Rechace H0 si χ2calculado > χ2tabulado.

    DOF = (r-1)(c-1)

Ejemplo de la prueba Chi-cuadrado

Supongamos que desea clasificar los defectos de los muebles producidos por una planta de fabricación en función del tipo de defectos y del turno de producción. Se registró un total de 390 muebles defectuosos, y los defectos se clasificaron como uno de los cuatro tipos A, B, C y D. Al mismo tiempo, cada mueble defectuoso se identificó según el turno de producción.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Fuente: Libro de Estadística en Ingeniería

Solución: hay que ver si los tipos de defectos dependen del turno de producción o no. Así que vamos a resolver esto usando Excel.

Resolver el ejemplo utilizando la prueba Chi-cuadrado en hojas de cálculo

Pongamos primero estos datos en la hoja de cálculo

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Definición de la hipótesis nula y de la hipótesis alternativa

Definir las hipótesis nula y alternativa en la sección anterior. El objetivo principal es comprobar si los defectos de los muebles son independientes del turno de producción o no:

  • H0 = El tipo de defecto y el turno de fabricación son independientes
  • Ha = El tipo de defecto y el turno de fabricación son dependientes

Frecuencias esperadas calculadas

  • Antes de calcular las frecuencias esperadas. En primer lugar, calcule la suma por filas de los elementos de cada fila y la suma por columnas de los elementos de cada columna mediante la función SUM(), lo que se conoce como total de filas y total de columnas, respectivamente. Además, calcula el total del total de filas y el total de columnas. El total de filas y columnas será el mismo.
Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo
  • Como sabe, la frecuencia esperada = (total de filas * total de columnas) / total
Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

No olvides hacer absolutas las celdas mientras aplicas la fórmula, para que puedas copiar y pegar la fórmula para todos los valores esperados.

Calcular el valor del estadístico Chi

Antes de calcular el valor del estadístico Chi o el valor p, supongamos primero el nivel de significación. Esto significa a qué nivel de significación desea conocer la respuesta. Supongamos un nivel de significación α = 0,05. Además, el grado de libertad sería = (r-1)(c-1) = (3-1)(4-1) = 6.

Ahora hay dos maneras de calcular el valor estadístico chi-cuadrado uno por la fórmula χ^2= ∑(O-E)^2/E o utilizar la función excel para obtener el valor estadístico chi-cuadrado.

Calculemos primero utilizando la fórmula. Para ello, necesitas calcular ∑(O-E)^2/E usando excel. Para ello, siga los pasos que se indican a continuación.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Puedes obtener todos los valores copiando y pegando esta fórmula en todas las celdas.

Para obtener los valores de χ^2 para tomar la suma de todos los valores, esto nos daría la estadística chi-cuadrado valor calculado.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Basándose en el valor tabulado y calculado, puede concluir que los tipos de defecto y los tiempos de turno son dependientes.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Ahora vamos a calcular utilizando la función de Excel. La función CHISQ.TEST() proporcionará el valor p, que puede compararse directamente con el nivel de significación para concluir los resultados.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Basándose en el valor p, puede concluir que el defecto depende del tiempo del turno de fabricación.

Tutorial sobre la prueba de la ji al cuadrado en hojas de cálculo

Ventajas e inconvenientes

Pros:

  • Es más fácil de calcular.
  • También puede utilizarse con datos nominales.
  • No asume nada sobre la distribución de los datos.

Contras:

  • El número de observaciones debe ser superior a 20.
  • Los datos deben ser de frecuencia.
  • Supone un muestreo aleatorio. Significa que la muestra debe seleccionarse aleatoriamente.
  • Es sensible a las pequeñas frecuencias, lo que lleva a conclusiones erróneas.
  • También es sensible al tamaño de la muestra.

Conclusión

Enhorabuena, has llegado al final de este tutorial.

En este tutorial, se han cubierto muchos detalles de la prueba Chi-cuadrado. Ha aprendido qué es la prueba Chi-cuadrado, terminología utilizada en la prueba Chi-cuadrado, tipos de pruebas Chi-cuadrado, ejemplos de pruebas Chi-cuadrado y un ejemplo sobre cómo resolver una prueba Chi-cuadrado en hojas de cálculo. Además, has examinado sus pros y sus contras.

Esperamos que ahora pueda utilizar los conceptos de Chi-cuadrado para probar la hipótesis. Gracias por leer este tutorial.

Consulta nuestro tutorial Introducción a las hojas de cálculo.

Si está interesado en aprender más sobre estadística en hojas de cálculo, siga el curso de DataCamp Estadísticas en hojas de cálculo.

Temas

Cursos de hojas de cálculo

Course

Introduction to Google Sheets

2 hr
20.6K
Bring your Google Sheets to life by mastering fundamental skills such as formulas, operations, and cell references.
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

blog

Cómo obtener una certificación Microsoft Excel en 2024: Los mejores consejos y recursos

Descubre instrucciones paso a paso, información sobre el examen y consejos de expertos para conseguir la certificación Excel.
Matt Crabtree's photo

Matt Crabtree

12 min

blog

¿Qué es shell?

Descubre qué es shell y cómo aprenderlo puede convertirte en un científico de datos más eficiente y versátil.

Wendy Gittleson

13 min

blog

Las 25 mejores preguntas para entrevistas sobre Excel para todos los niveles

Una guía de las preguntas más habituales en las entrevistas de Excel para que los usuarios principiantes, intermedios y avanzados superen la entrevista técnica.
Chloe Lubin's photo

Chloe Lubin

17 min

tutorial

Tutorial de Chroma DB: guía paso a paso

Con Chroma DB, puedes gestionar fácilmente documentos de texto, convertir texto en incrustaciones y hacer búsquedas por similitud.
Abid Ali Awan's photo

Abid Ali Awan

10 min

tutorial

Programación funcional frente a programación orientada a objetos en el análisis de datos

Explore dos de los paradigmas de programación más utilizados en la ciencia de datos: la programación orientada a objetos y la programación funcional.
Amberle McKee's photo

Amberle McKee

15 min

tutorial

Tutorial de introducción a JupyterLab

En este artículo, le presentaremos JupyterLab, uno de los IDE más populares para la ciencia de datos.
Javier Canales Luna's photo

Javier Canales Luna

7 min

See MoreSee More