Prueba Chi-cuadrado de independencia
La estadística es una asignatura con numerosas distribuciones de probabilidad y fórmulas. Históricamente, muchos de los cálculos relacionados con estas fórmulas eran bastante tediosos. Se generaban tablas de valores para algunas de las distribuciones más utilizadas y la mayoría de los libros de texto siguen incluyendo extractos de estas tablas en los apéndices. Aunque es importante comprender el marco conceptual que funciona entre bastidores para una tabla de valores concreta, para obtener resultados rápidos y precisos es necesario utilizar software estadístico.
Existen varios paquetes de software estadístico. Uno que se utiliza habitualmente para los cálculos en la introducción es Microsoft Excel. En Excel se programan muchas distribuciones. Una de ellas es la distribución chi-cuadrado. Hay varias funciones de Excel que utilizan la distribución chi-cuadrado.
Antes de ver lo que Excel puede hacer, recordemos algunos detalles sobre la distribución chi-cuadrado. Se trata de una distribución de probabilidad asimétrica y muy sesgada a la derecha. Los valores de la distribución son siempre no negativos. En realidad, existe un número infinito de distribuciones chi-cuadrado. La que nos interesa en particular viene determinada por el número de grados de libertad que tenemos en nuestra aplicación. Cuanto mayor sea el número de grados de libertad, menos sesgada será nuestra distribución chi-cuadrado.
Prueba chi cuadrado excel
Una prueba Chi Cuadrado evalúa si dos variables son independientes entre sí. Todos hemos hecho encuestas y probablemente nos hemos preguntado qué pasaba. Una prueba de Chi Cuadrado de una tabla de contingencia ayuda a identificar si hay diferencias entre dos o más datos demográficos. Considere el siguiente ejemplo.
Si el valor p es inferior a la significación (por ejemplo, a=0,05), podemos rechazar la hipótesis nula de que los puntos de vista son independientes del género. El género y el punto de vista están relacionados; los hombres y las mujeres tienen puntos de vista diferentes.
Cuándo utilizar la prueba de chi-cuadrado
Parece que estás utilizando Internet Explorer 11 o versiones anteriores. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúas con este navegador, es posible que veas resultados inesperados.
Paso 1. Calcule las frecuencias relativas reales de cada resultado. Comience por crear una tabla que contenga las frecuencias absolutas reales (similar a la Tabla 11) y, a continuación, utilice esas frecuencias para calcular los totales y las frecuencias relativas de los resultados para las distintas categorías.
En la Fig. 2, puede ver que la frecuencia relativa se calculó dividiendo otras dos referencias de celdas en la hoja de cálculo. Esto es preferible a dividir los números en sí mismos, ya que le permite cambiar las frecuencias absolutas reales y Excel recalculará todos los demás valores sin más acción por su parte. Observe el uso de signos de dólar en la referencia de celda para crear una referencia invariable a los recuentos totales, de modo que la fórmula en F5 pudiera copiarse en F6. Esto no ahorra mucho tiempo en una tabla de 2×2, pero podría hacerlo si hubiera más de dos categorías.
Prueba Chi-cuadrado
Utilizaremos el marco de pruebas de hipótesis. Si no está familiarizado con él, consulte el libro Advancing Into Analytics. Se trata de una técnica analítica avanzada que utiliza Excel, R y Python.
Para nuestra demostración, vamos a utilizar un conjunto de datos de vivienda en Excel. Tenemos que obtener los valores reales utilizando la tabla dinámica y luego compararlos con los valores esperados utilizando fórmulas. También comprobaremos el nivel de significación del 95% y si existe una relación entre el aire acondicionado y la zona preferida.