7/28/2019 Chicuadrado 2013 i
1/36
Distribucin
Ji-Cuadrado
7/28/2019 Chicuadrado 2013 i
2/36
Variables cualitativas (y tambin v.a. discretas o
continuas agrupadas en intervalo).
Tres usos de esta distribucin:
-Test de Ajuste de distribuciones:
Es un contraste de significacin para saber si los datos
de una muestra son conformes a una ley de
distribucin terica que sospechamos que es la
correcta.
-Test de homogeneidad de varias muestras cualitativas:
Sirve para contrastar la igualdad de procedencia de un
conjunto de muestras de tipo cualitativo.
-Test para tablas de contingencia:
Es un contraste para determinar la dependencia o
independencia de caracteres cualitativos
7/28/2019 Chicuadrado 2013 i
3/36
una regla ms flexible y que no sacrifica demasiada precisin1. Para ninguna clase ocurre que
2. para casi todos los , salvo a lo sumo
un de ellos.
7/28/2019 Chicuadrado 2013 i
4/36
Figura: Regin crtica (sombreada) para un contraste con el estadstico .
Como slo son los valores grandes de los que nos llevan a
rechazarH0, la regin crtica es:
7/28/2019 Chicuadrado 2013 i
5/36
Puntos importantes:
Solamente toma valorespositivos.
Tiene asimtrica positiva.
A medida que aumentan losgrados de libertad, la curva esmenor elevada y mas extendidaa la derecha.
Los datos se presentan en unatabla de contingencia filas(f) ycolumnas(c).
7/28/2019 Chicuadrado 2013 i
6/36
Ejemplo:
Xi fo
1.5251.5751.55 121.5751.6251.60 29
1.6251.6751.65 30
1.6751.7251.70 21
1.7251.7751.75 9
1.7751.8251.80 8
1.8251.8751.85 2TOTAL 111
Se desea verificar si la distribucin de frecuencias mostrada a
continuacin se aproxima a una distribucin normal.
Los datos se refieren a la estatura en metros de 111 pacientes
del Centro Mdico San Juan en Agosto del 2012
7/28/2019 Chicuadrado 2013 i
7/36
Xi fo
1.5251.575 1.55 12
1.5751.625 1.60 29
1.6251.675 1.65 30
1.6751.725 1.70 21
1.7251.775 1.75 9
1.7751.875 1.83 10
TOTAL 111
S2 =
Media 1.65946
DE 0.0729
Categoras K=6
1.- Planteamiento de hiptesis
H0: fo = fe Las fo provienen de una distribucin Normal
H1: fo fe Las fo no provienen de una distribucin Normal
2.- Nivel de significancia: = 0.01
7/28/2019 Chicuadrado 2013 i
8/36
7/28/2019 Chicuadrado 2013 i
9/36
3.- Regla de decisin
Grados de Libertad = k m 1= 6-2-1= 3
Donde:
k = Nmero de clases
m = Nmero de parmetros estimados
11.34
7/28/2019 Chicuadrado 2013 i
10/36
4.- Estadstico de Prueba
Encontramos los valores esperados:
ESTANDARIZANDO
7/28/2019 Chicuadrado 2013 i
11/36
Xi fo
1.5251.575 1.55 12
1.5751.625 1.60 29
1.6251.675 1.65 30
1.6751.725 1.70 21
1.7251.775 1.75 9
1.7751.875 1.83 10
TOTAL 111
7/28/2019 Chicuadrado 2013 i
12/36
Xi fo < Z
7/28/2019 Chicuadrado 2013 i
13/36
Xi fo < Z
7/28/2019 Chicuadrado 2013 i
14/36
Xi fo < Z
7/28/2019 Chicuadrado 2013 i
15/36
Xi fo < Z
7/28/2019 Chicuadrado 2013 i
16/36
fo fe X2 exp
1.5251.575 12 10.074 0.368
1.5751.625 29 21.634 2.508
1.6251.675 30 29.547 0.007
1.6751.725 21 25.672 0.850
1.7251.775 9 14.188 1.897
1.7751.875 10 6.098 2.497
TOTAL 111 8.128
7/28/2019 Chicuadrado 2013 i
17/36
entonces , luego no se puede rechazar H0 a la
vista de los datos, el que estos provengan de una poblacin normal.
5.- Comparacin del valor experimental con tabular
6.- Decisin
Existe suficiente evidencia estadstica para aceptar que
los datos sobre estatura en metros de los pacientes del
Centro Mdico San Juan en Agosto del 2010 provienen de
una distribucin normal, al 1% de significancia.
= 8,128
= 11.34
7/28/2019 Chicuadrado 2013 i
18/36
La prueba en el contraste deindependencia de variables aleatoriascualitativasSi dos variables cualitativas estn o no asociadas,viendo si son dependientes o no.
Utilizaremos las tablas de Contingencia
Para lo que utilizaremos el estadstico de prueba:
r
i
k
j ij
ijij
E
EO
1 1
2
2
Es as un test no dirigido (test de planteamiento bilateral), que nosindica si existe o no relacin entre dos factores pero no en qu
sentido se produce tal asociacin
7/28/2019 Chicuadrado 2013 i
19/36
1.- Planteamiento de hiptesis
H0: No hay asociacin entre las variables
(El bajo peso del nio y el hecho de fumar durante
la gestacin son INDEPENDIENTES, no estn asociados)
H1: Si existe asociacin entre las variables.
(El bajo peso del nio y el hecho de fumar durante
la gestacin estn asociados)
2.- Nivel de significancia: = 0.05
Tabla 3. Tabla de contingencia para estudiar la asociacin entrefumar durante la gestacin y el bajo peso del nio al nacer.Valores observados y valores esperados (entre parntesis) si losfactores fuesen independientes.
Recin nacido de bajo peso
Gestante S No Total
Fumadora 43 207 250
No fumadora 105 1645 1750
Total 148 1852 2000
7/28/2019 Chicuadrado 2013 i
20/36
1.- Planteamiento de hiptesis
H0: No hay asociacin entre las variables
(El bajo peso del nio y el hecho de fumar durante
la gestacin son INDEPENDIENTES, no estn asociados)
H1: Si existe asociacin entre las variables.
(El bajo peso del nio y el hecho de fumar durante
la gestacin estn asociados)
2.- Nivel de significancia: = 0.05
Tabla 3. Tabla de contingencia para estudiar la asociacin entrefumar durante la gestacin y el bajo peso del nio al nacer.Valores observados y valores esperados (entre parntesis) si losfactores fuesen independientes.
Recin nacido de bajo peso
Gestante S No Total
Fumadora 43 (18.5) 207 (231.5) 250
No fumadora 105 (129.5) 1645 (1620.5) 1750
Total 148 1852 2000
7/28/2019 Chicuadrado 2013 i
21/36
3.- Regla de decisin
Grados de Libertad =(Filas-1)x(Columnas-1)
= (2-1)X(2-1) = 1
3.84
7/28/2019 Chicuadrado 2013 i
22/36
Tabla 3. Tabla de contingencia para estudiar la asociacin entrefumar durante la gestacin y el bajo peso del nio al nacer.Valores observados y valores esperados (entre parntesis) si losfactores fuesen independientes.
Recin nacido de bajo peso
Gestante S No Total
Fumadora 43 (18.5) 207 (231.5) 250
No fumadora 105 (129.5) 1645 (1620.5) 1750
Total 148 1852 2000
4.- Estadstico de Prueba : Frecuencias marginales
7/28/2019 Chicuadrado 2013 i
23/36
n
cabaE
11
n
cadcE
21
n
dbbaE
12
n
dbdcE
22
5,182000
25014811
E
5,2312000
250185212
E
5,1292000
175014821
E
5,16202000
1750185222
E
04,40
5,1620
5,16201645
5,129
5,129105
5,231
5,231207
5,18
5,18432222
2
7/28/2019 Chicuadrado 2013 i
24/36
entonces , luego se puede rechazar la hiptesis
nula.
5.- Comparacin del valor experimental con tabular
6.- Decisin
Existe suficiente evidencia estadstica para rechazar que
el bajo peso del nio y el hecho de fumar durante la
gestacin estn asociados (no son independientes), al 5%
de significancia.
7/28/2019 Chicuadrado 2013 i
25/36
La prctica deportiva disminuye
el riesgo de tener depresin?
7/28/2019 Chicuadrado 2013 i
26/36
7/28/2019 Chicuadrado 2013 i
27/36
La prueba en el contraste dehomogeneidad de variables aleatoriascualitativasDos variables cualitativas para comparar susproporciones.Utilizaremos las tablas deContingencia
Para lo que utilizaremos el estadstico de prueba:
r
i
k
j ij
ijij
E
EO
1 1
2
2 =
7/28/2019 Chicuadrado 2013 i
28/36
Ejemplo
Se desea saber si la distribucin de los grupos sanguneos es
similar en individuos de dos poblaciones.
Qu conclusiones pueden obtenerse de estos datos si se usaun nivel de significacin del 5%
Frec
Observ
A B AB O
Muestra 1 90 80 110 20
Muestra 2 200 180 240 30
1.- Planteamiento de hiptesis
H0: La variable se distribuye igualmente en ambas
poblaciones, son HOMOGENEAS.
H1: La variable no se distribuye en igual en ambas
poblaciones, no son homogeneas.
2.- Nivel de significancia: = 0.05
7/28/2019 Chicuadrado 2013 i
29/36
3.- Regla de decisin
Grados de Libertad = (Filas-1) x (Columnas-1)
= (2-1)(4-1)= 1x3= 3
7.81
7/28/2019 Chicuadrado 2013 i
30/36
7/28/2019 Chicuadrado 2013 i
31/36
4.- Estadstico de Prueba: Frecuencias Marginales
A B AB O TOTAL
M 1 90 91.58 80 110 20 300
M 2 200 180 240 30 650
290 260 350 50 950
7/28/2019 Chicuadrado 2013 i
32/36
4.- Estadstico de Prueba: Frecuencias Marginales
A B AB O TOTAL
M 1 90 91.58 80 82.11 110 110.53 20 15.79 300
M 2 200 198.42 180 177.9 240 239.47 30 34.21 650
290 290.00 260 260.00 350 350.00 50 50.00 950
r
i
k
j ij
ijij
E
EO
1 1
2
2 = 1.76
7/28/2019 Chicuadrado 2013 i
33/36
entonces , luego no se puede rechazar la
hiptesis nula.
5.- Comparacin del valor experimental con tabular
6.- DecisinExiste suficiente evidencia estadstica para no rechazar
que exista una distribucin homognea del grupo sanguneo
en ambas poblaciones.Al 5% de significancia
7/28/2019 Chicuadrado 2013 i
34/36
7/28/2019 Chicuadrado 2013 i
35/36
7/28/2019 Chicuadrado 2013 i
36/36
GRACIAS