Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 1
Tema 4: Introducción a la Estadística No Paramétrica
4.1 Introducción
Gran parte de los procedimientos de contrastes de hipótesis se encuentran basados en el
supuesto de que las muestras aleatorias son seleccionadas de poblaciones normales. La
mayor parte de estas pruebas son confiables, aún cuando se experimentan ligeras
desviaciones de la normalidad, particularmente cuando el tamaño de muestra es grande.
Tradicionalmente, estos procedimientos son llamados métodos paramétricos; mientras
que los procedimientos a desarrollar en el tema, son considerados procedimientos
alternativos de prueba denominados métodos no paramétricos o de distribución libre, los
cuales, frecuentemente suponen un desconocimiento acerca de las correspondientes
distribuciones poblacionales.
Las pruebas no paramétricas poseen ciertas ventajas; en primer lugar los cálculos
involucrados son por lo general rápidos de efectuar. Segundo, los datos no necesitan ser
mediciones cuantitativas y quizá la más importante, es que se encuentran sujetas a menos
suposiciones restrictivas que las paramétricas. A su vez, se debe señalar que hay una serie
de desventajas asociadas a las primeras referidas. Como no utilizan toda la información
proporcionada por la muestra, una prueba no paramétrica será menos eficiente que el
procedimiento paramétrico correspondiente cuando ambos métodos sean aplicables. En
consecuencia, una prueba no paramétrica requerirá un tamaño de muestra más grande que
el de la prueba paramétrica correspondiente, para lograr la misma probabilidad de cometer
un error tipo II.
En concordancia con las últimas ideas proporcionadas en el parágrafo anterior, si tanto una
prueba paramétrica como una prueba no paramétrica son aplicables al mismo conjunto de
datos, se debe evitar quizá aplicar la no paramétrica y efectuar la del tipo paramétrico más
eficiente. Sin embargo, reconociendo el hecho de que las suposiciones de normalidad no
pueden ser a menudo justificadas, y que a su vez, no siempre se tienen mediciones
cuantitativas, las pruebas del tipo no paramétrico representan una opción fundamental para
el análisis de diversos casos de estudio en diversas ciencias.
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 2
4.2. Prueba de la bondad del ajuste
Similarmente como pueden realizarse contrastes de hipótesis estadísticos acerca de los
parámetros sencillos de una población tales como 2,σµ , P, o 2
2
2
1
σ
σ entre otros, es posible
considerar una prueba para determinar si una población sigue una distribución estadística
específica: la prueba de bondad de ajuste.
El contraste se encuentra basado en qué tan bueno es un ajuste entre la frecuencia de
ocurrencia de observaciones en una muestra observada y las frecuencias esperadas
obtenidas de la distribución hipotética. Para la realización del contraste, se parte de la
hipótesis de que los datos muestrales tomadas de una población específica siguen una
distribución hipotética. El estadístico apropiado para llevar a cabo una prueba del tipo es el
siguiente:
i
k
i
ii
cE
EO∑=
−
=1
2
2
)(
χ ~ )1(2
−−= mkvχ (4.1)
en donde, iO y iE representan las frecuencias observada y esperada para la −i ésima
clase, respectivamente; mientras que k representa el número total de clases (∑=
=
k
i
i nO1
) y m
el número de parámetros a estimar de la distribución teórica hipotética. Las frecuencias
esperadas se calculan a través de la expresión npE ii ×= ; donde ip representa la
probabilidad de ocurrencia de la −i ésima clase. El contraste siempre debe realizarse por la
derecha, por lo que se rechaza la 0H si y solo si 2
cχ > 2
;αχ v . Un aspecto importante a tomar
en cuenta es que todas las frecuencias esperadas deben ser al menos iguales a 5; así esta
restricción puede requerir la combinación de clases adyacentes, dando como resultado
una reducción del número de grados de libertad.
Ejemplo 4.1. Supóngase que se tienen datos referentes al contenido de nicotina medido en
miligramos observado para una muestra de 40 cigarrillos, medido en miligramos. Los datos
han sido se presentan a continuación:
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 3
Tabla 4.1. Distribución de frecuencias para la cantidad de nicotina (mg.)
observada en los cigarrillos:
Límites de clase Frecuencias observadas )( iO
1,45-1,95
1,95-2,45
2,45-2,95
2,95-3,45
3,45-3,95
3,95-4,45
4,45-4,95
2
1
4
15
10
5
3
¿Existen razones para pensar que los datos siguen una distribución normal con media
5,3=µ y desviación estándar 7,0=σ ? Use .05,0=α
1. Formulación de las hipótesis:
:0H El contenido de nicotina observado en los cigarrillos sigue una distribución normal,
:1H El contenido de nicotina observado en los cigarrillos no sigue una distribución
normal.
2. Fijación del nivel de significación: .05,0=α
3. Establecimiento del estadístico de contraste: i
k
i
ii
cE
EO∑=
−
=1
2
2
)(
χ ~ )1(2
−−= mkvχ .
4. Cálculo del estadístico de prueba: para la obtención del 2
cχ , en primer lugar se obtiene la
probabilidad ip correspondiente a cada una de las clases de la distribución
correspondiente. En el caso de la cuarta clase se tiene:
95,2(P < )45,3<X = )07,079,0(7,0
5,345,3
7,0
5,3
7,0
5,395,2−<<−=
−<
−<
−ZP
XP
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 4
=0,4721-0,2148=0,2573.
Por lo que la frecuencia esperada para la cuarta clase es:
.3,10)2573,0)(40(44 ==×= pnE
Tabla 4.2. Frecuencias observadas y esperadas para la cantidad de nicotina (mg.)
de los cigarrillos suponiendo normalidad
Límites de clase Frecuencias
observadas )( iO
Frecuencias
esperadas )( iE
1,45-1,95
1,95-2,45
2,45-2,95
2,95-3,45
3,45-3,95
3,95-4,45
4,45-4,95
2
1 7
4
15
10
5 8
3
0,5
2,1 8,5
5,9
10,3
10,7
7,0 10,5
3,5
En consecuencia, el valor del estadístico de contraste viene dado por:
.05,35,10
)5,108(
7,10
)7,1010(
3,10
)3,1015(
5,8
)5,87( 22222
=−
+−
+−
+−
=cχ
5. Decisión y conclusión: Dado que se cumple 3,05 < 2
05,0;104 −−χ (3,05 < 7,815) no se rechaza
la hipótesis nula y por ende, con un nivel de confianza del 95% se concluye que la
distribución normal con 5,3=µ 7,0=σ proporciona un buen ajuste para la distribución de
la cantidad de nicotina en miligramos contenido en los cigarrillos.
4.3. Prueba de independencia
Dada una tabla de contingencia, donde se tienen r categorías de una variable y c de otra;
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 5
seleccionando un conjunto de observaciones considerando un tamaño muestral n. La
distribución 2χ puede ser utilizada para probar la hipótesis de independencia estadística de
dos variables o características. Para el entendimiento del contraste, es importante introducir
los siguientes términos:
:ijO frecuencia observada correspondiente a la i-ésima categoría de la primera variable y a
la j-ésima categoría de la segunda
∑ = nOij (4.2)
:.iO frecuencia marginal observada correspondiente a la i-ésima categoría de la primera
variable
∑=
=
k
j
iji OO1
. (4.3)
:. jO frecuencia marginal observada correspondiente a la j-ésima categoría de la primera
variable
∑=
=
r
i
ijj OO1
. (4.4)
El estadístico de prueba es:
∑∑= =
−=
r
i
c
j ij
ijij
cE
EO
1 1
2
2)(
χ ~ 2
);1)(1( αχ
−−= crv (4.5)
con n
OOE
ji
ij
.. ×= .
Ejemplo 4.2. Supóngase que una fábrica quiere determinar si existe una relación entre la
antigüedad de los trabajadores y las máquinas utilizadas en la obtención de un determinado
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 6
producto. Para ello, se observa el proceso en un período determinado obteniendo los
siguientes resultados:
Tabla 4.3. Frecuencias observadas por combinaciones de categorías
Tipo de máquina Antigüedad
laboral A B C
Total
Empleados
nuevos
182
213
203
598
Empleados
antiguos
154
138
110
402
Total 336 351 313 1000
¿Existen razones para pensar que la antigüedad de los empleados es independiente del tipo
de máquina? Use .05,0=α
1. Planteamiento de hipótesis:
:0H las variables objeto de estudio son independientes,
:1H la antigüedad del trabajadador no es independiente del tipo de máquina.
2. Nivel de significación: .05,0=α
3. Fijación del estadístico de contraste: ∑∑= =
−=
r
i
c
j ij
ijij
cE
EO
1 1
2
2)(
χ ~ 2
);1)(1( αχ
−−= crv .
4. Cálculo de de la región crítica o de rechazo: 991,52
05,0;2
2
05,0);13)(12( ==−−=
χχ v .
5. Cálculo del estadístico de contraste: en primer lugar, deben hallarse las frecuencias
esperadas ijE . Para hallar la primera frecuencia de la tabla 4.3 se tiene:
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 7
9,2001000
)336)(598(1..1
11 ==×
=n
OOE
los resultados obtenidos se muestran en la tabla, con las frecuencias esperadas en ( ):
Tabla 4.4. Frecuencias observadas y esperadas por combinaciones de categorías
Tipo de máquina Antigüedad
laboral A B C
Total
Empleados
nuevos
182 (200,9)
213 (209,9)
203 (187,2)
598
Empleados
antiguos
154 (135,1)
138 (141,1)
110 (125,8)
402
Total 336 351 313 1000
Por lo que se obtiene el siguiente resultado:
.85,78,125
)8,125110(
1,141
)1,141138(
1,141
)1,141138(
1,135
)1,135154(
2,187
)2,187203(
9,209
)9,209213(
9,200
)9,200182(
22
222222
=−
+−
+
−+
−+
−+
−+
−=cχ
6. Decisión y conclusión: Como se cumple que 22
tc χχ > (7,85 > 5,991) se rechaza la
hipótesis nula. Con un nivel de significación del 5% hay evidencias estadísticas suficientes
para pensar que las variables antigüedad laboral de los trabajadores y tipo de máquinas
utilizadas no son independientes.
4.4. Prueba de rangos de Wilcoxon-Mann-Whitney
Es la alternativa no paramétrica de la prueba t de dos muestras. En este sentido, los distintos
procedimientos de prueba se muestran en la siguiente tabla:
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 8
Tabla 5.5. Prueba de la suma de rangos
Hipótesis nula Alternativas posibles Calcular Decisión
u1
u2
21 µµ =
21 µµ <
21 µµ >
21 µµ ≠ u
Re. 0H si ...1 dcvu ≤
Re. 0H si ...2 dcvu ≤
Re. 0H si ... dcvu ≤
En primer lugar, se selecciona una muestra aleatoria de cada una de las poblaciones; donde
1n representa el número de observaciones para la muestra más pequeña, y 2n el número de
observaciones de la muestra más grande. Cuando las muestras son del mismo tamaño, 1n y
2n pueden ser asignadas en forma aleatoria.
Posteriormente, se ordenan las observaciones combinadas en forma creciente y se
sustituyen por valores 1,2,3… En caso de empates, se reemplazan las observaciones por la
media de los valores; la suma de los valores correspondientes a las observaciones 1n en la
muestra más pequeña se denota por 1w . Por otra parte:
12121
22
)1)((w
nnnnw −
−++= , (4,6)
así se puede obtener:
2
)1( 1111
+−=
nnwu (4.7)
2
)1( 2222
+−=
nnwu (4.8)
),min( 21 uuu = . (4.9)
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 9
La aproximación a la distribución normal cuando 1n y 2n son lo suficientemente grandes,
viene dada por la expresión:
,)(
u
uuZ
σ
µ−= (4.10)
con 2
21nnu =µ y
12
)1( 2121 −+=
nnnnuσ .
Ejemplo 4.3. El contenido de nicotina de dos marcas de cigarrillos, medido en miligramos
es el siguiente:
Marca A 2,1 4,0 6,3 5,4 4,8 3,7 6,1 3,3
Marca B 4,1 0,6 3,1 2,5 4,0 6,2 1,6 2,2 1,9 5,4
Pruebe la hipótesis, con un nivel de significación de 0,05, de que los contenidos promedio
de nicotina de las dos marcas son iguales, contra la alternativa de que no son iguales.
1. 210 : µµ =H ,
211 : µµ =H .
2. 05,0=α
3. Región crítica: v.c.d. = v(n1=8, n2=10; 05,0=α bilateral) = 17
4. Las observaciones deben ordenarse en forma creciente y asignárseles valores del 1 al 18:
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 10
Tabla 5.6. Asignación de valores
Datos originales Valores
0,6
1,6
1,9
2,1
2,2
2,5
3,1
3,3
3,7
4,0
4,0
4,1
4,8
5,4
5,4
6,1
6,2
6,3
1
2
3
4
5
6
7
8
9
10,5
10,5
12
13
14,5
14,5
16
17
18
Los valores de las observaciones que pertenecen a la marca A, aparecen remarcadas, así:
93185,14135,109841 =++++++=w
y
78932
)19)(18(2 =−
=w .
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 11
Posteriormente:
572
)9)(8(931 =
−=u
232
)11)(10(782 =
−=u
así pues, .23)23,57min( ==u
5. Decisión y conclusión: Como 23 > 17 no se rechaza la hipótesis nula. Con un nivel de
significación del 5% se puede concluir que no existen diferencias significativas en cuanto a
los contenidos promedio de nicotina en las dos marcas de cigarrillos.
4.5. Prueba de rachas
La prueba de rachas o corridas, basada en el orden en el cual se obtienen las observaciones
muestrales, es una técnica útil para probar la hipótesis nula 0H de que las observaciones
han sido, en efecto, obtenidas en forma aleatoria. Sin importar que las mediciones
muestrales representen datos cualitativos o cuantitativos, la prueba de rachas divide los
datos en dos categorías mutuamente excluyentes: defectuoso o no defectuoso, arriba o
abajo de la mediana; etc.
La prueba de corridas o rachas para la aleatoriedad, está basada en la variable aleatoria V, el
número total de corridas que ocurren en la sucesión completa del experimento. Las tablas
proporcionan valores de ∗≤ vVP( cuando 0H es verdadera) para ∗
v =2,3,…,20 corridas y
valores de 2,3…,20 corridas y valores de 1n y 2n menores o iguales que 10. Los valores P
para ambas pruebas, unilateral o bilateral pueden obtenerse utilizando estos valores
tabulados. La hipótesis nula será rechazada si y solo si α >P.
A modo de ejemplo, supóngase que se efectúa una encuesta a 12 personas para averiguar si
utilizan un cierto producto. Se podría cuestionar de manera estricta el supuesto de
aleatoriedad de la muestra si las doce personas fueran del mismo sexo. Si se designan los
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 12
hombres y mujeres con las letras M y F respectivamente, una sucesión típica del
experimento pudiese ser:
M M F F F M F F M M M M
En la encuesta se observan un total de cinco F y siete M. Entonces con 51 =n y 72 =n , se
tiene que 5),min( 21 == nnv , así el valor P para una prueba bilateral es:
5(2 ≤= VPP cuando 0H es verdadera) = 2(0,197) = 0,394.
Realizando la prueba con un nivel de confianza del 95%; se tiene que 0,394 > 0,05; por lo
que no hay evidencias suficientes para rechazar la hipótesis de aleatoriedad de la muestra.
La prueba de corridas también puede utilizarse para detectar desviaciones en la aleatoriedad
de una sucesión de mediciones cuantitativas a través del tiempo, causadas por tendencias o
periodicidades. Reemplazando cada medición por un símbolo más en el orden en el cual
son obtenidas si caen arriba de la mediana, y por un símbolo menos si caen debajo de la
mediana y omitiendo todas las mediciones que son exactamente iguales a la mediana, se
genera una sucesión de símbolos más y menos que son probados para indagar la
aleatoriedad, como se muestra en el ejemplo siguiente.
Ejemplo 4.4. Se ajusta una máquina para que introduzca tíner de pintura acrílica en un
envase. ¿Se diría que la cantidad de tíner introducida por esta máquina varía de manera
aleatoria si se mide el contenido de los 15 envases siguientes y se encuentra que son 3,6;
3,9; 4,1; 3,6; 3,8; 3,7; 3,4; 4,0; 3,8; 4,1; 3,9; 4,0; 3,8; 4,2; y 4,1 lts.? Utilizar un nivel de
significación de 0,1.
1. :0H La sucesión es aleatoria,
:1H La sucesión no es aleatoria.
2. 1,0=α .
3. Estadístico de prueba: V, el número total de corridas.
Pedro Harmath Introducción a la Estadística No Paramétrica
Estadística II 13
4. Cálculos: Para el ejemplo, dado que 9,3=Md . Reemplazando cada medición por el
símbolo “+” si cae por encima de 3,9 y por “-” si cae por debajo de 3,9. Omitiendo las dos
mediciones iguales a 3,9, se obtiene la sucesión
- + - - - - + + + + - + +
para la cual 61 =n y 72 =n , por lo que v = 6. Entonces:
6(2 ≤= VPP cuando 0H es verdadera) = 0,596.
5. Decisión y conclusión: Como P = 0,596 > 1,0=α no se rechaza la 0H . Con un nivel de
confianza del 90% no hay razones para pensar que las mediciones poseen un patrón no
aleatorio.
Cuando 1n y 2n aumentan su tamaño, la distribución muestral de V se aproxima a la
distribución normal con media:
12
21
21+
+=
nn
nnVµ (4.11)
y varianza
)1()(
)2(2
21
2
21
2121212
−++
−−=
nnnn
nnnnnnVσ (4.12)
por lo que pudiese utilizarse el estadístico V
VZZ
σµ )( −
= para establecer la región
crítica de la prueba de corridas.
Top Related