Download - Introduccion a La Estadistica No Parametrica

Pedro Harmath Introducción a la Estadística No Paramétrica

Estadística II 1

Tema 4: Introducción a la Estadística No Paramétrica

4.1 Introducción

Gran parte de los procedimientos de contrastes de hipótesis se encuentran basados en el

supuesto de que las muestras aleatorias son seleccionadas de poblaciones normales. La

mayor parte de estas pruebas son confiables, aún cuando se experimentan ligeras

desviaciones de la normalidad, particularmente cuando el tamaño de muestra es grande.

Tradicionalmente, estos procedimientos son llamados métodos paramétricos; mientras

que los procedimientos a desarrollar en el tema, son considerados procedimientos

alternativos de prueba denominados métodos no paramétricos o de distribución libre, los

cuales, frecuentemente suponen un desconocimiento acerca de las correspondientes

distribuciones poblacionales.

Las pruebas no paramétricas poseen ciertas ventajas; en primer lugar los cálculos

involucrados son por lo general rápidos de efectuar. Segundo, los datos no necesitan ser

mediciones cuantitativas y quizá la más importante, es que se encuentran sujetas a menos

suposiciones restrictivas que las paramétricas. A su vez, se debe señalar que hay una serie

de desventajas asociadas a las primeras referidas. Como no utilizan toda la información

proporcionada por la muestra, una prueba no paramétrica será menos eficiente que el

procedimiento paramétrico correspondiente cuando ambos métodos sean aplicables. En

consecuencia, una prueba no paramétrica requerirá un tamaño de muestra más grande que

el de la prueba paramétrica correspondiente, para lograr la misma probabilidad de cometer

un error tipo II.

En concordancia con las últimas ideas proporcionadas en el parágrafo anterior, si tanto una

prueba paramétrica como una prueba no paramétrica son aplicables al mismo conjunto de

datos, se debe evitar quizá aplicar la no paramétrica y efectuar la del tipo paramétrico más

eficiente. Sin embargo, reconociendo el hecho de que las suposiciones de normalidad no

pueden ser a menudo justificadas, y que a su vez, no siempre se tienen mediciones

cuantitativas, las pruebas del tipo no paramétrico representan una opción fundamental para

el análisis de diversos casos de estudio en diversas ciencias.


Estadística II 2

4.2. Prueba de la bondad del ajuste

Similarmente como pueden realizarse contrastes de hipótesis estadísticos acerca de los

parámetros sencillos de una población tales como 2,σµ , P, o 2

2

2

1

σ

σ entre otros, es posible

considerar una prueba para determinar si una población sigue una distribución estadística

específica: la prueba de bondad de ajuste.

El contraste se encuentra basado en qué tan bueno es un ajuste entre la frecuencia de

ocurrencia de observaciones en una muestra observada y las frecuencias esperadas

obtenidas de la distribución hipotética. Para la realización del contraste, se parte de la

hipótesis de que los datos muestrales tomadas de una población específica siguen una

distribución hipotética. El estadístico apropiado para llevar a cabo una prueba del tipo es el

siguiente:

i

k

i

ii

cE

EO∑=

−

=1

2

2

)(

χ ~ )1(2

−−= mkvχ (4.1)

en donde, iO y iE representan las frecuencias observada y esperada para la −i ésima

clase, respectivamente; mientras que k representa el número total de clases (∑=

=

k

i

i nO1

) y m

el número de parámetros a estimar de la distribución teórica hipotética. Las frecuencias

esperadas se calculan a través de la expresión npE ii ×= ; donde ip representa la

probabilidad de ocurrencia de la −i ésima clase. El contraste siempre debe realizarse por la

derecha, por lo que se rechaza la 0H si y solo si 2

cχ > 2

;αχ v . Un aspecto importante a tomar

en cuenta es que todas las frecuencias esperadas deben ser al menos iguales a 5; así esta

restricción puede requerir la combinación de clases adyacentes, dando como resultado

una reducción del número de grados de libertad.

Ejemplo 4.1. Supóngase que se tienen datos referentes al contenido de nicotina medido en

miligramos observado para una muestra de 40 cigarrillos, medido en miligramos. Los datos

han sido se presentan a continuación:


Estadística II 3

Tabla 4.1. Distribución de frecuencias para la cantidad de nicotina (mg.)

observada en los cigarrillos:

Límites de clase Frecuencias observadas )( iO

1,45-1,95

1,95-2,45

2,45-2,95

2,95-3,45

3,45-3,95

3,95-4,45

4,45-4,95

2

1

4

15

10

5

3

¿Existen razones para pensar que los datos siguen una distribución normal con media

5,3=µ y desviación estándar 7,0=σ ? Use .05,0=α

1. Formulación de las hipótesis:

:0H El contenido de nicotina observado en los cigarrillos sigue una distribución normal,

:1H El contenido de nicotina observado en los cigarrillos no sigue una distribución

normal.

2. Fijación del nivel de significación: .05,0=α

3. Establecimiento del estadístico de contraste: i

k

i

ii

cE

EO∑=

−

=1

2

2

)(

χ ~ )1(2

−−= mkvχ .

4. Cálculo del estadístico de prueba: para la obtención del 2

cχ , en primer lugar se obtiene la

probabilidad ip correspondiente a cada una de las clases de la distribución

correspondiente. En el caso de la cuarta clase se tiene:

95,2(P < )45,3<X = )07,079,0(7,0

5,345,3

7,0

5,3

7,0

5,395,2−<<−=

−<

−<

−ZP

XP


Estadística II 4

=0,4721-0,2148=0,2573.

Por lo que la frecuencia esperada para la cuarta clase es:

.3,10)2573,0)(40(44 ==×= pnE

Tabla 4.2. Frecuencias observadas y esperadas para la cantidad de nicotina (mg.)

de los cigarrillos suponiendo normalidad

Límites de clase Frecuencias

observadas )( iO

Frecuencias

esperadas )( iE

1,45-1,95

1,95-2,45

2,45-2,95

2,95-3,45

3,45-3,95

3,95-4,45

4,45-4,95

2

1 7

4

15

10

5 8

3

0,5

2,1 8,5

5,9

10,3

10,7

7,0 10,5

3,5

En consecuencia, el valor del estadístico de contraste viene dado por:

.05,35,10

)5,108(

7,10

)7,1010(

3,10

)3,1015(

5,8

)5,87( 22222

=−

+−

+−

+−

=cχ

5. Decisión y conclusión: Dado que se cumple 3,05 < 2

05,0;104 −−χ (3,05 < 7,815) no se rechaza

la hipótesis nula y por ende, con un nivel de confianza del 95% se concluye que la

distribución normal con 5,3=µ 7,0=σ proporciona un buen ajuste para la distribución de

la cantidad de nicotina en miligramos contenido en los cigarrillos.

4.3. Prueba de independencia

Dada una tabla de contingencia, donde se tienen r categorías de una variable y c de otra;


Estadística II 5

seleccionando un conjunto de observaciones considerando un tamaño muestral n. La

distribución 2χ puede ser utilizada para probar la hipótesis de independencia estadística de

dos variables o características. Para el entendimiento del contraste, es importante introducir

los siguientes términos:

:ijO frecuencia observada correspondiente a la i-ésima categoría de la primera variable y a

la j-ésima categoría de la segunda

∑ = nOij (4.2)

:.iO frecuencia marginal observada correspondiente a la i-ésima categoría de la primera

variable

∑=

=

k

j

iji OO1

. (4.3)

:. jO frecuencia marginal observada correspondiente a la j-ésima categoría de la primera

variable

∑=

=

r

i

ijj OO1

. (4.4)

El estadístico de prueba es:

∑∑= =

−=

r

i

c

j ij

ijij

cE

EO

1 1

2

2)(

χ ~ 2

);1)(1( αχ

−−= crv (4.5)

con n

OOE

ji

ij

.. ×= .

Ejemplo 4.2. Supóngase que una fábrica quiere determinar si existe una relación entre la

antigüedad de los trabajadores y las máquinas utilizadas en la obtención de un determinado


Estadística II 6

producto. Para ello, se observa el proceso en un período determinado obteniendo los

siguientes resultados:

Tabla 4.3. Frecuencias observadas por combinaciones de categorías

Tipo de máquina Antigüedad

laboral A B C

Total

Empleados

nuevos

182

213

203

598

Empleados

antiguos

154

138

110

402

Total 336 351 313 1000

¿Existen razones para pensar que la antigüedad de los empleados es independiente del tipo

de máquina? Use .05,0=α

1. Planteamiento de hipótesis:

:0H las variables objeto de estudio son independientes,

:1H la antigüedad del trabajadador no es independiente del tipo de máquina.

2. Nivel de significación: .05,0=α

3. Fijación del estadístico de contraste: ∑∑= =

−=

r

i

c

j ij

ijij

cE

EO

1 1

2

2)(

χ ~ 2

);1)(1( αχ

−−= crv .

4. Cálculo de de la región crítica o de rechazo: 991,52

05,0;2

2

05,0);13)(12( ==−−=

χχ v .

5. Cálculo del estadístico de contraste: en primer lugar, deben hallarse las frecuencias

esperadas ijE . Para hallar la primera frecuencia de la tabla 4.3 se tiene:


Estadística II 7

9,2001000

)336)(598(1..1

11 ==×

=n

OOE

los resultados obtenidos se muestran en la tabla, con las frecuencias esperadas en ( ):

Tabla 4.4. Frecuencias observadas y esperadas por combinaciones de categorías

Tipo de máquina Antigüedad

laboral A B C

Total

Empleados

nuevos

182 (200,9)

213 (209,9)

203 (187,2)

598

Empleados

antiguos

154 (135,1)

138 (141,1)

110 (125,8)

402

Total 336 351 313 1000

Por lo que se obtiene el siguiente resultado:

.85,78,125

)8,125110(

1,141

)1,141138(

1,141

)1,141138(

1,135

)1,135154(

2,187

)2,187203(

9,209

)9,209213(

9,200

)9,200182(

22

222222

=−

+−

+

−+

−+

−+

−+

−=cχ

6. Decisión y conclusión: Como se cumple que 22

tc χχ > (7,85 > 5,991) se rechaza la

hipótesis nula. Con un nivel de significación del 5% hay evidencias estadísticas suficientes

para pensar que las variables antigüedad laboral de los trabajadores y tipo de máquinas

utilizadas no son independientes.

4.4. Prueba de rangos de Wilcoxon-Mann-Whitney

Es la alternativa no paramétrica de la prueba t de dos muestras. En este sentido, los distintos

procedimientos de prueba se muestran en la siguiente tabla:


Estadística II 8

Tabla 5.5. Prueba de la suma de rangos

Hipótesis nula Alternativas posibles Calcular Decisión

u1

u2

21 µµ =

21 µµ <

21 µµ >

21 µµ ≠ u

Re. 0H si ...1 dcvu ≤

Re. 0H si ...2 dcvu ≤

Re. 0H si ... dcvu ≤

En primer lugar, se selecciona una muestra aleatoria de cada una de las poblaciones; donde

1n representa el número de observaciones para la muestra más pequeña, y 2n el número de

observaciones de la muestra más grande. Cuando las muestras son del mismo tamaño, 1n y

2n pueden ser asignadas en forma aleatoria.

Posteriormente, se ordenan las observaciones combinadas en forma creciente y se

sustituyen por valores 1,2,3… En caso de empates, se reemplazan las observaciones por la

media de los valores; la suma de los valores correspondientes a las observaciones 1n en la

muestra más pequeña se denota por 1w . Por otra parte:

12121

22

)1)((w

nnnnw −

−++= , (4,6)

así se puede obtener:

2

)1( 1111

+−=

nnwu (4.7)

2

)1( 2222

+−=

nnwu (4.8)

),min( 21 uuu = . (4.9)


Estadística II 9

La aproximación a la distribución normal cuando 1n y 2n son lo suficientemente grandes,

viene dada por la expresión:

,)(

u

uuZ

σ

µ−= (4.10)

con 2

21nnu =µ y

12

)1( 2121 −+=

nnnnuσ .

Ejemplo 4.3. El contenido de nicotina de dos marcas de cigarrillos, medido en miligramos

es el siguiente:

Marca A 2,1 4,0 6,3 5,4 4,8 3,7 6,1 3,3

Marca B 4,1 0,6 3,1 2,5 4,0 6,2 1,6 2,2 1,9 5,4

Pruebe la hipótesis, con un nivel de significación de 0,05, de que los contenidos promedio

de nicotina de las dos marcas son iguales, contra la alternativa de que no son iguales.

1. 210 : µµ =H ,

211 : µµ =H .

2. 05,0=α

3. Región crítica: v.c.d. = v(n1=8, n2=10; 05,0=α bilateral) = 17

4. Las observaciones deben ordenarse en forma creciente y asignárseles valores del 1 al 18:


Estadística II 10

Tabla 5.6. Asignación de valores

Datos originales Valores

0,6

1,6

1,9

2,1

2,2

2,5

3,1

3,3

3,7

4,0

4,0

4,1

4,8

5,4

5,4

6,1

6,2

6,3

1

2

3

4

5

6

7

8

9

10,5

10,5

12

13

14,5

14,5

16

17

18

Los valores de las observaciones que pertenecen a la marca A, aparecen remarcadas, así:

93185,14135,109841 =++++++=w

y

78932

)19)(18(2 =−

=w .


Estadística II 11

Posteriormente:

572

)9)(8(931 =

−=u

232

)11)(10(782 =

−=u

así pues, .23)23,57min( ==u

5. Decisión y conclusión: Como 23 > 17 no se rechaza la hipótesis nula. Con un nivel de

significación del 5% se puede concluir que no existen diferencias significativas en cuanto a

los contenidos promedio de nicotina en las dos marcas de cigarrillos.

4.5. Prueba de rachas

La prueba de rachas o corridas, basada en el orden en el cual se obtienen las observaciones

muestrales, es una técnica útil para probar la hipótesis nula 0H de que las observaciones

han sido, en efecto, obtenidas en forma aleatoria. Sin importar que las mediciones

muestrales representen datos cualitativos o cuantitativos, la prueba de rachas divide los

datos en dos categorías mutuamente excluyentes: defectuoso o no defectuoso, arriba o

abajo de la mediana; etc.

La prueba de corridas o rachas para la aleatoriedad, está basada en la variable aleatoria V, el

número total de corridas que ocurren en la sucesión completa del experimento. Las tablas

proporcionan valores de ∗≤ vVP( cuando 0H es verdadera) para ∗

v =2,3,…,20 corridas y

valores de 2,3…,20 corridas y valores de 1n y 2n menores o iguales que 10. Los valores P

para ambas pruebas, unilateral o bilateral pueden obtenerse utilizando estos valores

tabulados. La hipótesis nula será rechazada si y solo si α >P.

A modo de ejemplo, supóngase que se efectúa una encuesta a 12 personas para averiguar si

utilizan un cierto producto. Se podría cuestionar de manera estricta el supuesto de

aleatoriedad de la muestra si las doce personas fueran del mismo sexo. Si se designan los


Estadística II 12

hombres y mujeres con las letras M y F respectivamente, una sucesión típica del

experimento pudiese ser:

M M F F F M F F M M M M

En la encuesta se observan un total de cinco F y siete M. Entonces con 51 =n y 72 =n , se

tiene que 5),min( 21 == nnv , así el valor P para una prueba bilateral es:

5(2 ≤= VPP cuando 0H es verdadera) = 2(0,197) = 0,394.

Realizando la prueba con un nivel de confianza del 95%; se tiene que 0,394 > 0,05; por lo

que no hay evidencias suficientes para rechazar la hipótesis de aleatoriedad de la muestra.

La prueba de corridas también puede utilizarse para detectar desviaciones en la aleatoriedad

de una sucesión de mediciones cuantitativas a través del tiempo, causadas por tendencias o

periodicidades. Reemplazando cada medición por un símbolo más en el orden en el cual

son obtenidas si caen arriba de la mediana, y por un símbolo menos si caen debajo de la

mediana y omitiendo todas las mediciones que son exactamente iguales a la mediana, se

genera una sucesión de símbolos más y menos que son probados para indagar la

aleatoriedad, como se muestra en el ejemplo siguiente.

Ejemplo 4.4. Se ajusta una máquina para que introduzca tíner de pintura acrílica en un

envase. ¿Se diría que la cantidad de tíner introducida por esta máquina varía de manera

aleatoria si se mide el contenido de los 15 envases siguientes y se encuentra que son 3,6;

3,9; 4,1; 3,6; 3,8; 3,7; 3,4; 4,0; 3,8; 4,1; 3,9; 4,0; 3,8; 4,2; y 4,1 lts.? Utilizar un nivel de

significación de 0,1.

1. :0H La sucesión es aleatoria,

:1H La sucesión no es aleatoria.

2. 1,0=α .

3. Estadístico de prueba: V, el número total de corridas.


Estadística II 13

4. Cálculos: Para el ejemplo, dado que 9,3=Md . Reemplazando cada medición por el

símbolo “+” si cae por encima de 3,9 y por “-” si cae por debajo de 3,9. Omitiendo las dos

mediciones iguales a 3,9, se obtiene la sucesión

- + - - - - + + + + - + +

para la cual 61 =n y 72 =n , por lo que v = 6. Entonces:

6(2 ≤= VPP cuando 0H es verdadera) = 0,596.

5. Decisión y conclusión: Como P = 0,596 > 1,0=α no se rechaza la 0H . Con un nivel de

confianza del 90% no hay razones para pensar que las mediciones poseen un patrón no

aleatorio.

Cuando 1n y 2n aumentan su tamaño, la distribución muestral de V se aproxima a la

distribución normal con media:

12

21

21+

+=

nn

nnVµ (4.11)

y varianza

)1()(

)2(2

21

2

21

2121212

−++

−−=

nnnn

nnnnnnVσ (4.12)

por lo que pudiese utilizarse el estadístico V

VZZ

σµ )( −

= para establecer la región

crítica de la prueba de corridas.