Alumnos: 9° E · ESTADISTICA NO PARAMETRICA 1 PRUEBA DEL SIGNO PRUEBA DE RANGOS CON SIGNO DE...

ESTADÍSTICA

LIC. GILBERTO A. TREJO TREJO.

ESTADISTICA NO

PARAMETRICA.

Alumnos:

Rosa Lilia Pérez Hernández

Anabel Jiménez Hernández

Jorge Alberto Solis Rizo

Emmanuel Espinoza Estrada

Carlos Luis Camacho Salinas

9° E

UNIVERSIDAD TECNOLÓGICA DE LA SELVA

20 de Julio 2010

Estadística NO paramétrica

ESTADISTICA NO PARAMETRICA

PRUEBA DEL SIGNO1

PRUEBA DE RANGOS CON SIGNO DE WILCOXON

PARA DATOS APAREADOS. 2

EJERCICIOS EN CLASES.4

PRUEBA DE LA SUMA DE RANGOS DE WILCOXON

PARA DOS MUESTRAS INDEPENDIENTES.3

Estadística Aplicada. 9° E


Ejercicios.docx

P R U E B A D E L

S I G N O

o Definición

o Diagrama

o Ejemplos



P R U E B A D E L S I G N O



Definición.La prueba del signo es una prueba no

paramétrica, que utiliza signos positivos

y negativos para probar diferentes

aseveraciones.

Identificar H0.

Identificar H1.

Valor critico.

Región critica.

Nivel de Significancia.

Datos apareados.

Paso 1: Requisitos

1.- Los datos muéstrales se seleccionaron aleatoriamente

2.- No existe el requisito de que los datos muéstrales provengan de una población

con una distribución particular, como una distribución normal.

Paso 2: Notación

Identificar H0.

Identificar H1.

x = El número de veces que ocurre el signo menos frecuente.

n = El número total de signos positivos y negativos combinados.

EJEMPLO: ¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William

Gosset público el articulo “The Probable Error of a Mean” bajo el seudónimo de

“Student” (Biometrika, vol 6, núm.1). El incluyo los datos que se listan en la tabla

13.3 para dos tipos diferentes de semillas de maíz (normales y secadas en horno),

que se utilizaron en parcelas de tierra adyacentes. Los valores corresponden a las

cosechas de cabezas de maíz (o mazorcas), en libras por acre. Utilice la prueba del

signo con un nivel de significancia de 0.05 para probar la aseveración de que no

hay diferencia entre las cosechas de las semillas normales y las de las semillas

secadas en horno.

Tabla de Cosechas de maíz de diferentes semillas

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535

Pasos 1: Identificar H0 y H1.

Ho: No existe diferencia (la mediana de las diferencias es igual a 0).

H1: Existe una diferencia (la mediana de las diferencias no es igual a 0).

Paso 2: Identificar El nivel de significancia.

α= 0.05.

Tabla 13-3 Cosechas de maíz de diferentes semillas

Normales190

3193

5191

0249

6210

8196

1206

0144

4161

2131

6151

1Secadas en horno

2009

1915

2011

2463

2180

1925

2122

1482

1542

1443

1535

Signos de la diferencia

₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋

si

No

Convierta es estadístico de prueba x al

estadístico de prueba.

Obtenga el valor (o valores) críticos(s) z

en la tabla A-2 de la manera habitual

Rechace la hipótesis nula.

Inicio

Asigne signos positivos y negativos y

descarte cualquier cero.

No rechace la hipótesis nula.

Permita que n sea igual al número total d

e signos

Permita que x sea igual al número del

signo menos frecuente.

Obtenga el valor critico en la tabla A-7

¿Los datos

muéstrales

contradicen la

H1?

¿El estadístico de

prueba es menor

que o igual al

valor (o valores)

critico(s)?

¿Es ≤ 25?No

No

No

Sí

Sí

Sí

n = 11

x = 44

11

n

valor critico = 1

4 ≤ 1

No hay suficiente evidencia para sustentar el

rechazo de la aseveración de que la mediana de las

diferencias es igual a 0; esto es, no existe

suficiente evidencia para justificar el rechazo de la

aseveración de que no existe una diferencia entre

las cosechas de las semillas normales y las

cosechas de las semillas secadas por horno.

Convierta es estadístico de prueba x al

estadístico de prueba.

Obtenga el valor (o valores) críticos(s) z

en la tabla A-2 de la manera habitual

Rechace la hipótesis nula.

Inicio

Asigne signos positivos y negativos y

descarte cualquier cero.

No rechace la hipótesis nula.

Permita que n sea igual al número total d

e signos

Permita que x sea igual al número del

signo menos frecuente.

Obtenga el valor critico en la tabla A-7

¿Los datos

muéstrales

contradicen la

H1?

¿El estadístico de

prueba es menor

que o igual al

valor (o valores)

critico(s)?

¿Es n≤25?No

No

No

Sí

Sí

Sí


Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535

Paso 3: Utilizar la prueba del signo.

-106 20 -101 33 -72 36 -62 -38 70 -127 -24₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋

Si Xn > Yn asignar +

Si Xn < Yn asignar -

Si Xn = Yn se descarta

Signos de la

diferenciaDiferencia

volver


Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535

Signos de la diferencia

₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋

Identificar el valor de x:

X=

21 43 65 7

Signos negativo :

Signos positivos:

Numero total de signos:

1 2 3 4

+

7

4

=11

4

Identificar el valor de n:

n= 11

volver

volver

EJERCICIOS EN CLASE.

El Genetics and IVF Institute realizo un ensayo clínico de sus métodos de selección

del genero. Los resultados incluían a 325 bebés nacidos de padres que utilizaron

el método XSORT para aumentar la probabilidad de concebir una niña y de 295 de

esos bebes fueron niñas. Utilice la prueba del signo con un nivel de significancia

de 0.05 y pruebe la aseveración de que este método de selección del género no

tiene ningún efecto.

Ho: p = 0.5

H1: p ≠ 0.5

30295 Como positivo

30 Como negativo

x=

n=

325 < 25

325

z=( + 0.5)-( /2)

√ /2

325

=

325

30

No rechazo

P=0.5

Rechazo

P=0.5

Rechazo

P=0.5

z=-1.96 z=1.96z=0

Datos muéstrales z= -0.1956

z= - 14.64 < -1.96

z=±1.96



VER

TABLA

TABLA DE DISTRIBUCIÓN NORMAL NEGATIVA

TABLA DE DISTRIBUCIÓN NORMAL POSITIVA

PRUEBA DE RANGOS CON SIGNO DE

WILCOXON PARA DATOS APAEREADOS

o Definición

o Ejemplos



DEFINICION: La prueba de rangos con signo de Wilcoxon es una prueba no para métrica queutiliza rangos ordenados de datos muéstrales que consisten en datos apareados. Seusa para probar la hipótesis nula de que la población de diferencias tiene unamediana de cero, de manera que las hipótesis nula y alternativa son las siguientes:

Ho: Los datos apareados tienen diferencias que provienen de una población con unamediana igual a cero.

H1: Los datos apareados tienen diferencias que provienen de una población con unamediana diferente de cero.

NOTACION• El procedimiento para calcular la suma de rangos se incluye después de este

recuadro T= la más pequeña de las siguientes dos sumas:

• La suma de los valores absolutos de los rangos negativos de las diferencias d que

no sean cero.

• La suma de los rangos positivos de las diferencias d que no sean cero.Estadística Aplicada. 9° E


ESTADISTICO DE PRUEBA

Si n ≤ 30, es estadístico de prueba es T.

Si n > 30, el estadístico de prueba es



VALORES CRÍTICOS

Si n ≤ 30, el valor critico T se encuentra en la tabla a A-8.

Si n > 30, el valor critico se encuentra en la tabla A-2.



EJEMPLO:

¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William Gosset publico

el articulo “The probable Error of a Mean” bajo el seudónimo de “Student”. El

incluyo los datos que se listan en la tabla 13-4 para dos tipos diferentes de semilla

de maíz. (Normales y secadas en horno), que se utilizaron en parcelas de tierra

adyacentes. Los valores corresponden a las cosechas de cabezas de maíz (o

mazorcas) en libras por acre. Utilice la prueba de los rangos con signos de

Wilcoxon, con un nivel de significancia de 0.05, para probar las aseveraciones de

que no hay diferencia entre las cosechas de las semillas normales y de las

semillas secadas en horno.

Tabla 13-4 cosecha de maíz de diferentes semillas.

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas en

horno

2009 1915 2011 2463 2108 1925 2122 1482 1542 1443 1535

Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24

Rangos de

Indiferencias

10 1 9 3 8 4 6 5 7 11 2

Rangos con

Signo

-10 1 -9 3 -8 4 -6 -5 7 -11 -2

Procedimiento para la prueba de rangos con

signo de Wilcoxon

Paso 2: Ignore los signos de las diferencias, luego acomode las diferencias de menor

a la mayor y reemplácelas por el valor del rango correspondiente. Cuando las

diferencias tengan el mismo valor numérico, asígneles la media de los rangos

implicados en el empate.

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Del horno 2009 1915 2011 2463 2108 1925 2122 1482 1542 1443 1535

Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24

Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24

Rangos de

Indiferencias

10 1 9 3 8 4 6 5 7 11 2

Paso 1: Para cada par de datos, calcule la diferencia restando el segundo

valor del primero. Mantenga los signos pero descarte cualquier par para

que =0.

( - )

Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24

Rangos de

Indiferencias

10 1 9 3 8 4 6 5 7 11 2

Rangos con

Signo

-10 1 -9 3 -8 4 -6 -5 7 -11 -2

Rangos

con

Signo



Paso 3: Agregue a cada rango el signo de la diferencia de la que provino. Este es,

inserte aquellos signos que se ignoraron en el paso 2.

Paso 4: Calcule la suma de los valores absolutos de los rangos negativos.

También calcule la suma de los rangos positivos.

Suma positivo: + + + 15

311 4 7

=

+ + + + + + =

-10 -9 -8 -6 -5 -11 -2-810 1 9 3 8 4 6 5 7 11 2

Suma negativo: 51



Paso 5: Permita que T sea la mas pequeña de las dos sumas calculadas en el

paso 4. Podría utilizarse cualquier suma, pero para simplificar el procedimiento

seleccionamos arbitrariamente las mas pequeña de las dos sumas.

T =Suma Positivo

Suma Negativo

15

51

Paso 6: Permita que n sea el número de pares de datos para los que la

diferencia no es 0.

Tenemos n = 11

T = 15

Valor critico = 11

α = 0.05

n ≤ 30

n = 11

T < Valor Critico

15 < 11



Ver tabla

El estadístico de prueba T = 15 no es menor o igual a

que el estadístico de 11, por lo que no rechazamos la

hipótesis nula para ello ahí una diferencia entre las

cosechas de las semillas normales y las semillas

secadas en horno.

Paso 7: Determine el estadístico de prueba y los valores críticos con base en el

tamaño muestral.

Paso 8: Cuando plantee la conclusión, rechace la hipótesis nula si los datos

muéstrales le llevan a un estadístico de prueba que se ubica en la región critica,

esto es, cuando el estadístico de prueba sea menor o igual que el valor (o los

valores) críticos (s). De otra forma, no rechace la hipótesis nula.

EJEMPLO: Utilice la prueba de rangos con signos de Wilcoxon para probar la

aseveración de que los datos apareados tienen diferencias que provienen de una

aseveración de que los datos apareados tienen diferencias que provienen de una

población con una mediana igual a 0. Utilice un nivel de significancia 0.05.

X 60 55 89 92 78 84 93 87

Y 35 27 47 44 39 48 51 54



X Y

60 35

55 27

89 47

92 44

78 39

84 48

93 51

87 54

Diferencia

H0: Los datos apareados tienen diferencias que

provienen de una población con una mediana igual

a 0.


provienen de una población con una mediana

diferente de 0.

60

-35

25

25

28

42

48

39

36

42

33Estadística Aplicada. 9° E


Sumatoria de todos los rangos positivos

que estén en la tabla:

1+2+3+4+5+6.5+6.5+7= 36

Sumatoria de los todos los rangos

negativos que estén en la tabla: 0

Se obtiene la mediana de

los rangos repetidos: Mediana de 6 y 7 es 6.5

d

25

28

42

48

39

36

42

33

1

2

6

8

5

4

7

3



d

25 1

28 2

33 3

36 4

39 5

42 6.5

42 6.5

48 7

T=

34 0

Sumatoria

de los

rangos

positivos

Sumatoria de

los rangos

negativos

n=8

Si n≤30, utilizamos la tabla de valores críticos T para la prueba de

rangos con signo de Wilcoxon.



Prueba de dos colas, por que:

Valor critico en la tabla = 4

Hacemos comparación del valor de T y Valor

critico

T < Valor Critico

0<4

Como 0 es menor que 4 se rechaza la

hipótesis nula (H0)


provienen de una población con una mediana igual a 0.


provienen de una población con una mediana diferente

de 0.

Ir a la tabla de valores

críticos con el nivel de

significancia de 0.05 y de

dos colas



VALORES CRITICOS DE T PARA LA PRUEBA DE

RANGOS CON SIGNO DE WILCOXON

Regresar

TABLA DE VALORES CRITICOS DE T

Regresar

PRUEBA DE LA SUMA DE RANGOS DE

WILCOXON PARA DOS MUESTRAS

INDEPENDIENTES

o Definición

o Ejemplos



DEFINICIÓN

Es una prueba no paramétrica que utiliza rangos de datos muéstralesde dos poblaciones independientes. Se utiliza para probar la hipótesisnula de que las dos muestras independientes provienen depoblaciones con medianas iguales. La hipótesis alternativa es laaseveración de que las dos poblaciones tienen medianas diferentes.

REQUISITOS:

Hay dos muestras independientes de datos seleccionados al azar.

Cada una de las dos muestras tiene más de 10 valores.

No existe el requisito de las dos poblaciones tengan una distribución

normal o cualquier otra distribución particular.



FORMULAS PARA ENCONTRAR EL

ESTADÍSTICO DE PRUEBAS.



2 Calcular la media de los rangos implicados y asigne este rango medio a cada uno de los

valores empatados.

EJEMPLO :

IMC de hombres y mujeres En las siguientes tablas se incluyen los valores

muéstrales del índice de masa corporal (IMC) de 12 hombres y de 13 mujeres. Utilice

un nivel de significancia de 0.05 para probar la aseveración de que la mediana del

IMC de los hombres es igual a la mediana del IMC de las mujeres.



Mujeres

19.6 23.8 19.6 29.1

25.2 21.4 22.0 27.5

33.5 20.6 29.9 17.7

Hombres

23.8 23.2 24.6 26.2

23.5 24.5 21.5 31.4

26.4 22.7 27.8 28.1

25.2

La prueba de suma de rangos de wilcoxon requiere de dos muestras

independientes y aleatorias, cada una con mas de 10 valores.

Los datos muéstrales son independientes y aleatorios, y los tamaños muéstrales

son 12 y 13

Requisitos:

H0: Los hombres y las mujeres tienen valores del IMC con medianas

iguales.

H1: Los Hombres y las mujeres tienen valores del IMC con medianas que

no son iguales.

Hipótesis nula y la hipótesis alternativa son:Pasos para resolver:

Acomode en rangos las 25 mediciones combinadas del IMC, Comenzando con el

rango 1 (asignado al valor mas bajo que es 17.7). 1

Calcular estadístico de Prueba

Nivel de significancia de 0.054

3Suma de los rangos correspondientes a los valores muéstrales

tanto para los hombres como las mujeres.

Mujeres

19.6 (2.5) 23.8 (11.5) 19.6 (2.5) 29.1 (22)

25.2 (15.5) 21.4 (5) 22.0 (7) 27.5 (19)

33.5 (25) 20.6 (4) 29.9 (23) 17.7 (1)

Hombres

23.8 (11.5) 23.2 (9) 24.6 (14) 26.2 (17)

23.5 (10) 24.5 (13) 21.5 (6) 31.4 (24)

26.4 (18) 22.7 (8) 27.8 (20) 28.1 (21)

25.2 (15.5)

mediciones Rangos

Preliminares

17.7 1

19.6 2

19.6 3

20.6 4

21.4 5

21.5 6

22.0 7

22.7 8

23.2 9

23.5 10

23.8 11

23.8 12

24.5 13

24.6 14

25.2 15

25.2 16

26.2 17

26.4 18

27.5 19

27.8 20

28.1 21

29.1 22

29.9 23

31.4 24

33.5 25

Atrás

Rangos

1

2.5

2.5

4

5

6

7

8

9

10

11.5

11.5

13

14

15.5

15.5

17

18

19

20

21

22

23

24

25

CALCULAR EL ESTADÍSTICO DE PRUEBA DE

LA MUESTRA 1

0

α/2=0.025α/2=0.025

Z = -0.98 Z = 0.98

VER

TABLA

Valor Critico=±1.96

z=-1.96 z=1.96

El estadístico de prueba no cae dentro de la región

Critica, por lo que no rechazamos la hipótesis nula de que los

Valores del IMC de hombres y mujeres tienen medianas iguales.

TABLA DE DISTRIBUCIÓN NORMAL NEGATIVA

Atrás

EJERCICIO PARA RESOLVER

¿Los trastornos psiquiátricos severos están relacionados confactores biológicos?

Un estudio utilizo tomografía computarizada (TC) por rayos Xpara reunir datos de volúmenes cerebrales de un grupo depacientes con trastornos obsesivo-compulsivo y un grupo decontrol saludables. La lista adjunta presenta los resultadosmuéstrales (en milímetros) para volúmenes del hemisferioderecho. Utilice un nivel de significancia de 0.01 y pruebe laaseveración de que los pacientes obsesivo-compulsivos y laspersonas saludables tienen la misma mediana devolúmenes cerebrales. Con base en este resultado,¿podemos concluir que el trastorno obsesivo-compulsivotiene una base biológica?

Alumnos: 9° E · ESTADISTICA NO PARAMETRICA 1 PRUEBA DEL SIGNO PRUEBA DE RANGOS CON SIGNO DE...

Documents

Transcript of Alumnos: 9° E · ESTADISTICA NO PARAMETRICA 1 PRUEBA DEL SIGNO PRUEBA DE RANGOS CON SIGNO DE...