El Masculino Genérico, ¿signo lingüístico, o signo ideológico?
Alumnos: 9° E · ESTADISTICA NO PARAMETRICA 1 PRUEBA DEL SIGNO PRUEBA DE RANGOS CON SIGNO DE...
Transcript of Alumnos: 9° E · ESTADISTICA NO PARAMETRICA 1 PRUEBA DEL SIGNO PRUEBA DE RANGOS CON SIGNO DE...
ESTADÍSTICA
LIC. GILBERTO A. TREJO TREJO.
ESTADISTICA NO
PARAMETRICA.
Alumnos:
Rosa Lilia Pérez Hernández
Anabel Jiménez Hernández
Jorge Alberto Solis Rizo
Emmanuel Espinoza Estrada
Carlos Luis Camacho Salinas
9° E
UNIVERSIDAD TECNOLÓGICA DE LA SELVA
20 de Julio 2010
Estadística NO paramétrica
ESTADISTICA NO PARAMETRICA
PRUEBA DEL SIGNO1
PRUEBA DE RANGOS CON SIGNO DE WILCOXON
PARA DATOS APAREADOS. 2
EJERCICIOS EN CLASES.4
PRUEBA DE LA SUMA DE RANGOS DE WILCOXON
PARA DOS MUESTRAS INDEPENDIENTES.3
Estadística Aplicada. 9° E
Estadística NO paramétrica
P R U E B A D E L
S I G N O
o Definición
o Diagrama
o Ejemplos
Estadística Aplicada. 9° E
Estadística NO paramétrica
P R U E B A D E L S I G N O
Estadística Aplicada. 9° E
Estadística NO paramétrica
Definición.La prueba del signo es una prueba no
paramétrica, que utiliza signos positivos
y negativos para probar diferentes
aseveraciones.
Identificar H0.
Identificar H1.
Valor critico.
Región critica.
Nivel de Significancia.
Datos apareados.
Paso 1: Requisitos
1.- Los datos muéstrales se seleccionaron aleatoriamente
2.- No existe el requisito de que los datos muéstrales provengan de una población
con una distribución particular, como una distribución normal.
Paso 2: Notación
Identificar H0.
Identificar H1.
x = El número de veces que ocurre el signo menos frecuente.
n = El número total de signos positivos y negativos combinados.
EJEMPLO: ¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William
Gosset público el articulo “The Probable Error of a Mean” bajo el seudónimo de
“Student” (Biometrika, vol 6, núm.1). El incluyo los datos que se listan en la tabla
13.3 para dos tipos diferentes de semillas de maíz (normales y secadas en horno),
que se utilizaron en parcelas de tierra adyacentes. Los valores corresponden a las
cosechas de cabezas de maíz (o mazorcas), en libras por acre. Utilice la prueba del
signo con un nivel de significancia de 0.05 para probar la aseveración de que no
hay diferencia entre las cosechas de las semillas normales y las de las semillas
secadas en horno.
Tabla de Cosechas de maíz de diferentes semillas
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
Pasos 1: Identificar H0 y H1.
Ho: No existe diferencia (la mediana de las diferencias es igual a 0).
H1: Existe una diferencia (la mediana de las diferencias no es igual a 0).
Paso 2: Identificar El nivel de significancia.
α= 0.05.
Tabla 13-3 Cosechas de maíz de diferentes semillas
Normales190
3193
5191
0249
6210
8196
1206
0144
4161
2131
6151
1Secadas en horno
2009
1915
2011
2463
2180
1925
2122
1482
1542
1443
1535
Signos de la diferencia
₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋
si
No
Convierta es estadístico de prueba x al
estadístico de prueba.
Obtenga el valor (o valores) críticos(s) z
en la tabla A-2 de la manera habitual
Rechace la hipótesis nula.
Inicio
Asigne signos positivos y negativos y
descarte cualquier cero.
No rechace la hipótesis nula.
Permita que n sea igual al número total d
e signos
Permita que x sea igual al número del
signo menos frecuente.
Obtenga el valor critico en la tabla A-7
¿Los datos
muéstrales
contradicen la
H1?
¿El estadístico de
prueba es menor
que o igual al
valor (o valores)
critico(s)?
¿Es ≤ 25?No
No
No
Sí
Sí
Sí
n = 11
x = 44
11
n
valor critico = 1
4 ≤ 1
No hay suficiente evidencia para sustentar el
rechazo de la aseveración de que la mediana de las
diferencias es igual a 0; esto es, no existe
suficiente evidencia para justificar el rechazo de la
aseveración de que no existe una diferencia entre
las cosechas de las semillas normales y las
cosechas de las semillas secadas por horno.
Convierta es estadístico de prueba x al
estadístico de prueba.
Obtenga el valor (o valores) críticos(s) z
en la tabla A-2 de la manera habitual
Rechace la hipótesis nula.
Inicio
Asigne signos positivos y negativos y
descarte cualquier cero.
No rechace la hipótesis nula.
Permita que n sea igual al número total d
e signos
Permita que x sea igual al número del
signo menos frecuente.
Obtenga el valor critico en la tabla A-7
¿Los datos
muéstrales
contradicen la
H1?
¿El estadístico de
prueba es menor
que o igual al
valor (o valores)
critico(s)?
¿Es n≤25?No
No
No
Sí
Sí
Sí
Tabla 13-3 Cosechas de maíz de diferentes semillas
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
Paso 3: Utilizar la prueba del signo.
-106 20 -101 33 -72 36 -62 -38 70 -127 -24₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋
Si Xn > Yn asignar +
Si Xn < Yn asignar -
Si Xn = Yn se descarta
Signos de la
diferenciaDiferencia
volver
Tabla 13-3 Cosechas de maíz de diferentes semillas
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas en horno 2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
Signos de la diferencia
₋ ₊ ₋ ₊ ₋ ₊ ₋ ₋ ₊ ₋ ₋
Identificar el valor de x:
X=
21 43 65 7
Signos negativo :
Signos positivos:
Numero total de signos:
1 2 3 4
+
7
4
=11
4
Identificar el valor de n:
n= 11
volver
volver
EJERCICIOS EN CLASE.
El Genetics and IVF Institute realizo un ensayo clínico de sus métodos de selección
del genero. Los resultados incluían a 325 bebés nacidos de padres que utilizaron
el método XSORT para aumentar la probabilidad de concebir una niña y de 295 de
esos bebes fueron niñas. Utilice la prueba del signo con un nivel de significancia
de 0.05 y pruebe la aseveración de que este método de selección del género no
tiene ningún efecto.
Ho: p = 0.5
H1: p ≠ 0.5
30295 Como positivo
30 Como negativo
x=
n=
325 < 25
325
z=( + 0.5)-( /2)
√ /2
325
=
325
30
No rechazo
P=0.5
Rechazo
P=0.5
Rechazo
P=0.5
z=-1.96 z=1.96z=0
Datos muéstrales z= -0.1956
z= - 14.64 < -1.96
z=±1.96
Estadística Aplicada. 9° E
Estadística NO paramétrica
VER
TABLA
TABLA DE DISTRIBUCIÓN NORMAL NEGATIVA
TABLA DE DISTRIBUCIÓN NORMAL POSITIVA
PRUEBA DE RANGOS CON SIGNO DE
WILCOXON PARA DATOS APAEREADOS
o Definición
o Ejemplos
Estadística Aplicada. 9° E
Estadística NO paramétrica
DEFINICION: La prueba de rangos con signo de Wilcoxon es una prueba no para métrica queutiliza rangos ordenados de datos muéstrales que consisten en datos apareados. Seusa para probar la hipótesis nula de que la población de diferencias tiene unamediana de cero, de manera que las hipótesis nula y alternativa son las siguientes:
Ho: Los datos apareados tienen diferencias que provienen de una población con unamediana igual a cero.
H1: Los datos apareados tienen diferencias que provienen de una población con unamediana diferente de cero.
NOTACION• El procedimiento para calcular la suma de rangos se incluye después de este
recuadro T= la más pequeña de las siguientes dos sumas:
• La suma de los valores absolutos de los rangos negativos de las diferencias d que
no sean cero.
• La suma de los rangos positivos de las diferencias d que no sean cero.Estadística Aplicada. 9° E
Estadística NO paramétrica
ESTADISTICO DE PRUEBA
Si n ≤ 30, es estadístico de prueba es T.
Si n > 30, el estadístico de prueba es
Estadística Aplicada. 9° E
Estadística NO paramétrica
VALORES CRÍTICOS
Si n ≤ 30, el valor critico T se encuentra en la tabla a A-8.
Si n > 30, el valor critico se encuentra en la tabla A-2.
Estadística Aplicada. 9° E
Estadística NO paramétrica
EJEMPLO:
¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William Gosset publico
el articulo “The probable Error of a Mean” bajo el seudónimo de “Student”. El
incluyo los datos que se listan en la tabla 13-4 para dos tipos diferentes de semilla
de maíz. (Normales y secadas en horno), que se utilizaron en parcelas de tierra
adyacentes. Los valores corresponden a las cosechas de cabezas de maíz (o
mazorcas) en libras por acre. Utilice la prueba de los rangos con signos de
Wilcoxon, con un nivel de significancia de 0.05, para probar las aseveraciones de
que no hay diferencia entre las cosechas de las semillas normales y de las
semillas secadas en horno.
Tabla 13-4 cosecha de maíz de diferentes semillas.
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Secadas en
horno
2009 1915 2011 2463 2108 1925 2122 1482 1542 1443 1535
Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24
Rangos de
Indiferencias
10 1 9 3 8 4 6 5 7 11 2
Rangos con
Signo
-10 1 -9 3 -8 4 -6 -5 7 -11 -2
Procedimiento para la prueba de rangos con
signo de Wilcoxon
Paso 2: Ignore los signos de las diferencias, luego acomode las diferencias de menor
a la mayor y reemplácelas por el valor del rango correspondiente. Cuando las
diferencias tengan el mismo valor numérico, asígneles la media de los rangos
implicados en el empate.
Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511
Del horno 2009 1915 2011 2463 2108 1925 2122 1482 1542 1443 1535
Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24
Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24
Rangos de
Indiferencias
10 1 9 3 8 4 6 5 7 11 2
Paso 1: Para cada par de datos, calcule la diferencia restando el segundo
valor del primero. Mantenga los signos pero descarte cualquier par para
que =0.
( - )
Diferencias d -106 20 -101 33 -72 36 -62 -38 70 -127 -24
Rangos de
Indiferencias
10 1 9 3 8 4 6 5 7 11 2
Rangos con
Signo
-10 1 -9 3 -8 4 -6 -5 7 -11 -2
Rangos
con
Signo
Estadística Aplicada. 9° E
Estadística NO paramétrica
Paso 3: Agregue a cada rango el signo de la diferencia de la que provino. Este es,
inserte aquellos signos que se ignoraron en el paso 2.
Paso 4: Calcule la suma de los valores absolutos de los rangos negativos.
También calcule la suma de los rangos positivos.
Suma positivo: + + + 15
311 4 7
=
+ + + + + + =
-10 -9 -8 -6 -5 -11 -2-810 1 9 3 8 4 6 5 7 11 2
Suma negativo: 51
Estadística Aplicada. 9° E
Estadística NO paramétrica
Paso 5: Permita que T sea la mas pequeña de las dos sumas calculadas en el
paso 4. Podría utilizarse cualquier suma, pero para simplificar el procedimiento
seleccionamos arbitrariamente las mas pequeña de las dos sumas.
T =Suma Positivo
Suma Negativo
15
51
Paso 6: Permita que n sea el número de pares de datos para los que la
diferencia no es 0.
Tenemos n = 11
T = 15
Valor critico = 11
α = 0.05
n ≤ 30
n = 11
T < Valor Critico
15 < 11
Estadística Aplicada. 9° E
Estadística NO paramétrica
Ver tabla
El estadístico de prueba T = 15 no es menor o igual a
que el estadístico de 11, por lo que no rechazamos la
hipótesis nula para ello ahí una diferencia entre las
cosechas de las semillas normales y las semillas
secadas en horno.
Paso 7: Determine el estadístico de prueba y los valores críticos con base en el
tamaño muestral.
Paso 8: Cuando plantee la conclusión, rechace la hipótesis nula si los datos
muéstrales le llevan a un estadístico de prueba que se ubica en la región critica,
esto es, cuando el estadístico de prueba sea menor o igual que el valor (o los
valores) críticos (s). De otra forma, no rechace la hipótesis nula.
EJEMPLO: Utilice la prueba de rangos con signos de Wilcoxon para probar la
aseveración de que los datos apareados tienen diferencias que provienen de una
aseveración de que los datos apareados tienen diferencias que provienen de una
población con una mediana igual a 0. Utilice un nivel de significancia 0.05.
X 60 55 89 92 78 84 93 87
Y 35 27 47 44 39 48 51 54
Estadística Aplicada. 9° E
Estadística NO paramétrica
X Y
60 35
55 27
89 47
92 44
78 39
84 48
93 51
87 54
Diferencia
H0: Los datos apareados tienen diferencias que
provienen de una población con una mediana igual
a 0.
H1: Los datos apareados tienen diferencias que
provienen de una población con una mediana
diferente de 0.
60
-35
25
25
28
42
48
39
36
42
33Estadística Aplicada. 9° E
Estadística NO paramétrica
Sumatoria de todos los rangos positivos
que estén en la tabla:
1+2+3+4+5+6.5+6.5+7= 36
Sumatoria de los todos los rangos
negativos que estén en la tabla: 0
Se obtiene la mediana de
los rangos repetidos: Mediana de 6 y 7 es 6.5
d
25
28
42
48
39
36
42
33
1
2
6
8
5
4
7
3
Estadística Aplicada. 9° E
Estadística NO paramétrica
d
25 1
28 2
33 3
36 4
39 5
42 6.5
42 6.5
48 7
T=
34 0
Sumatoria
de los
rangos
positivos
Sumatoria de
los rangos
negativos
n=8
Si n≤30, utilizamos la tabla de valores críticos T para la prueba de
rangos con signo de Wilcoxon.
Estadística Aplicada. 9° E
Estadística NO paramétrica
Prueba de dos colas, por que:
Valor critico en la tabla = 4
Hacemos comparación del valor de T y Valor
critico
T < Valor Critico
0<4
Como 0 es menor que 4 se rechaza la
hipótesis nula (H0)
H0: Los datos apareados tienen diferencias que
provienen de una población con una mediana igual a 0.
H1: Los datos apareados tienen diferencias que
provienen de una población con una mediana diferente
de 0.
Ir a la tabla de valores
críticos con el nivel de
significancia de 0.05 y de
dos colas
Estadística Aplicada. 9° E
Estadística NO paramétrica
VALORES CRITICOS DE T PARA LA PRUEBA DE
RANGOS CON SIGNO DE WILCOXON
Regresar
TABLA DE VALORES CRITICOS DE T
Regresar
PRUEBA DE LA SUMA DE RANGOS DE
WILCOXON PARA DOS MUESTRAS
INDEPENDIENTES
o Definición
o Ejemplos
Estadística Aplicada. 9° E
Estadística NO paramétrica
DEFINICIÓN
Es una prueba no paramétrica que utiliza rangos de datos muéstralesde dos poblaciones independientes. Se utiliza para probar la hipótesisnula de que las dos muestras independientes provienen depoblaciones con medianas iguales. La hipótesis alternativa es laaseveración de que las dos poblaciones tienen medianas diferentes.
REQUISITOS:
Hay dos muestras independientes de datos seleccionados al azar.
Cada una de las dos muestras tiene más de 10 valores.
No existe el requisito de las dos poblaciones tengan una distribución
normal o cualquier otra distribución particular.
Estadística Aplicada. 9° E
Estadística NO paramétrica
FORMULAS PARA ENCONTRAR EL
ESTADÍSTICO DE PRUEBAS.
Estadística Aplicada. 9° E
Estadística NO paramétrica
2 Calcular la media de los rangos implicados y asigne este rango medio a cada uno de los
valores empatados.
EJEMPLO :
IMC de hombres y mujeres En las siguientes tablas se incluyen los valores
muéstrales del índice de masa corporal (IMC) de 12 hombres y de 13 mujeres. Utilice
un nivel de significancia de 0.05 para probar la aseveración de que la mediana del
IMC de los hombres es igual a la mediana del IMC de las mujeres.
Estadística Aplicada. 9° E
Estadística NO paramétrica
Mujeres
19.6 23.8 19.6 29.1
25.2 21.4 22.0 27.5
33.5 20.6 29.9 17.7
Hombres
23.8 23.2 24.6 26.2
23.5 24.5 21.5 31.4
26.4 22.7 27.8 28.1
25.2
La prueba de suma de rangos de wilcoxon requiere de dos muestras
independientes y aleatorias, cada una con mas de 10 valores.
Los datos muéstrales son independientes y aleatorios, y los tamaños muéstrales
son 12 y 13
Requisitos:
H0: Los hombres y las mujeres tienen valores del IMC con medianas
iguales.
H1: Los Hombres y las mujeres tienen valores del IMC con medianas que
no son iguales.
Hipótesis nula y la hipótesis alternativa son:Pasos para resolver:
Acomode en rangos las 25 mediciones combinadas del IMC, Comenzando con el
rango 1 (asignado al valor mas bajo que es 17.7). 1
Calcular estadístico de Prueba
Nivel de significancia de 0.054
3Suma de los rangos correspondientes a los valores muéstrales
tanto para los hombres como las mujeres.
Mujeres
19.6 (2.5) 23.8 (11.5) 19.6 (2.5) 29.1 (22)
25.2 (15.5) 21.4 (5) 22.0 (7) 27.5 (19)
33.5 (25) 20.6 (4) 29.9 (23) 17.7 (1)
Hombres
23.8 (11.5) 23.2 (9) 24.6 (14) 26.2 (17)
23.5 (10) 24.5 (13) 21.5 (6) 31.4 (24)
26.4 (18) 22.7 (8) 27.8 (20) 28.1 (21)
25.2 (15.5)
mediciones Rangos
Preliminares
17.7 1
19.6 2
19.6 3
20.6 4
21.4 5
21.5 6
22.0 7
22.7 8
23.2 9
23.5 10
23.8 11
23.8 12
24.5 13
24.6 14
25.2 15
25.2 16
26.2 17
26.4 18
27.5 19
27.8 20
28.1 21
29.1 22
29.9 23
31.4 24
33.5 25
Atrás
Rangos
1
2.5
2.5
4
5
6
7
8
9
10
11.5
11.5
13
14
15.5
15.5
17
18
19
20
21
22
23
24
25
CALCULAR EL ESTADÍSTICO DE PRUEBA DE
LA MUESTRA 1
0
α/2=0.025α/2=0.025
Z = -0.98 Z = 0.98
VER
TABLA
Valor Critico=±1.96
z=-1.96 z=1.96
El estadístico de prueba no cae dentro de la región
Critica, por lo que no rechazamos la hipótesis nula de que los
Valores del IMC de hombres y mujeres tienen medianas iguales.
TABLA DE DISTRIBUCIÓN NORMAL NEGATIVA
Atrás
EJERCICIO PARA RESOLVER
¿Los trastornos psiquiátricos severos están relacionados confactores biológicos?
Un estudio utilizo tomografía computarizada (TC) por rayos Xpara reunir datos de volúmenes cerebrales de un grupo depacientes con trastornos obsesivo-compulsivo y un grupo decontrol saludables. La lista adjunta presenta los resultadosmuéstrales (en milímetros) para volúmenes del hemisferioderecho. Utilice un nivel de significancia de 0.01 y pruebe laaseveración de que los pacientes obsesivo-compulsivos y laspersonas saludables tienen la misma mediana devolúmenes cerebrales. Con base en este resultado,¿podemos concluir que el trastorno obsesivo-compulsivotiene una base biológica?