Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X...

36
Inferencia basada en dos muestras

Transcript of Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X...

Page 1: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Page 2: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Hay dos muestras:

m1={X11, X21,…, Xn1}

m2={X12, X22,…, Xn2}

Cada muestra proviene de una población

Page 3: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplos

Comparar el contenido de ácidos grasos en semillas de dos variedades distintas.

Comparar el aumento de peso en animales alimentados con dos pasturas diferentes.

Comparar el efecto de dos dosis de un fungicida.

Page 4: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplos Comparar los porcentajes de preñez

bajo dos protocolos de inseminación artificial.

Comparar los porcentajes de lecturas positivas para una virosis en pruebas Elisa estándar y DAS-Elisa.

Page 5: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

El objetivo de la inferencia puede ser: Estimar la diferencia entre las

medias de las poblaciones (1-2) de

las cuales proceden las muestras

Contrastar hipótesis sobre la diferencia (1-2)

Page 6: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Si el contraste es bilateral:

0 1 2: = 0 H

1 1 2 : 0 H

Page 7: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

0 1 2 1 1 2: vs. : H H

Si el contraste es unilateral derecho:

0 1 2 1 1 2: vs. : H H

Si el contraste es unilateral izquierdo:

Page 8: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Muestras independientes

Inferencia basada en dos muestras

Varianzas poblacionales

conocidas

Varianzas poblacionales desconocidas

varianzas iguales

varianzas diferentes Muestras

dependientes

Page 9: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

El estadístico a usar en el contraste de medias depende de:La naturaleza de las muestrasSi se conocen las varianzas poblacionalesSi las varianzas poblacionales son iguales o diferentes

Inferencia basada en dos muestras

Page 10: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Muestras independientes Varianzas poblacionales conocidas

1 2 1 2

2 21 2

1 2

~ (0,1)X X

Z N

n n

La inferencia se basa en el estadístico:

usualmente las varianzas son desconocidas

Page 11: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Muestras independientes Varianzas poblacionales desconocidas

¿Cómo son las varianzas poblacionales?¿Son iguales o diferentes?

2 21 1 2 :H

2 20 1 2: H

Page 12: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Muestras independientes: Varianzas

poblacionales desconocidas e iguales

1 2

1 2 1 2

2

2

1 2

~1 1

n n

p

X XT T

Sn n

2 22 1 1 2 2

1 2

( 1) ( 1)

2p

n S n SS

n n

La inferencia acerca de las medias se basa en el estadístico:

Prueba T para muestras independientes cuando las varianzas son homogéneas

Page 13: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Intervalo de confianza bilateral para la diferencia de medias está dado por:

1 2

21 2 (1 / 2) ; 2

1 2

1 1n n px x t s

n n

Muestras independientes: Varianzas

poblacionales desconocidas e iguales

Inferencia basada en dos muestras

Page 14: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Inferencia basada en dos muestras

Muestras independientes: Varianzas

poblacionales desconocidas diferentes

1 2 1 2

2 21 2

1 2

~ v

X XT t

S S

n n

La inferencia acerca de las medias se basa en el estadístico:

22 21 2

1 2

2 22 21 2

1 2

1 2

2

1 1

S Sn n

S Sn n

n n

Prueba T para muestras independientes cuando las varianzas no son homogéneas

Page 15: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Intervalo de confianza bilateral 1- para la diferencia de medias :

2 21 2

1 2 (1 / 2) ;1 2

s sx x t

n n

Caso Normal-Muestras independientes

Muestras independientes: Varianzas

poblacionales desconocidas diferentes

Page 16: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

EjemploSe desea determinar si al usar fertilización nitrogenada en maíz, se modifica el promedio del peso del grano. Se realiza un ensayo en el cual se aplica fertilización a 24 parcelas experimentales y otras 24 parcelas no se fertilizan. Al finalizar el ensayo se registran los valores de la variable en estudio en mg. Las hipótesis propuestas son H0: 1= 2 vs H1: 1 2

Page 17: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

EjemploLos resultados del ensayo son los siguientes:

Fertilización n S2

Con fertilizante

24 311.00 1953.25

Sin fertilizante

24 261.98 1722.82

X

Page 18: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

¿Las varianzas poblacionales son iguales o diferentes?

Inferencia basada en dos muestras

2 21 1 2 :H

2 20 1 2: H

1 2

21

( 1, 1)22

~ n n

sF F

s

EstadísticoHipótesis

Page 19: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

1953.951.13

1722.82F

Bajo H0 se

distribuye como una F con 23 y 23 grados de libertad

Inferencia basada en dos muestras

Contraste para la homogeneidad de varianzas

Page 20: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Prueba F

La región de aceptación para un nivel de significación del 5% está delimitada por 0.43 y 2.31, correspondientes a los cuantiles /2 y (1 - /2) respectivamente

0.00 0.21 0.42 0.63 0.84 1.04 1.25 1.46 1.67 1.88 2.09 2.30 2.51 2.72 2.93 3.13 3.34 3.55

Variable

0.0

0.3

0.5

0.8

1.0

De

nsi

da

d

Función de densidad

F de Snedecor(23,23,0): p(evento)=0.0500

Page 21: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Tabla F

25 0.001 0.025 0.050 0.950 0.975 0.990

1 0.0721 0.1759 0.2358 249.260 998.087 6239.86

2 0.1084 0.2330 0.2954 19.4557 39.4575 99.4587

23 0.2712 0.4434 0. 5066 1.9963 2.2871 2.6857

Page 22: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplo

Como F=1.13 está en el intervalo

(0.43; 2.31) se acepta H0: 12= 2

2

Se concluye que no hay diferencias entre las varianzas poblacionales.Se cumple el supuesto de homogeneidad de varianzas

Page 23: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Prueba T

1 2

1 2 1 2

2

2

1 2

~1 1

n n

p

X XT T

Sn n

Reemplazando:

Page 24: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Prueba T

311 261.98 03.96

1 11838.385

24 24

T

2 (23) 1953.95 (23) 1722.821838.385

24 24 2pS

Page 25: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Prueba T

La región de aceptación para un nivel de significación del 5% está delimitada por -2.013 y 2.013, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 46 grados de libertad

-5.11 -4.09 -3.07 -2.04 -1.02 0.00 1.02 2.04 3.07 4.09 5.11

Variable

0.00

0.10

0.20

0.30

0.40

De

nsi

da

d

Función de densidad

T Student(46): p(evento)=0.0500

Page 26: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Prueba T

Como T=3.96 no pertenece al intervalo

(-2.013; 2.013) se rechaza H0: 1= 2

El intervalo de confianza [24.11;73.94] construido con una confianza del 95% incluye al verdadero valor de la diferencia entre las medias

Se concluye que hay diferencias entre las medias.

Page 27: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

En un estudio para analizar la evolución de tubérculos almacenados, se deseaba comparar dos épocas de cosecha: Abril y Agosto, las que determinan diferen-tes periodos de almacenamiento.La variable en estudio fue la pérdida de peso por deshidratación (en gr).El archivo Época contiene las observa-ciones del estudio.

Prueba T para muestras independientesEjemplo para uso de software

Page 28: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Muestras dependientes

Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo.

Inferencia basada en dos muestras

Page 29: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplo -Muestras dependientes

Se quiere comparar el efecto de dos virus sobre plantas de tabaco. Se seleccionaron al azar 8 plantas y en cada una de ellas se tomaron 2 hojas apicales.Sobre cada hoja se aplicaron los preparados conteniendo los virus cuyos efectos se querían evaluar.La variable de respuesta fue la superficie en mm2 de las lesiones locales que aparecían como pequeñas manchas oscuras en las hojas.

Page 30: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplo

X X d

Preparado 1

Preparado 2 di

31 18 13

20 17 3

18 14 4

17 11 6

9 10 -1

8 7 1

10 5 5

7 6 1

1= 15 2 = 11 = 4

0 1 2: = 0 H

1 1 2 : 0 H

0 : = 0 H

1 : 0 H

o bien:

Page 31: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Caso Normal-Muestras dependientes

La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()

1

2~ n

D

DT t

S

n

Page 32: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Caso Normal-Muestras dependientes La prueba de hipótesis para la diferencia

de medias basada en este estadístico se conoce como prueba T para muestras apareadas.

Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:

2

(1 / 2); 1D

n

SD t

n

Page 33: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplo

2

4 02.63

4.30

8D

DT

S

n

Fijando = 0.05, la región de aceptación es el intervalo (t/2=-2.365 , t1- /2= 2.365),

con 7 grados de libertad

Page 34: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Ejemplo

Como T=2.63 es mayor que t1- /2= 2.365,

se rechaza H0: 1= 2

Se concluye que las diferencias observadas entre las áreas dañadas por uno u otro virus son estadísticamente significativas.

Page 35: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Para estudiar el efecto de la polini-zación sobre el peso promedio de las semillas obtenidas, se efectuó un experimento sobre 10 plantas. La mitad de cada planta fue polinizada y la otra mitad no. Se pesaron las semillas de cada mitad por separado,registrándose de cada planta un par de observaciones. El archivo Poliniza con-tiene los valores registrados

Prueba T para muestras apareadasEjemplo para uso de software

Page 36: Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11, X 21,…, X n1 } m 2 ={X 12, X 22,…, X n2 } Cada muestra proviene de una población.

Muestras Normales

Independientes Apareadas

Varianzas Homogéneas

Varianzas Heterogéneas

Prueba T Prueba T’

Prueba T para

observacionesapareadas

Resumen