Distribución-en-pequeñas-muestras

16
 Teoría de pequeñas muestras En muestras de tamaño > 30, o llamadas grandes muestras, las distribuciones de muestreo de muchos estadísticos son aproximadamente normales, siendo la aproximación tanto mejor cuando N es mayor. Para muestras de tamaño menor que 30, denominadas pequeñas muestras, esta aproximación no es buena y empeora al decrecer N. El nombre de “pequeñas muestras” quizá no le hace justicia al significado real de este tópico y habría que llamarlo también “teoría exacta del muestreo”, porque sus resultados son válidos tanto para grandes como para pequeñas muestras. Revisaremos dos distribuciones de importancia: Distribución de Student y distribución Chi-cuadrado

Transcript of Distribución-en-pequeñas-muestras

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 1/16

Teoría de pequeñas muestras

• En muestras de tamaño > 30, o llamadas grandes muestras, las distribucionesde muestreo de muchos estadísticos son aproximadamente normales, siendo laaproximación tanto mejor cuando N es mayor.

• Para muestras de tamaño menor que 30, denominadas pequeñas muestras,esta aproximación no es buena y empeora al decrecer N.

• El nombre de “pequeñas muestras” quizá no le hace justicia al significado realde este tópico y habría que llamarlo también “teoría exacta del muestreo”, porque sus resultados son válidos tanto para grandes como para pequeñasmuestras.

Revisaremos dos distribuciones de importancia: Distribución de Student ydistribución Chi-cuadrado

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 2/16

Teoría de pequeñas muestras

• Distribución t de Student:

• Como señalamos en los fundamentos de distribución muestral cuanto mayor es el tamaño de la muestra, menor es el error de muestreo.

• Pero al revés (en particular n < 30), los errores de muestreo se acentúan.

• Se recordará que la distribución muestral es más estrecha que la distribuciónde puntuaciones brutas. Así también, muestras con tamaños o n más grandeconformarán distribuciones más estrechas y “apuntadas” aún.

Con pocas observaciones, la distribución tiende a aplanarse, esto se evidenciacon tamaños de muestra < 120 y es completa cuando el tamaño de muestra es< 30.

• El error de muestreo se acentúa además por el denominado ERROR DEESTIMACIÓN

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 3/16

Teoría de pequeñas muestras

• Distribución t de Student:

• Calcular el error de muestreo usando una estadístico de la muestra (y másencima de una muestra ya que usualmente no tomamos más que una) agregamás error a éste.

• Con más error, la distribución se aplana y por ello, para calcular probabilidadesno es posible usar la Curva de distribución Normal

n > 120

Curva de dist. t, n = 20

Curva de dist. t, n = 10

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 4/16

Teoría de pequeñas muestras

Distribución t de Student:

• Será necesario utilizar una nueva distribución, denominada DISTRIBUCIÓN t DESTUDENT. Que es una distribución aproximadamente Normal.

• Se usa con muestras pequeñas o bien, cuando estimamos el error muestral.

• Como se vio en la figura anterior, a medida que la muestra cambia de tamaño,la forma de la distribución también cambia. La forma de la curva depende ahorade un ajuste llamado GRADOS DE LIBERTAD (gl).

• Para una DISTRIBUCIÓN MUESTRAL DE MEDIAS, (hay distribuciones de otros

estadísticos, aquí simplemente hablamos de la más usada), los grados delibertad se calculan como n – 1, donde n es el tamaño de la muestra.

• Debido al aplanamiento progresivo de la curva, a medida que el tamaño de lamuestra cambia, se requerirían tantas tablas de probabilidad de distribución tcomo tamaños de muestra en la práctica se usa sólo una.

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 5/16

Teoría de pequeñas muestras

Distribución t de Student:• La principal diferencia de la nueva tabla es que se dispone de forma diferente

su información: – (a) en la fila superior se disponen sólo regiones críticas, tradicionalmente 0,05, 0,01 y

0,001 (que son las proporciones del cuerpo de la tabla de distribución Z y que secorresponden con puntuaciones Z críticas).

 – La columna de la extrema izquierda proporciona los grados de libertad ya calculados. – El cuerpo de la tabla contiene puntuaciones t críticas, aunque en una curva de

puntuaciones t, éstas son usadas de la misma manera que las puntuaciones Z

• Las puntuaciones t, sin embargo, se calculan del mismo modo que laspuntuaciones Z, usando la misma fórmula, pero buscando sus resultados en lanueva tabla.

 X 

 xS 

 X  X t 

=

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 6/16

Teoría de pequeñas muestras

Distribución t de Student:• NOTAS IMPORTANTES:

 – Note que para tamaños de muestra (n n - 1) mayores a 120 o 200, las puntuacionest coinciden con las puntuaciones Z, lo que es lógico debido a que la forma de ladistribución que era “aproximadamente normal” llega a ser normal con n > 120.

 – Pero subiendo por las columnas de puntuaciones t, éstas son mayores que losvalores Z necesarios para alcanzar las proporciones de las regiones críticas. Esto sedebe a que con muestras pequeñas hay mayor error y los valores t estarán másalejados de la media en una distribución aproximadamente Normal.

n > 120

Curva de dist. t, n = 20

Z = 1,64 t = 1,725

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 7/16

Teoría de pequeñas muestras

Aplicaciones importantes de la Distribución t:

• Contraste de hipótesis sobre una media. – Sirve para tomar decisiones acerca del verdadero valor poblacional que

corresponde al parámetro media. – Se trabaja sólo con una muestra aleatoria. – Se tiene solo un parámetro. – Como se tiene una muestra pequeña, se usa el estadístico t y la tabla de

distribuciones t. – Para contrastar la hipótesis Ho de que una población normal tiene medida

usamos el estadístico t que es similar al Z con una modificación leve:

Nótese que su distribución es una t de Student con N -1 gl

o bien,t = y−

S ∗ n−1

t =  y−S 

 n−1

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 8/16

Aplicaciones importantes de la Distribución t:• Contraste de hipótesis sobre diferencia de medias.

 – En vez de tomar sólo una muestra y contrastar el valor de una estadísticocon respecto a una parámetro de la población, se quiere establecer si dos

muestras independientes provienen de la misma población (y por tanto losestadísticos calculados en ellas serían iguales).

 – Usualmente se toman dos muestras n1 y n2 que provienen de poblacionesnormales.

 – Estas muestras tienen medias y desviaciones típicas S1 y S2,

respectivamente

Teoría de pequeñas muestras

 y1;  y2

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 9/16

• Aplicaciones importantes de la Distribución t:

• Contraste de hipótesis sobre diferencia de medias.

 – Necesitamos además, del cumplimiento de un nuevo supuesto, la llamadahomocedasticidad u homogeneidad de varianzas. Es decir, tenemos queasumir que las varianzas poblacionales son iguales (σ2

1 = σ22 = σ2), es decir 

sólo sería necesario estimar una vez σ2. No obstante como tenemos S21 y

S22 de dos muestras, debemos usar la informacion de ambas para estimar 

nuestra varianza poblacional. > ESTA ES LA OPORTUNIDAD DE USAR DOSMUESTRAS EN VEZ DE UNA SOLA PARA ESTIMAR UN PARÁMETRO.

Teoría de pequeñas muestras

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 10/16

• Aplicaciones importantes de la Distribución t:

• Contraste de hipótesis sobre diferencia de medias.

 – Para suponer que hay presencia de homocedasticidad debo tener:

• Tamaños muestrales grandes.• Tamaños iguales o aproximadamente iguales en ambas muestras• Distribución normal de la variable en la muestra, aunque las 2

condiciones previas permiten que violaciones de este supuesto nosean tan graves

• NO SE PUEDE APLICAR EL SUPUESTO CON TAMAÑOS MUY

DESIGUALES

Teoría de pequeñas muestras

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 11/16

Aplicaciones importantes de la Distribución t:• Contraste de hipótesis sobre diferencia de medias.

 – Para contrastar la H0 de que las muestras provienen de la misma población(o sea las medias son iguales), se aplica:

Teoría de pequeñas muestras

Nótese que su distribución es una t de Student con N1 + N2 - 2 gl

donde = n 1∗S 1

2n 2∗S 2

2

n1n 2−2

t = y1− y2

 

1

n1

1

n 2

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 12/16

• Ejercicios

• Hallar los valores de t para los que el área de la cola derecha de la distribución t es 0,05 siel número de grados de libertad es: (a) 16, (b) 27, (c) 200

• Una máquina producía normalmente argollas de 0,05 cms. Para determinar si sigue enbuen estado, se toma una muestra de 10 argollas, que dan un espesor medio de 0,053cms., con desviación típica de 0,003 cms. Contrastar la hipótesis de que la máquina sigue

funcionando bien, con nivel de significación (a) 0,05 y (b) 0,01

• Con el fin de probar un fertilizante, se tomaron al azar 24 parcelas agrarias en una mismaárea, la mitad se trató con el nuevo fertilizante y la otra mitad no. La producción media detrigo en las parcelas sin fertilizante fue de 4,8 toneladas con desviación típica de 0,40toneladas; para la parcela con fertilizante ésta fue de 5,1 toneladas con desviación típica0,36 toneladas ¿Hubo mejora a causa del fertilizante? Asuma un nivel de significación del1% y un nivel de significación del 5%

Teoría de pequeñas muestras

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 13/16

Aplicaciones importantes de la Distribución t:• Contraste de hipótesis sobre diferencia de medias.

¿Y qué pasa si las varianzas (desviaciones típicas) de

ambas poblaciones no son iguales?  – Esto significa que se incumple el supuesto de homogeneidad de varianzas

 – Se requiere usar el estadístico:

Teoría de pequeñas muestras

t ' =  y1−  y2

 S 12

n1

S 22

n2

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 14/16

Aplicaciones importantes de la Distribución t:• Contraste de hipótesis sobre diferencia de medias.

 – Lo malo del estadístico anterior es que no se distribuye exactamente comola t de Student con n

1+ n

2 – 2 grados de libertad

 – Por eso debemos aproximarnos mediante el cálculo de los grados delibertad, usando la siguiente ecuación:

Teoría de pequeñas muestras

EL VALOR OBTENIDOSE REDONDEA ALENTERO MÁSPRÓXIMO

 gl ' =

S 1

2

n1

S 2

2

n2

2

S 1

2/n

12

n1−1

2

2/n

22

n2−1

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 15/16

Aplicaciones importantes de la Distribución t:• Contraste de hipótesis sobre diferencia de medias.

 – La ecuación anterior sin embargo, puede obviarse si:

• Se usa el gl' mínimo: esto es, el menor de n 1 – 1 y n2 – 1 , y si serechaza H0 también la rechazaremos usando la ecuación de gl'

• Si no se rechaza H0,usar el gl' máximo: n1 + n2 – 2, si seguimos sinrechazarla, entonces tampoco lo haremos con gl'

• El único caso donde deberemos calcular gl' es:

 – Cuando mantengamos H0 usando gl mínimo y la rechazamos congl' máximo

Teoría de pequeñas muestras

5/13/2018 Distribuci n-en-peque as-muestras - slidepdf.com

http://slidepdf.com/reader/full/distribucion-en-pequenas-muestras 16/16

Aplicaciones importantes de la Distribución t:• EJEMPLO: PRUEBA t' diferencia de medias bajo incumplimiento del

supuesto de homogeneidad de varianzas.

 – Se lleva a cabo un experimento para ver si usar dibujos facilita o entorpece

el aprendizaje de palabras en niños de 3 y 4 años. Se toma una muestra de80 niños, a 50 de ellos se les enseñan palabras sin usar ilustraciones y conlos otros 30 sí se usan dibujos. Tras el entrenamiento se calcula la mediade palabras aprendidas por niño y se tiene que la media y desviación grupo1 es: 19 y 16 y la media y desviación grupo 2 es 30 y 21.Usando un nivel designificación 0.05 ¿qué podemos decir sobre la hipótesis de que ambasmuestras proviene de la misma población?

Teoría de pequeñas muestras