Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral...

20
Estadística 2018 - Prof. Tamara Burdisso Fundamentos para la inferencia 1

Transcript of Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral...

Page 1: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Fundamentos para la inferencia

1

Page 2: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

2

Distribución muestral de la varianza muestral

• Hasta aquí nos ocupamos de hacer inferencia sobre la media y/o la proporción de una población. Ahora nos enfocamos en la varianza poblacional.

• Supongamos que extraemos una muestra de tamaño n de una población con media y varianza . Sean la muestra. La varianza poblacional es la esperanza de

• Claramente es desconocida, pero ya sabemos como estimarla. Y además sabemos como obtener una estimación de

• se denomina varianza muestral y el desvío típico ó desviación estándar muestral

X2

X nXXX ,....,, 21

( ) 22

XX XE −=

X

2

X( )

=

−−

=n

i

iX XXn

s1

22

1

1

2

XsXs

Estadística 2018 - Prof. Tamara Burdisso

Page 3: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Distribución muestral de la varianza muestral

• Por qué en lugar de ?

• Podemos probar que la esperanza de la varianza muestral, i.e. la media de la distribución muestral de la varianza muestral, converge a la varianza poblacional. Matemáticamente

• Notar que sólo se afirma que la media de la varianza muestral converge a la varianza poblacional. Pero nada se dijo sobre la forma de la distribución muestral de la varianza muestral.

• Para poder caracterizar la distribución muestral de la varianza muestral se debe saber más acerca de la distribución poblacional .

1−n n

nXXX ,....,, 21

( ) 22

XXsE =

Estadística 2018 - Prof. Tamara Burdisso3

Page 4: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Distribución muestral de la varianza muestral

• Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

• sigue una distribución (ji o chi cuadrado) con grados de libertad.

• Notar que la distribución sólo está definida para valores positivos, lo cual resulta adecuado para la varianza muestral, ya que no puede ser negativa.

2

( ) 2

12

1

2

2

2)1(

=

=

−=

=− n

i X

i

X

n

i

i

X

X XXXX

sn

2

1−n

Estadística 2018 - Prof. Tamara Burdisso4

Page 5: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Distribución muestral de la varianza muestral

• La familia de está caracterizada por un único parámetro: los grados de libertad a los que llamaremos y se lo anota como

• La media y la varianza de la son

• En nuestro caso la variable aleatoria sigue una distribución

• Esto quiere decir que

2

( ) ( ) kVarkE kk 2y 22 ==

k2

k

2

k

2

2)1(

X

Xsn

2

1−n

( ) 11

1)1( 2

22

2

−=−

−=

−nsE

nn

snE X

XX

X

( ) 22

XXsE =

Estadística 2018 - Prof. Tamara Burdisso5

Page 6: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Distribución muestral de la varianza muestral

• Para hallar la varianza de usamos el hecho de que

• Ejemplos de

2

Xs

( )( ) ( ) ( )12

112

)1( 2

4

2

2

2

−=−

−=

−nsVar

nn

snVar X

XX

X

( )( )12 4

2

−=

nsVar X

X

2

k

Estadística 2018 - Prof. Tamara Burdisso6

Page 7: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Funciones de densidad de la distribución chi cuadrado

Estadística 2018 - Prof. Tamara Burdisso7

Page 8: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

8

Condiciones para el buen funcionamiento del TCL

Unidad 3 – Parte IEstadística 2018 - Prof. Tamara Burdisso

8

Page 9: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Por lo tanto, la distribución muestral de la varianza muestral

• Sea la varianza muestral de una muestra aleatoria de n observaciones i.i.d. extraídas de una población con media y varianza . Entonces se tiene que:

i. La distribución muestral de tiene media , i.e

ii. La varianza de la distribución muestral de depende de la distribución de la población. Si la distribución poblacional es normalentonces

iii. Si las v.as. de la distribución subyacentes son normales i.i.d., entonces

2

Xs

X2

X

2

12

2

unasegún distribuye se)1(

−n

X

Xsn

( ) 22

XXsE =2

X2

Xs

2

Xs

( )( )12 4

2

−=

nsVar X

X

Estadística 2018 - Prof. Tamara Burdisso9

Page 10: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Aplicación para la varianza muestral

• Se quiere someter a todos los empleados de cierta institución a una evaluación de 100 preguntas de elección múltiple. Inicialmente en un estudio piloto se someten a este test a 20 empleados elegidos al azar. Supongamos que, para la población completa de todos los empleados, la distribución del número de respuestas correctas sigue una distribución normal con varianza 250.

1. ¿Cuál es la probabilidad de que la varianza muestral sea menor que 100?

2. ¿Cuál es la probabilidad de que el desvío típico muestral sea mayor a que 21?

Unidad 3 – Parte IIEstadística 2018 - Prof. Tamara Burdisso

10

Page 11: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Propiedades de los estimadores puntuales

• Parámetro: es una medida numérica descriptiva de una población. Su valor es casi siempre desconocido

• Estadístico/estimador: un estadístico es cualquier función de una muestra de datos aleatoria proveniente de una población.

• Estimación: una estimación es el valor numérico del estimador cuando el mismo es evaluado utilizando los datos de una muestra específica.

• Un estimador es una variable aleatoria, ya que hereda la aleatoriedad de la muestra aleatoria, mientras que una estimación es un número no aleatorio.

11

Page 12: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Propiedades de los estimadores puntuales

• Un estimador puntual de un parámetro poblacional es una función de la muestra que genera un único valor llamado estimación puntual.

• Por ejemplo, la media muestral es un estimador puntual de la media poblacional , y el valor que toma para un conjunto específico de datos se llama estimación puntual

• ¿Cómo hacemos para saber cual es el mejor estimador puntual de un parámetro poblacional?

• Existe un conjunto de criterios con los que se puede evaluar a un estimador.

• Tres son las propiedades deseables que debería poseer un estimador: consistencia, ausencia de sesgo e eficiencia.

X

X

x

12

Page 13: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Insesgamiento

• Estimador insesgado: Un estimador puntual es un estimador insesgado de un parámetro poblacional si el valor esperado del estimador es igual al parámetro que se desea estimar

• Notar que lo que se está afirmando es que en promedio el estimador estima correctamente al parámetro poblacional, y no que un determinado valor de tenga que ser exactamente el valor correcto de

• El valor esperado de debería ser la media de los valores de para todas las muestras posibles que se puedan obtener.

( ) =ˆE

13

Page 14: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Insesgamiento

• La media muestral es un estimador insesgado de la media poblacional:

• La proporción muestral es un estimador insesgado de la proporción poblacional:

• La varianza muestral es un estimador insesgado de la varianza poblacional:

• Un estimador que no es insesgado es sesgado.

• Sesgo: Sea un estimador de . El sesgo de es la diferencia entre su valor esperado y ; i.e.

• Por lo tango el sesgo de un estimador insesgado es cero.

( ) =XE

( ) ppE =ˆ

( ) 22 =SE

( ) ( ) −= ˆˆ Esesgo

14

Page 15: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Insesgamiento

Estadística 2018 - Prof. Tamara Burdisso15

Page 16: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Eficiencia

• Es deseable que un estimador sea insesgado, pero puede ocurrir que se disponga de más de un estimador insesgado para un mismo parámetro (p.ej. la media y la mediana bajo distribución normal, ambos son estimadores inesgados de ).

• ¿Cómo elijo en este tipo de situaciones? Lo lógico sería quedarse con aquel estimador que este más concentrado alrededor del parámetro poblacional que se desea estimar.

• Surge entonces la eficiencia de un estimador de la mano de la varianza como medida de concentración

16

Page 17: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Eficiencia

• Si existen varios estimadores insesgados de un mismo parámetro, el estimador insesgado que tiene la mínima varianza, es el estimador más eficiente, o el estimador insesgado de mínima varianza.

• Sean dos estimadores insesgados de , basados en el mismo tamaño de muestra. Se dice entonces que

1. es más eficiente que si

2. La eficiencia relativa de con respecto a es el cociente entre sus varianzas; i.e.

2

1

21ˆyˆ

( ) ( )21ˆvarˆvar

1 2

( )( )2

1

ˆvar

ˆvar

=relativaeficiencia

17

Page 18: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Ejemplo: estimadores insesgados rivales

• Sea una muestra aleatoria estraída de una población normal con media y varianza ¿Se debe utilizar la media muestral o la mediana muestral para estimar la media poblacional?

• Asumimos que la población sigue distribución normal y es de gran tamaño en comparación con el tamaño de la muestra, n.

• La media muestral es un estimador insesgado de , y la mediana muestral también es insesgada. Sus varianzas son:

nxxx ,...,, 21

( )n

X2

var

=

2

X

( )( )

57,1var

var==

X

medianarelativaeficiencia

( )nn

mediana22

57,12

var

==

18

Page 19: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 19

Sesgo e eficiencia

Estadística 2018 - Prof. Tamara Burdisso19

Page 20: Fundamentos para la inferencia - WordPress.com · Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable

Estadística 2018 - Prof. Tamara Burdisso

Propiedades de algunos estimadores

Parámetro

poblacional

Estimador

puntualPropiedades

Media µInsesgado, de máxima eficiencia

(suponiendo la existencia de

normalidad)

Media µ MedianaInsesgado (suponiendo la

existencia de normalidad) pero no

de máxima eficiencia

Proporción P Insesgado de máxima eficiencia

Varianza σ2Insesgado, de máxima eficiencia

(suponiendo la existencia de

normalidad)

p

X

2S

20