Capítulo 7 Estimación de Parámetros Estadística Computacional.

Post on 23-Jan-2016

260 views 1 download

Transcript of Capítulo 7 Estimación de Parámetros Estadística Computacional.

Capítulo 7 Capítulo 7 Estimación de Estimación de ParámetrosParámetros

Estadística Computacional

Algunas consideracionesprevias

Conceptos básicos Distribuciones usadas en InferenciaTeoremas relevantesEstimación puntualEstimación por intervalos

Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia

1.- Ji-Cuadrado con “n” grados de libertad.Sea X1, X2,...,Xn n v.a. continuas independientes tal que Xi ~ N (0,1) i = 1,n (i.i.d.)

~ donde)(n

n

iiXY 2

1

2

)()( yIn

eyyf

Rn

yn

Y

22 2

21

2

donde

OBS:

1.

2.

3.

0

1 dyey y

nYE nYVar 2

2

22 ;)(

nn

2)21()(n

Y tt

nYE

nYVar 2

y

)( yfY

TABLA

Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia

2.- t-Student Sea X v.a.c. tal que X ~ N (0,1)

Y v.a.c. tal que Y ~ 2(n)

Sea ~

)(nStudentt

nY

Xt

)()( tIn

n

ntn

tf R

n

T

2

12

1 2

12

OBS:

1.

2.

3.

0tE 2

n

ntVar

tTPtFT )(

existenotT )(

TABLA

t

)( yfT

Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia3.- F-de FisherSea X v.a.c. tal que X ~ 2(n)

Y v.a.c. tal que Y ~ 2(m) independientes

Sea ~ ),( mnF

mYnX

Z

)()( zI

zmn

zKzf

Rmn

n

Z

2

12

1

siendo

OBS:

1.

2.

2

22

2n

mn

mn

mn

K

2

m

nZE

)()()(42

222

2

mmnmnm

ZV

TABLA zZPzFZ )(

2

m

nZE z

)(zfZ

Teoremas LímitesTeoremas Límites•Convergencia en Distribución:

x pto. continuidad

•Convergencia en Probabilidad:

>0•Nota:

)()( xFxFlimssiXX XXnD

n n

0 XXPlimssiXX nnP

n

XXXX Dn

Pn

Desigualdad de Chebyshev:

Sea X v.a. /

Entonces

XE XV ;

2

XVXEXP

Ley débil de los grandes números:

suc. de v.a.i.i.d. /

entonces:

RXE

2XV

NnnX

0 nn XPlim

Teorema Central de Límite:

Sea {X} suc. de v.a.i.i.d /

finitas. Entonces:

XE 2XV;

)1,0(N

n

XY Dn

n

El objetivo de la estimación de parámetros es proveer de métodos que permitan determinar con cierta precisión, el valor de los parámetros desconocidos de un modelo estadístico a partir de una muestra extraída al azar de una Población.

1. Método de estimación Puntual2. Método de estimación por Intervalos

Estimación de ParámetrosEstimación de Parámetros

Definición de EstimadorDefinición de EstimadorUn estimador es una regla que nos indica cómo obtener un parámetro de un modelo, basándose en la información contenida en una muestra ( M={ f ( x , ) : modelo )

T :

x T (x) = T (X1, X2,...., Xn)

T (x) : Estimador de , variable aleatoria, función de la muestra, que no depende del parámetro .

(Estadística basada en la Información )

={x : x es una muestra aleatoria} Espacio de Información

En lo que sigue = T (X1, X2,...., Xn) estimador de .

Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales

Un estimador es una v.a. y todo juicio sobre él, se basará en su ley de Probabilidad, y más específicamente sobre su Esperanza y Varianza.

1. se dice que es insesgado

2. se llama sesgo de

3. se llama error cuadrático medio del estimador

4. se dice que es consistente

nXXTEE ,...,ˆ1

ˆEB

ˆˆˆ 2BVarECM

1ˆlim Pn Wˆ

Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales

5. Si , decimos que es un estimador insesgado de varianza mínima para . Si todo otro estimador insesgado de , digamos , se verifica que:

6. Sea X1, X2,..., Xn m.a. f ( x , ). Si es:

Nota: Si es eficiente

ˆE

~ˆ VarVar ~

1

2

),(lnˆˆ xf

nEVarE

ˆ),(lnˆ

12

xfnEVar

7. Sean dos estimadores de . Se llama

eficiencia relativa de a:

8. es un estimador suficiente si usa toda la información contenida en la muestra.

21 ~ˆ y

1

212

ˆ

~ˆ,~

ECMECM

ef

12 ˆ/~ rc

Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales

Métodos de estimación puntual

Método de Momentos Método de Máxima Verosimilitud Método de Mínimos Cuadrados

Momentos (K. Pearson)Momentos (K. Pearson)

rir

r xn

mXE1

La idea es simple. Consiste en igualar los momentos de la población y de la muestra

Máxima VerosimilitudMáxima VerosimilitudConsideremos X = (X1, X2,..., Xn ) m.a. f ( x , ). Se llama función de verosimilitud a:

Además se define:

función soporte:

función score:

El valor (vector) de que maximiza se llama estimador máximo verosimil, i.e.

(caso univariado)

n

iixfxf

1

0 ,,

lnL

L

L

00 2

2

LL

Propiedades de los Estimadores Máximo Verosímiles

Propiedades de los Estimadores Máximo Verosímiles

Los estimadores máximo verosímiles son:

Asintóticamente insesgadosAsintóticamente normalesAsintóticamente eficientesInvariantes bajo transformaciones biunívocasSi estimador suficiente, es suficienteMV

Sea X1, X2,..., Xn m.a. N ( , 2 ).

Encontrar el EMV de

2

222

21

2

iX X

nL ln,

2

22

1222

iXn

X e,

4

22

20

0

Sn

Sn

SXH ,

2 ,

222 0 nnX SXL

,

En general:

6

2

4

42

22

2

2

2

2

2

2

12

iXn

Xnn

L

LL

H ,

:= Matriz de Información de Fisheresperada.

:= Matriz de Información observadaen la muestra.

2 ,HE

2SXH ,

IE

IO

OBS: Caso escalar

Se dice que es un estimador eficiente de

..RCL

E

1

2

2

..~ RCV ~

Estimación por IntervalosEstimación por Intervalos

En la práctica, interesa no sólo dar una estimación de un parámetro, sino que además, un intervalo que permita precisar la incertidumbre existente en la estimación.Definición: Sea x m.a. f ( x , ). Sean 1=T1(x),

2=T2(x) dos estadísticas de : T1 T2 x ;

P 1 2 = 1 - =

Entonces el I = 1 ; 2 se llama intervalo aleatorio

de confianza del 100 % para ( 0 < < 1 ).

Fijado , el problema de determinar 1 y 2 puede resolverse encontrando una variable aleatoria Q(x,) cuya distribución esté totalmente definida, que sea independiente de .

La variable Q(x,) se denomina “Cantidad Pivotal”

Estimación por IntervalosEstimación por Intervalos

Ejemplo: X1, X2,..., Xn1 N ( 1 ,21)

Q(x,)= Q(x,)=)1,0(~11

11N

n

X

)1(

11

11 ~

ntnS

X

1. Encontrar una cantidad Q.2. P q1 Q q2 = 1 - =

3. Invertir P 1 2 = , obteniendo así un intervalo I=1 ; 2 de confianza para de nivel

100 %.

Observación: Para muestras grandes la v.a. Q siempre existe, ya que si , entonces

tiene distribución asintóticamente normal estándar.

MV MV

MV

ˆ

ˆ

Método de la Cantidad PivotalMétodo de la Cantidad Pivotal

Intervalo de Confianza para diferencia de medias

Intervalo de Confianza para diferencia de medias

P1: X1, X2,..., Xn1 N ( 1 ,21)

P2: Y1, Y2,..., Yn2 N ( 2 ,22)

Supuesto: Poblaciones Normales

)1,0(11

11N

n

X

),( 1022

22N

n

Y

)( 1

22

1

211

1

1

n

Sn

)( 1

22

2

222

2

1

n

Sn

~

~

~

~

)( 2

22

2

222

21

211

21

11

nn

SnSn

)( 2

22

221

21

2

nn

PSnn

~

~

Asumiendo independencia de las muestras :

22

21 Si

2

21

2121

2111

nn

P

t

nnS

XXQ

~

21

222121

1121 nn

StXXI Pnn,)(

Finalmente:

Es un Intervalo de confianza de nivel para 1 - 2

2

22

1

21

22121 n

SnS

tXXIg,

)(

Supongamos que

Siendo g = n1 + n2 - 2 - grados de libertad

22

21

2

212

12

22112

11

11''

''

SnSn

SnSn

21,' i

nS

Si

ii

Intervalo de Confianza para 12/2

2Intervalo de Confianza para 12/2

2

.., lgFS

SF nn 112

22

2

21

21

21

~

Recordemos que:

)( 1

22

1

211

1

1

n

Sn

)( 1

22

2

222

2

1

n

Sn

~ ~

2

1

22

21

22

21

22

21

22

S

SF

S

SFI ba

donde 1ba FFFP

2FFa 2FFb Si Se obtiene el intervalo de iguales colas;

Resumen: Intervalos de Confianza

Poblaciones NormalesPoblaciones no Normales

Parámetro Estadística Distribución Intervalo

, conocido

, desconocido

1 - 2 1 = 2

1 - 2 1 2

muestra grande

N (0,1)

N (0,1)

221 nnt

1nt

221 nnt

12n2

21

2121

11nn

S

XX

P

2

22

1

21

2121

nS

nS

XX

MV

MV

ˆˆ

2

21

Sn

S

Xn

Xnn

zX 2

nStX 2

2

2

2

212

2 11

SnSn

;

21

22111nn

StXX P

2

22

1

21

221nS

nS

tXX

MVMV z ˆˆ

2