INTRODUÇÃO À INFERÊNCIA...

14
&

Transcript of INTRODUÇÃO À INFERÊNCIA...

Page 1: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

UFPE - Universidade Federal de Pernambuco

Departamento de Estatística

Disciplina: ET-406 Estatística Econômica

Professor: Waldemar A. de Santa Cruz Oliveira Júnior

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Podemos dividir a estatística em três grandes áreas

1 Conceitos Básicos

De�nição 1 População:�Conjunto de valores de uma característica (observável) associada a uma

coleção de indivíduos ou objetos de interesse.� (Bolfarine & Sandoval).

De�nição 2 Parâmetro: é uma característica numérica da população. Exem-plo: média, variância, máximo, etc.

De�nição 3 Amostra: é qualquer subconjunto da população.

De�nição 4 Estatística: é uma característica numérica da amostra. Exem-plo: média amostral, variância amostral, máximo da amostra, etc.

1

Page 2: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Podemos dizer que o objetivo principal da Inferência Estatística é a partirde uma amostra especi�car valores para o parâmetro da população.

De�nição 5 Espaço Paramétrico: dado um modelo estatístico especi�cadopor um parâmetro θ, de�ne-se como espaço paramétrico Θ o conjunto dospossíveis valores que o parâmetro θ pode assumir.

Exemplo 1 Considere uma amosrta de VA's (X1, · · · , Xn) independentes eidenticamente distribuídas, pertencente as seguintes populações:

N(µ, σ2),Θ = { } Bin(n, p),Θ = { } exp(θ),Θ = { }

Obs: Durante o curso vamos sempre considerar que uma amostra é com-posta de VA's independentes e identicamente distribuídas.

Já vimos a de�nição de estatística, porém, em outras palavras, podemosdizer que uma estatística T (X1, · · · , Xn) é uma função da amostra nos reais

T : (X1, · · · , Xn) −→ R.

Exemplo:

De�nição 6 Se a estatística T (X1, · · · , Xn) assume valores apenas no con-junto paramétrico Θ, então, dizemos que ela é um estimador para θ.

Exemplo:

2

Page 3: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

É comum representar um estimador para um parâmetro θ, β, α, usando�um chapeu�, θ̂, β̂, α̂, etc.

De�nição 7 Estimativa: é um particular valor do estimador.

Exemplo:

2 Distribuições Amostrais

De�nição 8 A distribuição amostral de uma estatística T é o conjunto for-mado pelas possíveis estimativas de T e suas respectivas probabilidades.

Exemplo 2 Considere o comjunto X = {2, 4, 8, 10} e a estatística T (X1, X2) =X1+X2

2. Então, a distribuição amostral de T é dada por

Como podemos observar uma estatística é uma VA, assim, podemos cal-cular seu valor esperado e sua variância.

Exemplo 3 Exemplo: Encontre a esperança e a variância da estatística doexemplo anterior.

Exemplo 4 Exemplo: Consirenado os dois últimos exemplos, compare a mé-dia e a variância populacional com a amostral.

3

Page 4: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Observe que as médias são iguais e a variância amostral é metade dapopulacional. Isto não é coincidência, deve-se ao seguinte teorema:

Teorema 1 Sejam X uma VA, X1, · · · , Xn uma amostra aleatória simplesde X, E[X] = µ e Var[X] = σ2, então,

E[X̄] = µ e Var[X̄] =σ2

n.

Dem.

3 Teorema do Limite Central

Um dos mais importantes resultados da estatística é o Teorema do LimiteCentral em que a�rma que em determinadas condições bastante gerais épossível aproximar uma soma de V.A's a uma distribuição normal.

Comecemos relembrando algumas propriedades da distribuição normalcom o seguinte exemplo.

Exemplo 5 (Exemplo 7.9 pg 179 (Bussab, W. O. & Morettin, P. A.)) Osdepósitos efetuados no Banco da Ribeira durante o mês de janeiro são dis-tribuídos normalmente, com média $10.000,00 e desvio padrão de $1.500,00.Um depósito é selecionado ao acaso dentre todos referentes ao mês em ques-tão. Encontre a probabilidade de que o depósito seja:a) $10.000,00 ou menos;b) pelo menos $10.000,00;c) um valor entre $ 12.000,00 e $15.000,00;d) maior que $ 20.000,00.

4

Page 5: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Teorema 2 (Soma de normais é normal) Sejam X1, · · · , Xn variáveis alea-tórias independentes, tais que, X1 ∼ N(µ1, σ

21), · · · , Xn ∼ N(µn, σ

2n). Então,

a variável aleatória X = X1 + · · · +Xn tem distribuição normal com médiaµ = µ1 + · · ·+ µn e variância σ2 = σ2

1 + · · ·+ σ2n. Ou seja, X ∼ N(µ, σ2).

Exemplo 6 Voltando ao exemplo 5, suponha que no mês em questão osdepósitos no Banco SA têm uma distribuição normal com média $8.000,00e variância $4.000.000. Selecionando-se um depósito no Banco da Ribera eoutro no Banco SA, qual a probabilidade da soma desses depositos ser maiorque $20.000?

Teorema 3 (Teorema do Limite Central) Sejam X1, · · · , Xn variáveisaleatórias independentes, tais que, E[Xi] = µi, Var[Xi] = σ2

i , com i =1, · · · , n. Considere a variável aleatória X = X1 + · · · + Xn, portanto, Xtem média µ = µ1 + · · ·+ µn e variância σ2 = σ2

1 + · · ·+ σ2n. Então,

Z =X − µ√

σ2

D−→ N(0, 1).

Ou seja, Z é aproximadamente uma normal padrão.

Exemplo 7 (Exercício 12.6 Meyer, pg. 281) Suponha que os Xi's comi = 1, · · · , 50 sejam variáveis aleatórias independentes e identicamente distri-buídas segundo uma Poisson com parâmetro λ = 0, 03. Faça S = X1+· · ·+Xn

e calcule a P (S ≥ 3).

5

Page 6: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

O Teorema a seguir é um corolário do Teorema do Limite Central.

Teorema 4 Sejam X1, · · · , Xn variáveis aleatórias independentes e indenti-camente distribuídas, tais que, E[Xi] = µ e Var[Xi] = σ2, com i = 1, · · · , n.Considere a variável aleatória X = X1 + · · ·+Xn. Então,

Z =X̄ − µ√

σ2

n

D−→ N(0, 1).

Ou ainda,

Z =

√n(X̄ − µ)

σ

D−→ N(0, 1).

Ou seja, Z é aproximadamente uma normal padrão.

Exemplo 8 Considere uma amostra de VA's X1, · · · , X16i.i.d∼ (5, 9). Calcule

a P (6 ≤ X̄ ≤ 8). Qual deveria ser o tamanho n da amsotra para que P (3 ≤X̄ ≤ 7) = 0, 9?

Exemplo 9 Uma moeda tem probabilidade p de aparecer cara em um lança-mento. Encontre a distribuição amosrtal da proporção de caras que apareceem n lançamentos desta moeda.

Exemplo 10 No exemplo 7 calcule a probabilidade da média dos X1, · · · , X50

ser menor que 0,012.

6

Page 7: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

De�nição 9 Dada uma amostra de VA's (X1, · · · , Xn), o Erro Amostral

e(θ) do estimador θ̂ do parâmetro θ é a diferença entre a estimativa desse

estimador baseada na amostra e o parâmtero. Ou seja, e(θ) = θ̂ − θ.

Exemplo 11 Dada uma amostra de VA's (X1, · · · , Xn)i.i.d∼ (µ, σ2), então, o

erro amostral da média tem aproximadamente distribuição normal com médiazero e variância σ2/n.

Exemplo 12 Sejam X1, · · · , Xn uma seuência de VA's independentes e iden-ticamente distribuídas com média 10 e variância 16. Encontre o tamanho deuma amostra para que com probabilidade 0, 9 o módulo do erro amostral sejamenor que 2.

Exemplo 13 Sejam X1, · · · , Xn uma seuência de VA's independentes e iden-ticamente distribuídas com média µ e variância σ2. Encontre o tamanho deuma amostra para que com probabilidade γ o módulo do erro amostral sejamenor que ε.

7

Page 8: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

4 Propriedades dos Estimadores

Nosso objetivo neste curso será encontrar bons estimadores. Mas, o que éum estimador bom? Para responder esta pegunta vejamos o exemplo 11.2pag 290 do livro Estatística Básica (Bussab & Morettin). A �gura abaixo éuma cópia da página 291 do mesmo livro e representa o resultado de 15 tirosdados por 4 ri�es diferentes.

A acurácia mede a proximidade de cada observação do valor alvo que seprocura atingir. A precisão mede a proximidade de cada observação da médiade todas as observações. (Bussab & Morettin)

De�nição 10 Um estimador θ é dito não-viesado para θ, se E[θ̂] = θ, para

todo θ ∈ Θ. E a diferença Bθ(θ̂) = E[θ̂]− θ é chamada de viés.

Exemplo 14 A média amostral X̄ é um estimador não-viesado para µ =E[X].

Exemplo 15 O estimador σ̂2 =∑n

i=1(Xi−µ)2

né um estimador não-viesado

para a variância.

8

Page 9: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Exemplo 16 O estimador σ̂2 =∑n

i=1(Xi−X̄)2

né um estimador viesado para

a variância.

Exercício: Faça uma transformação neste último estimador para que ele passea ser não-viesado.

De�nição 11 O Erro Quadrado Médio EQM de um estimador θ̂ para um

parâmetro θ é de�nido como EQM(θ̂, θ) = E[(θ̂ − θ)2

].

Exemplo 17 Considere uma X1, · · · , Xni.i.d∼ N(µ, σ2). Sejam a média amos-

tral X̄ e σ̂2 =∑n

i=1(xi − x̄)2/n, estimadores para a média e a variância po-pulacional, encontre o erro quadrado médio desses estimadores. (Obs. Nestecaso pode-se mostrar que Var[S2] = 2σ4

n−1.)

Exemplo 18 Mostre que EQM(θ̂, θ) = Var[θ̂] +(Bθ(θ̂)

)2

.

De�nição 12 Uma sequência de estimadores T1, T2, · · · , Tn de θ é consis-tente se limn→∞ E[Tn] = θ e limn→∞Var[Tn] = 0.

Exemplo 19 A média amostral X̄ é um estimador consistente de µ = E[X].

Exemplo 20 Sejam X1, · · · , Xni.i.d∼ N(µ, σ2), então, S2 =

∑ni=1

(Xi−X̄)2

n−1é

um estimador consistente de σ2. (Obs.: (n−1)S2

σ2 ∼ χ2(n−1)).

9

Page 10: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Exemplo 21 Sejam X1, · · · , Xni.i.d∼ N(µ, σ2), então, σ̂2 =

∑ni=1

(Xi−X̄)2

um estimador consistente de σ2.

De�nição 13 Sejam T1 e T2 dois estimadores não-viesados para um parâ-metro θ, então, dizemos que T1 é mais e�ciente que T2, se Var[T1] < Var[T2].

5 Estimação Pontual

Na seção anterior estudamos critérios para avaliar a qualidade de um esti-mador. Nesta seção veremos três métodos para obter estimadores, a saber:método dos momentos, método de máxima verossimilhança e método de mí-nimos quadrados. Esses três métodos são considerados pontuais porque osestimadores produzem estimativas para os parâmetros. Na estimação inter-valar, estudada mais adiante, determinaremos um intervalo que, com umacerta probabilidade γ, contem o parâmetro a ser estimado.

5.1 Método do Moemntos

De�nição 14 O k-ésimo momento populacional de uma VA X é dado por

µk = E[Xk] =

∫xkf(x)dx.

Considere uma amostra aleatória (X1, · · · , Xn) desta variável X, o k-ésimomomento amostral é de�nido por

mk =

∑ni=1X

ki

n.

De�nição 15 Seja θ = (θ1, · · · , θr), então, θ̂ = (θ̂1, · · · , θ̂r) é o estimadorobtido pelo método dos momentos para θ se ele é o conjunto de soluções dasequações

mk = µk,

com k = 1, 2, · · · , r.

10

Page 11: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Exemplo 22 Considere a VA X ∼ N(µ, σ2), obtenha pelo método dos mo-mentos os estimadores para a µ e σ2.

Observação: Podemos ter mais um estimador para o mesmo parâmetro.

Exemplo 23 Considere a VA X ∼ exp(λ), obtenha pelo método dos mo-mentos os estimadores para a média e a variância.

Exemplo 24 Considere a VA X ∼ Poisson(λ), obtenha pelo método dosmomentos o estimador para λ.

5.2 Método dos Mínimos Quadrados

Dada uma sequência de VAs (X, Y ) = {(X1, Y1), · · · (Xn, Yn)}, neste métodosupomos que a VA Y pode ser explicada pela VA X através de um modeloda forma

Y = g(X|θ) + ε,

em que ε é um erro aleatório.Assim, o estimador de mínimos quadrados θ̂MQ é de�nido como θ que mi-

nimiza a soma dos quadrados dos erros S(θ) =∑n

i=1 ε2i . Portanto, o método

de mínimos quadrados resume-se a encontrar θ que minimiza a função

S(θ) =n∑

i=1

ε2i =n∑

i=1

(Yi − g(Xi|θ))2 .

Exemplo 25 Com base na amostra (X,Y ) = {(2, 6), (3, 9), (5, 15)} deter-mine a estimativa de mínimos quadrados para o parâmtero θ do modeloY = θX.

11

Page 12: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Exemplo 26 Encontre o estimador de mínimos quadrados para o parâmteroθ do modelo Y = θX.

5.3 Método de Máxima Verossimilhança

Este método é um dos mais utilzado e foi proposto por Ronald Aylmer Fisherquando ainda cursava o seu terceiro ano da graduação. Basicamente a ideia éescolher dentre todos θ ∈ Θ o que maximiza a função de densidade conjuntada amostra.

De�nição 16 Considere uma sequência de VA's X = (X1, · · · , Xn) identi-camente distribuídas, cada uma com função de densidade f(Xi|θ), no casocontínuo, e funçao de probabilidade p(Xi|θ) no caso discreto, ambas deter-minadas pelo parâmetro θ. A função de verossimilhança L(θ|X) da amostraX é de�nida como a função de densidade (ou de probabilidade) �xada naamostra e tendo como argumento o parâmetro θ. Ou seja, dado que as VA'ssão independentes, temos que

L(θ|X) =n∏

i=1

f(Xi|θ) ou L(θ|X) =n∏

i=1

p(Xi|θ).

Exemplo 27 Encontre a função de verossimilhança de uma amostra nor-mamalmente distribuída de tamanho n.

Exemplo 28 Encontre a função de verossimilhança de uma amostra aleató-ria simples de tamanho 2 retirada da população X{2, 4, 6}, cuja P (X = 2) =p1, P (X = 4) = p2 e P (X = 6) = p3.

De�nição 17 O Estimador de Máxima Verossimilhança θ̂MV é de�nido comoθ que maximiza a função de verossimilhança.

12

Page 13: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Exemplo 29 Considere a VA X ∼ exp(λ), obtenha pelo método de máximaverossimilhança o estimador para λ.

De�nição 18 Devido a complexidade de trabalhar com um produto de fun-ções é comum usar o logaritmo desse produto. Assim, de�ne-se a funçãolog-verossimilhança l(θ) como o logaritmo da função verossimilhança. Ouseja,

l(θ) = log(L(θ|X)).

Obs: O valor θ que maximiza a função verossimilhança é o mesmo quemaximiza a função escore.

Exemplo 30 Considere a VA X ∼ exp(λ), usando a função escore obtenhapelo método de máxima verossimilhança o estimador para λ.

Exemplo 31 Considere a VA X ∼ N(µ, σ2), obtenha pelo método de má-xima verossimilhança o estimador para µ e σ2.

Exemplo 32 Considere a VA X ∼ Bernoulli(p), obtenha pelo método demáxima verossimilhança o estimador para p.

Exemplo 33 Considere a VA X ∼ Binomial(n, p), obtenha pelo método demáxima verossimilhança o estimador para p.

13

Page 14: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICAestatisticaeconomica.weebly.com/uploads/3/7/8/6/37866339/aula_04_infer... · 3 Teorema do Limite Central Um dos mais importantes resultados

Referência Bibliográ�ca:Bussab, W. O. & Morettin, P. A. (2002), Estatística Básica, 5a Edição,

Editora: Saraiva.Meyer, P. (1969), Probabilidade: Aplicações à Estatística. Ao Livro Téc-

nico.Mood, A.M.; Graybell, F.A. & Boes, D.C. Introduction to the Theory of

Statistics, 3a Edition, McGraw-Hill, Singapore: 1974.Morettin, L. G. (2009), Estatística Básica: Probabilidade e Inferência,

Volume Único, Pearson Education.

14