Aula 00

13

Click here to load reader

Transcript of Aula 00

Page 1: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

1

APRESENTAÇÃO PESSOAL Meu nome é Vítor Menezes. Sou servidor público desde fevereiro de 2005. Neste tempo, fui Auditor Fiscal da Secretaria de Estado de Fazenda de Minas Gerais, durante um ano e meio, e, desde agosto de 2006, ocupo o cargo de Auditor Federal de Controle Externo do Tribunal de Contas da União, atualmente lotado na Secretaria de Controle Externo de São Paulo.

Sou formado em engenharia eletrônica pelo ITA. Desde 2005 dou aulas em cursos preparatórios para concursos, sempre na área de exatas (matemática financeira, estatística e raciocínio lógico).

APRESENTAÇÃO DO CURSO – ESTATÍSTICA EM EXERCÍCIOS PARA BACEN – ÁREA 4

Este curso terá um modelo bem diferente do último curso de estatística para o Bacen ministrado aqui no Ponto (dado entre outubro e novembro de 2009). Depois que saiu o edital, recebi vários e-mails perguntando sobre aquele curso. Então compensa comparar o curso antigo com o curso novo.

Naquela oportunidade, demos um curso de teoria e exercícios, abrangendo o conteúdo de todas as áreas (2, 3 e 4). Procurou-se abordar todos os tipos de exercícios que podem ser cobrados, mesmo que não se tenham encontrado questões da Cesgranrio sobre dado assunto (nestes casos, utilizaram-se questões de outras bancas). Tratou-se de um curso mais adequado a uma preparação de médio/longo prazo, cheio de exemplos numéricos e exercícios para fixação.

Agora, com o edital já lançado, e com pouco tempo até a prova, o curso será focado na resolução de exercícios da Cesgranrio. Será um curso mais “enxuto”. O pressuposto é que os alunos tenham contato prévio com a matéria. A idéia é revisar os principais assuntos e ver como a Cesgranrio os cobra. Só usaremos questões de outras bancas quando, para um assunto importante, eu não encontrar questões da Cesgranrio.

Para ajudar no entendimento do que estou querendo dizer, posso dar alguns exemplos.

O cálculo da moda de Pearson até poderia ser cobrado, embora seja um assunto pouco comum em provas. Num curso mais detalhado, precisaríamos pegar questões de outras bancas para abordá-lo. Já neste curso, não havendo questões da Cesgranrio sobre tal assunto, ele não será abordado.

A aproximação da distribuição binomial por uma distribuição normal é importantíssima. É cobrada em diversos concursos, muitas vezes em conjunto com outros assuntos, que não fazem parte do nosso edital (como teste de hipóteses e intervalo de confiança). Não havendo questões da Cesgranrio que cobrem exclusivamente esta aproximação (sem associá-la com teste de hipóteses e intervalo de confiança), aí teremos que ir buscar questões de outras bancas, para complementar nosso estudo.

A seqüência de aulas que vou seguir é:

· Aula 1 – Formas de apresentação de dados; medidas de posição.

· Aula 2 – Medidas de dispersão.

· Aula 3 – Probabilidade

· Aula 4 – Distribuição normal e binomial

Page 2: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

2

Se vocês lerem o edital, verão que a descrição das matérias está ligeiramente diferente. Fazendo a associação entre os itens do edital e a seqüência de aulas, temos:

Item do edital Comentários Aula em que será abordado

Histograma e curvas de freqüência:

Trata-se de formas de apresentação de dados

1

Distribuição de freqüências: absoluta, relativa, acumulada

São conceitos necessários para apresentarmos os

dados

1

Medidas de posição: média, mediana, moda e medidas

separatrizes

São medidas que nos dão informações sobre o

posicionamento dos dados

1

Medidas de dispersão (desvio-padrão e coeficiente de

variação)

São medidas que nos dão informações de quanto os dados estão afastados da

média

2

Distribuições de probabilidade (binomial e normal)

Trata-se da relação entre os possíveis valores de

uma variável aleatória e a respectiva probabilidade

(ou densidade de probabilidade)

4

Apesar do edital não falar em probabilidade, esta matéria é pré-requisito para estudo das distribuições de probabilidade. Veremos os exercícios correspondentes na aula 3.

Esta aula demonstrativa contém um trecho da aula 1.

Page 3: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

3

AULA 0 Considere as informações abaixo para responder às questões EC 1 e EC 2

A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas freqüências. Não há observações coincidentes com os extremos das classes.

EC 1. Petrobras 2008 [CESGRANRIO]

O peso médio do conjunto de pessoas, em kgf, é

(A) 60

(B) 65

(C) 67

(D) 70

(E) 75

Resolução.

Esta é a forma de apresentação de dados mais cobrada: temos uma tabela que relaciona os valores (no caso, são classes de valores) às respectivas freqüências.

Classes são faixas de valores. Assim, na primeira classe, estamos tomando os valores de 40 kgf até 50 kgf. Na segunda classe, os valores de 50 kgf até 60 kgf.

Vamos focar na segunda classe:

50 │− 60

Do lado do 50 nós temos um traço vertical. Ele indica que o 50 faz parte desta classe. Assim, um peso de exatamente 50 kgf está computado na segunda classe.

Do lado do 60 não há um traço vertical. Logo, um peso de exatamente 60 kgf não faz parte da segunda classe. É como se a segunda classe, na verdade, incluísse pesos de 50 até 59,9999... kgf.

Uma outra forma de representar a mesma classe é:

[50; 60)

Colocamos um colchete ao lado do número que pertence à classe e um parêntesis ao lado do número que não pertence à classe.

Page 4: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

4

O 50 é dito limite inferior desta classe. O 60 é o limite superior. A diferença entre ambos é a amplitude de classe. Neste caso, a amplitude é igual a 10 ( 5060 −= )

As freqüências estão relacionadas com o número de ocorrências de um valor ou classe de valores. Nesta questão, temos freqüências absolutas simples. Elas indicam quantas observações temos em cada classe.

Dizer que a freqüência da terceira classe é 7 significa que temos 7 pesos entre 60 e 70 kgf (incluindo pesos exatamente iguais a 60, excluindo pesos exatamente iguais a 70).

A média é uma medida de posição. Medidas de posição nos dão informações sobre o posicionamento dos dados. Podem ser de dois tipos:

· medidas de tendência central: indicam valores em torno dos quais os dados giram

· medidas separatrizes: separam os dados de forma específica

A média é classificada como medida de tendência central. Dizer que altura média dos indivíduos de uma cidade é de 1,70 m significa dizer que as alturas, naquela cidade, giram em torno de 1,70.

Para cálculo da média, somamos todas as observações e dividimos pelo número de dados. Exemplo: calcule a média do seguinte conjunto: {1, 3, 8}

Para calcular a média, basta somar todos eles e dividir por 3 (pois são 3 valores). O símbolo para média é X .

43

831=

++=X

Caso um valor ocorra mais de uma vez, precisamos multiplicá-lo pela sua respectiva freqüência.

Exemplo: calcular a média do seguinte conjunto: {1, 1, 3, 3, 8}

582321 +×+×

=X = 3,2

Observem que multiplicamos o valor 1 por sua freqüência (2). Esta multiplicação serve para levar em conta que o número 1 ocorre duas vezes.

Na hora de dividir, dividimos pelo total de freqüências.

Nesta questão da Cesgranrio, os dados estão em classe. Quando isso ocorre, temos perda de informação.

Exemplo: não sabemos quais os valores das cinco observações da segunda classe. Sabemos apenas que estão entre 50 e 60 kgf.

Se não sabemos mais os valores de cada uma das observações, não temos mais como somar todas elas, portanto, não é possível calcular a média.

O que fazemos é “dar um chute”. Fazemos uma consideração. Consideramos que as freqüências se referem aos pontos médios das classes.

Então, o primeiro passo para calcular a média para um conjunto de dados em classes é achar os pontos médios das classes.

Page 5: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

5

Classes Ponto médio (X) [40; 50) 45 [50 ; 60) 55 [ 60; 70) 65 [ 70; 80) 75 [ 80; 90) 85

Agora, calculamos a média dos pontos médios. Classes Ponto médio (X) f fX × [40; 50) 45 2 90 [50 ; 60) 55 5 275 [ 60; 70) 65 7 455 [ 70; 80) 75 8 600 [ 80; 90) 85 3 255

total 25 1675

A média é dada pela divisão entre os dois valores acima (total de “valor vezes freqüência” dividido pelo total das freqüências):

==25

1675X 67

Uma dificuldade neste tipo de questão são as contas envolvidas. Uma alternativa para facilitar as contas é trabalhar com uma variável auxiliar (d).

Esta variável auxiliar d é obtida a partir da variável original (X). Podemos usar somas, subtrações, multiplicações e divisões, com o intuito de chegar a números mais fáceis. Atingido este objetivo, a transformação é válida.

Quando todas as classes têm a mesma amplitude, uma maneira de calcular d é assim: subtraímos o primeiro valor de X; dividimos pela amplitude de classe.

Neste exercício, o primeiro valor de X é 45. A amplitude de classe é 10. Ficamos com:

1045−

=Xd

A tabela abaixo traz os valores de d: Classes Ponto médio (X)

1045−

=Xd

f fd ×

[40; 50) 45 0 2 0 [50 ; 60) 55 1 5 5 [ 60; 70) 65 2 7 14 [ 70; 80) 75 3 8 24 [ 80; 90) 85 4 3 12

Total 25 55

E agora calculamos a média de d. Por quê? Porque é mais fácil (já que os números são menores).

2,2100220

2555

===d

A média de d é 2,2. Mas nós não queremos a média de d. Nós queremos a média de X. Isto pode ser conseguido isolando X.

Page 6: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

6

451010

45+=⇒

−= dXXd

Toda vez que somamos, subtraímos, multiplicamos ou dividimos um conjunto de dados por uma constante, a média sofre a mesma variação. Logo, a relação entre as médias de X e d fica:

4510 += dX

674522 =+=X

Gabarito: C

EC 2. Petrobras 2008 [CESGRANRIO]

O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é

(A) 67

(B) 68

(C) 69

(D) 70

(E) 71

Resolução.

A mediana é outra medida de posição. Ela é uma medida de tendência central (pois os dados giram em torno da mediana). E também é uma medida separatriz. Ela separa os dados de forma bem específica, de forma que metade das observações seja menor que a mediana e a outra metade seja maior que a mediana. Ou ainda: a mediana não é superada por metade das observações.

A mediana é termo do meio de um conjunto de dados. Exemplo:

{1, 3, 4, 6, 9}

O termo do meio é o 4. Logo, a mediana é igual a 4.

4=D Quando os dados estão em classes, temos a questão da perda da informação. Nesta situação, temos que fazer outra consideração.

O primeiro passo é encontrar as freqüências acumuladas (F). Para achar freqüências acumuladas (F), a partir das freqüências simples (f), é bem simples.

A primeira linha de freqüência acumulada coincide com a primeira linha de freqüência simples.

Classes f F Obs [40; 50) 2 2 as duas freqüências coincidem [50 ; 60) 5 [ 60; 70) 7 [ 70; 80) 8 [ 80; 90) 3

Page 7: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

7

A partir da segunda linha, os valores começam a se diferenciar. A partir da segunda linha, vamos somando as freqüências simples (ou ainda, acumulando), para chegar à freqüência acumulada.

Classes f F Obs [40; 50) 2 2 [50 ; 60) 5 7 = 2+5 [ 60; 70) 7 14 = 7+7 [ 70; 80) 8 22 = 14+8[ 80; 90) 3 25 =22+3

Fazemos isto justamente porque a freqüência acumulada nos indica quantas observações temos em uma dada classe, ou nas classes anteriores.

Exemplo: a freqüência acumulada da terceira classe é 14. Isto significa que temos 14 observações nesta classe, ou nas classes anteriores. Ou ainda, 14 observações são menores que 70.

Ao todo, temos 25 observações. A mediana divide tais observações em duas partes. Então estamos procurando o número que não é superado por 12,5 observações.

Eu sei que parece estranho dizer 12,5 observações, mas não tem problema. Mais adiante explicamos o porquê disso.

Classes F [40; 50) 2 [50 ; 60) 7 [ 60; 70) 14 [ 70; 80) 22 [ 80; 90) 25

Sabemos que o número 60 não é superado por 7 observações. Sabemos que o 70 não é superado por 14 observações.

A mediana (D) não é superada por metade das observações (12,5)

Podemos montar o seguinte quadro: 60 7 60 corresponde a 7 D 12,5 Quem corresponde a 12,5? 70 14 70 corresponde a 14

12,5 está entre 7 e 14. Logo, o número que a ele corresponde (que é a mediana), estará entre 60 e 70.

Agora vem o detalhe. Quando temos dados em classes, nós supomos que as freqüências acumuladas aumentam de maneira proporcional. É a chamada interpolação linear.

O resultado disso é que podemos subtrair as linhas de baixo da linha de cima. E as diferenças serão proporcionais.

Assim: Segunda linha – primeira linha 60−D 75,12 − terceira linha – primeira linha 6070 − 714 −

A proporção linear nos garante que estas diferenças são proporcionais.

Logo:

Page 8: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

8

8,6775,51060

71475,12

607060

=×+=⇒−−

=−− DD

Gabarito: B

Fazer a interpolação linear corresponde a supor que o gráfico de freqüências acumuladas é formado por diversos segmentos de reta, que associam cada observação a uma dada freqüência acumulada. Neste processo, pouco importa se os valores obtidos para as freqüências acumuladas ou para as observações são inteiros ou não. Neste exercício, obtivemos uma freqüência acumulada de 12,5, que, aparentemente, não faria sentido.

Mas, como estamos trabalhando com uma aproximação, pouco importa que este valor não seja inteiro.

Texto para EC 3 a EC 5.

A tabela apresenta uma distribuição hipotética de freqüência do número de anos trabalhados, em uma amostra de 100 aposentados.

EC 3. PM Manaus 2004 [CESGRANRIO]

A mediana da distribuição, aproximadamente, vale:

(A) 20

(B) 23,3

(C) 25

(D) 26,7

(E) 30

Resolução.

Outra vez temos dados em classes. Para achar a mediana, fazemos novamente a interpolação linear.

Temos 100 observações. A mediana será o valor que corresponde à freqüência acumulada 50. Classe f F 0 – 10 10 10 10 – 20 20 30 20 – 30 30 60 30 – 40 40 100

Page 9: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

9

Como na coluna de freqüências acumuladas não tem o valor 50, vamos fazer a interpolação linear.

Temos: 20 30 20 corresponde à freqüência 30 D 50 A mediana corresponde à freqüência 50 30 60 30 corresponde à freqüência 60

A interpolação linear nos garante que as diferenças das linhas de baixo com a de cima são proporcionais.

30603050

203020

−−

=−−D

66,26321020 =×+=D

Gabarito: D

EC 4. PM Manaus 2004 [CESGRANRIO]

A média aritmética da distribuição, aproximadamente, vale:

(A) 20

(B) 23,3

(C) 25

(D) 26,7

(E) 30

Resolução.

Como todas as classes têm a mesma amplitude, vamos aplicar a dica que aprendemos hoje. Para achar a variável auxiliar, vamos subtrair pelo primeiro ponto médio e dividir pela amplitude de classe.

Classe Ponto médio (X)10

5−=

Xd

0 – 10 5 0 10 – 20 15 1 20 – 30 25 2 30 – 40 35 3

Total

Lembrando que esta transformação não é obrigatória. Você poderia perfeitamente trabalhar com a variável original (X). A idéia é só facilitar as contas.

Outra dica, também não obrigatória, é dividir todas as freqüências por 10. Quando multiplicamos ou dividimos as freqüências por uma dada constante, a média não se altera.

Page 10: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

10

Classe Ponto médio (X) 10

5−=

Xd Freqüência

modificada (f') 'fd ×

0 – 10 5 0 1 0 10 – 20 15 1 2 2 20 – 30 25 2 3 6 30 – 40 35 3 4 12

Total 10 20

Achando a média de d:

21020

==d

Tendo a média de d, podemos achar a média de X.

51010

5+=⇒

−= dXXd

25510 =⇒+= XdX

Gabarito: C

EC 5. PM Manaus 2004 [CESGRANRIO]

O primeiro quartil, aproximadamente, vale:

(A) 10

(B) 15

(C) 17,5

(D) 18,5

(E) 20

Resolução.

Os quartis também são medidas separatrizes. Eles separam os dados de forma bem específica (em 4 partes iguais, ou seja, cada parte tem 25% das observações).

Abaixo segue um desenho esquemático para os três quartis:

O primeiro quartil não é superado por 25% das observações.

Neste exercício, temos 100 observações. 25100%25 =×

O primeiro quartil não é superado por 25 observações. Ou ainda: o primeiro quartil é o valor que corresponde à freqüência acumulada 25.

Page 11: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

11

Classe f F 0 – 10 10 10 10 – 20 20 30 20 – 30 30 60 30 – 40 40 100

Na coluna de freqüências acumuladas não tem 25. Precisamos fazer a interpolação linear.

O primeiro quartil é o valor que corresponde à freqüência acumulada 25. 10 10 10 corresponde a 10 Q1 25 Quem corresponde a 25? 20 30 20 corresponde a 30

Fazendo as proporções, temos:

10301025

1020101

−−

=−−Q

5,17201510101 =×+=Q

Gabarito: C

Encerramos aqui esta aula demonstrativa. Na aula 1, continuaremos vendo as medidas de posição (média, mediana, moda, e suas propriedades), bem como outras formas de apresentação de dados.

Bons estudos!!!

Vítor.

I LISTA DAS QUESTÕES DE CONCURSOS Considere as informações abaixo para responder às questões EC 1 e EC 2

A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas freqüências. Não há observações coincidentes com os extremos das classes.

EC 1. Petrobras 2008 [CESGRANRIO]

O peso médio do conjunto de pessoas, em kgf, é

(A) 60

(B) 65

Page 12: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

12

(C) 67

(D) 70

(E) 75

EC 2. Petrobras 2008 [CESGRANRIO]

O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é

(A) 67

(B) 68

(C) 69

(D) 70

(E) 71

Texto para EC 3 a EC 5.

A tabela apresenta uma distribuição hipotética de freqüência do número de anos trabalhados, em uma amostra de 100 aposentados.

EC 3. PM Manaus 2004 [CESGRANRIO]

A mediana da distribuição, aproximadamente, vale:

(A) 20

(B) 23,3

(C) 25

(D) 26,7

(E) 30

EC 4. PM Manaus 2004 [CESGRANRIO]

A média aritmética da distribuição, aproximadamente, vale:

(A) 20

(B) 23,3

(C) 25

(D) 26,7

Page 13: Aula 00

N o m e d o A l u n o - C P F d o A l u n o

N o m e d o A l u n o - C P F d o A l u n o

CURSO ON-LINE – ESTATÍSTICA EM EXERCÍCIOS PARA O BACEN PROFESSOR: VÍTOR MENEZES

www.pontodosconcursos.com.br

13

(E) 30

EC 5. PM Manaus 2004 [CESGRANRIO]

O primeiro quartil, aproximadamente, vale:

(A) 10

(B) 15

(C) 17,5

(D) 18,5

(E) 20

II GABARITO DAS QUESTÕES DE CONCURSOS 1 – c 2 – b 3 – d 4 – c 5 – c