Apostila Estatistica-Prof. Fabio

download Apostila Estatistica-Prof. Fabio

of 63

Transcript of Apostila Estatistica-Prof. Fabio

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    1/63

    Estatística

    Cursos: Engenharia Civil

    UMC – Villa Lobos

    Prof. Fábio Conte Correia

    São Paulo2011

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    2/63

    Sumário

    1  O que é estatística ................................................................................................... 3 

    1.1  Definições: .......................................................................................................... 3 

    1.2  Métodos Científicos ............................................................................................ 4 

    1.3  População e Amostra ......................................................................................... 5 

    1.4   Amostragem ....................................................................................................... 5 

    1.4.1  Variáveis ..................................................................................................... 6 

    2  Tabelas .................................................................................................................... 7 

    2.1  Séries estatísticas ............................................................................................... 8 

    2.1.1  Séries históricas, cronológicas, temporais ou marchas .............................. 8 

    2.1.2  Séries geográficas, espaciais, territoriais ou de localização ....................... 8 2.1.3  Séries específicas ou categóricas ............................................................... 9 

    2.1.4  Séries conjugadas – Tabela de dupla entrada ............................................ 9 

    2.1.5  Distribuição de freqüência ......................................................................... 10 

    3  Distribuição de freqüência ..................................................................................... 11 

    3.1  Tabela primitiva ou dados brutos ...................................................................... 11 

    3.2  ROL .................................................................................................................. 11 

    3.3  Distribuição de freqüência sem intervalo de classes ........................................ 11 3.4  Distribuição de freqüência com intervalo de classes ........................................ 12 

    3.4.1  Elementos de uma distribuição de frequências com intervalos de classe . 13 

    3.4.1.1  Etapas: Distribuição de Freqüências c/ classe .................................... 14 

    3.5  Gráficos ............................................................................................................ 15 

    3.5.1  Histogramas .............................................................................................. 15 

    3.5.2  Polígonos de freqüências .......................................................................... 16 

    3.5.3  Polígonos de freqüência acumulada ou ogivas ......................................... 17 4  Medidas posição .................................................................................................... 18 

    4.1  Medidas de tendência central para dados não agrupados ............................... 18 

    4.1.1  Média Aritmética Simples .......................................................................... 18 

    4.1.2  Moda ......................................................................................................... 19 

    4.1.3  Mediana .................................................................................................... 19 

    4.2  Medidas de tendência central para dados agrupados ...................................... 20 

    4.2.1  Média Aritmética Ponderada ..................................................................... 20 

    4.2.1.1  Sem intervalo de classes ..................................................................... 20 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    3/63

    1

    4.2.1.2  Com intervalo de classes ..................................................................... 20 

    4.2.2  Moda ......................................................................................................... 22 

    4.2.2.1  Sem intervalo de classes ..................................................................... 22 

    4.2.2.2  Com intervalo de classes ..................................................................... 22 

    4.2.3  Mediana .................................................................................................... 23 

    4.2.3.1  Sem intervalo de classes ..................................................................... 23 

    4.2.3.2  Com intervalo de classes ..................................................................... 23 

    4.3  Relação entre a média, a mediana e a moda ................................................... 25 

    4.4  Exercícios. ........................................................................................................ 26 

    4.5  Separatrizes...................................................................................................... 29 

    4.5.1  Quartis, Decis e Percentis ......................................................................... 29 

    4.5.1.1  Calculo para dados não agrupados ..................................................... 29 

    4.5.1.2  Cálculo para dados agrupados ............................................................ 30 

    5  Mediadas de dispersão ou de variabilidade ........................................................... 32 

    5.1   Amplitude Total ................................................................................................. 32 

    5.2  Variância e desvio padrão ................................................................................ 33 

    5.2.1  Dados não agrupados ............................................................................... 34 

    5.2.2  Dados agrupados sem intervalo de classes .............................................. 35 

    5.2.3  Dados agrupados com intervalo de classes .............................................. 35 

    5.3  Coeficiente de variação .................................................................................... 36 

    6  Correlação e Regressão ........................................................................................ 39 

    6.1  Correlação linear entre duas variáveis ............................................................. 39 

    6.1.1  Coeficiente de correlação linear ................................................................ 41 

    6.2  Regressão Linear ............................................................................................. 44 

    7   Analise combinatória ............................................................................................. 47 

    7.1  Fatorial .............................................................................................................. 47 

    7.2  Princípio fundamental da contagem – PFC ...................................................... 48 

    7.3   Arranjos simples ............................................................................................... 49 

    7.3.1  Cálculo do número de arranjos ................................................................. 49 

    7.4  Permutações simples ....................................................................................... 50 

    7.4.1  Permutações com elementos repetidos .................................................... 51 

    7.5  Combinações simples ....................................................................................... 51 

    7.6  Números Binomiais ........................................................................................... 53 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    4/63

    2

    8  Probabilidade ......................................................................................................... 54 

    8.1  Experimentos ou fenômenos aleatórios ............................................................ 54 

    8.2  Espaço amostral ............................................................................................... 54 

    8.3  Eventos ............................................................................................................. 55 

    8.4  Função Probabilidade ....................................................................................... 55 

    8.5  Eventos complementares ................................................................................. 56 

    8.6  Eventos independentes .................................................................................... 56 

    8.7  Eventos mutuamente exclusivos ...................................................................... 57 

    8.8  Exercícios ......................................................................................................... 57 

    9  Distribuição Binomial ............................................................................................. 60 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    5/63

    3

    1 O que é estatística

    1. É a ciência da tomada de decisão perante incertezas;

    2. Coleta, análise e interpretação de dados;3. É um “kit” de ferramentas que ajuda a resolver problemas;

    4. Base para a maior parte das decisões tomadas quanto ao controle de qualidade,

    assim como em quase todas as outras áreas da atividade humana moderna.

    Vista dessa forma, a Estatística não deve ser confundida como uma disciplina

    isolada, e sim, compreendida como uma ferramenta ou conjunto de ferramentas,

    disponível para a solução de problemas em diversas áreas do conhecimento.

    1.1 Definições:

      Processo: é qualquer combinação específica de máquinas, ferramentas,

    métodos, materiais e/ou pessoas empregadas para atingir qualidades

    específicas num produto ou serviço. Estas qualidades são chamadas de

    “características de qualidade”.

      Controle: é o ciclo de feedback (realimentação) através da qual medimos odesempenho real, comparando-o com o padrão, e agimos sobre a diferença.

      Controle Estatístico do processo (CEP): aplicação de técnicas estatísticas para

    medir e analisar a variação nos processos.

      Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para

    medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de

    diagnósticos, planos de amostragem e outras técnicas estatísticas.

    Est atíst ica Desc rit i va: sua função é observar fenômenos de mesma natureza, coletar

    dados numéricos referente a esses fenômenos, organizar e classificar esses dados

    observados, além da sua apresentação por meio de tabelas, diagramas e gráficos.

    Etapas básicas:

      Definição do problema;

      Planejamento;

      Coleta de dados;  Apuração dos dados;

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    6/63

    4

      Apresentação dos dados;

      Análise e interpretação dos dados.

    Est atíst ica Indut iva:é um processo de generalização a partir de resultados obtidos

    particulares, isto é, a inferência de propriedades para o todo com base na parte do

    particular. O processo de generalização que é característico do método indutivo está

    associado a uma margem de erro e para minimizar este grau de incerteza a teoria de

    probabilidades será fundamental para o desenvolvimento da estatística aplicada.

    Estatística nas empresas

    Neste mundo globalizado, a empresa é uma das vigas mestras da Economia dos

    povos e a Estatística tem colaborado com os gerentes porque permitem a construção

    de ferramentas que dão oportunidades a tomada de decisões e estimativas, e ainda,

    facilitam o tríplice trabalho do Administrador de organizar, dirigir e controlar a empresa.

     Aplicação na Engenharia e na Administração

    Uma firma que está se preparando para lançar um novo produto precisa

    conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer

    pesquisa de mercado entrevistando um número de residências escolhidas

    aleatoriamente. Assim, os resultados podem ser usados para estimar as preferências

    da população.

    É possível que em uma comunidade, o consumo de sorvete dependa do:

    - preço do produto;

    - renda média local;

    - número de crianças na comunidade;

    - temperatura média; Através da análise de regressão podem-se determinar quais fatores têm efeitos

    mais importantes.

    1.2 Métodos Científicos

    Método é um conjunto de meios dispostos convenientemente para se chegar aum fim que se deseja.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    7/63

    5

    •  Método Experimental: consiste em manter constantes todas as causas (fatores),

    menos uma, e variar esta causa de modo que o pesquisador possa descobrir

    seus efeitos, caso existam.

    •  Método Estatístico:  Admite todas essas causas presentes variando-as,

    registrando essas variações e procurando determinar, no resultado final, que

    influências cabem a cada uma delas.

    1.3 População e Amostra

     Ao conjunto de entes portadores de, pelo menos, uma característica comum

    denominamos população estatística, universo estatístico ou simplesmentePOPULAÇÃO.

    Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais

    características dos elementos de alguma população, esta característica deve estar

    perfeitamente definida. Isso possibilita que afirmemos, sem ambiguidade, se um

    elemento pertence ou não à população.

    Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou

    temporal, limitamos as observações referentes a uma determinada pesquisa a apenasuma parte da população. A essa parte proveniente da população em estudo

    denominamos amostra.

    Uma amostra é um subconjunto finito de uma população.

    Para as inferências serem corretas, é necessário garantir que a amostra seja

    representativa da população, isto é, a amostra deve possuir as mesmas características

    básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.

    1.4 Amostragem

     A amostragem  é uma técnica especial, que garante, tanto quanto possível o

    acaso da escolha da amostra.

    Dessa forma, cada elemento da população passa a ter a mesma chance de ser

    escolhido, o que garante à amostra caráter de representatividade.

     Amostragem casual ou aleatória simples

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    8/63

    6

    Esse tipo de amostragem é equivalente a um sorteio lotérico.

    Na prática, a amostragem casual ou aleatória simples  pode ser realizada

    enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo

    aleatório qualquer, k  números dessa seqüência, os quais corresponderão aoselementos pertencentes à amostra.

     Amostragem proporcional estratificada

    Muitas vezes a população se divide em subpopulações -- estratos.

    Como é possível que a variável em estudo apresente, de estrato em estrato, um

    comportamento heterogêneo e, dentro de cada estrato, um comportamento

    homogêneo, convém que o sorteio dos elementos da amostra leve em consideração

    tais estratos.

     Amostragem sistemática

    Quando os elementos da população já se acham ordenados, não há

    necessidade de construir o sistema de referência. São exemplos os prontuários

    médicos de um hospital, os prédios de uma rua, etc...

    Nesses casos, a seleção dos elementos que constituirão a amostra pode ser

    feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem

    denominamos sistemática.

    1.4.1 Variáveis

    Variável é convencionalmente, o conjunto de resultados possíveis de umfenômeno e cada fenômeno corresponde um número de resultados possíveis.

     Alguns exemplos:

    Para o fenômeno “sexo”, são dois o resultados possíveis: sexo masculino e sexo

    feminino;

    Para o fenômeno “número de filhos” há um número de resultados possíveis

    expresso através dos números naturais: 0, 1, 2, 3, ..., n.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    9/63

    7

    Uma variável pode ser:

      Qualitativa são as características que não possuem valores quantitativos, mas,

    ao contrário, são definidas por várias categorias, ou seja, representam uma

    classificação dos indivíduos.

      Nominal  quando seus valores são expressos por atributos: sexo, cor

    da pele, etc.

      Ordinal   existe uma ordenação entre as categorias. Ex: escolaridade

    (1º, 2º, 3º graus), estágio da obra (inicial, intermediário, terminal), mês de

    observação (janeiro, fevereiro...).

      Quantitativas  – são as características que podem ser medidas em uma escala

    quantitativa, ou seja, apresentam valores numéricos.

      Contínua  características mensuráveis que assumem valores em uma

    escala contínua (na reta real), para as quais valores fracionais.

    Usualmente devem ser medidas através de algum instrumento.

    Exemplos: peso (balança), altura (régua), tempo (relógio), pressãoarterial, idade

      Discreta características mensuráveis que podem assumir apenas um

    número finito ou infinito contável de valores e, assim, somente valores

    inteiros. Geralmente é o resultado de contagens. Exemplos: número de

    filhos, número de pilares, vigas, número de cigarros fumados por dia.

    De modo geral, as medições dão origem a variáveis contínuas e as contagens 

    ou enumerações dão origem a variáveis discretas.

    2 Tabelas

    Um dos objetivos da Estatística é sintetizar os valores que uma ou mais

    variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou

    dessas variáveis.

    Tabela é um quadro que resume um conjunto de observações.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    10/63

    8

    2.1 Séries estatísticas

    Denominamos série estatística toda tabela que apresenta a distribuição de um

    conjunto de dados estatísticos em função da época, do local ou da espécie.

    Daí, podemos inferir que numa série estatística observamos a existência de três

    elementos ou fatores: o tempo, o espaço e a espécie.

    2.1.1 Séries históricas, cronológicas, temporais ou marchas

    Descrevem os valores da variável, em determinado local, discriminados segundointervalos de tempo variáveis. Exemplo:

    2.1.2 Séries geográficas, espaciais, territoriais ou de localização

    Descrevem os valores da variável, em determinado instante, discriminados

    segundo regiões. Exemplo:

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    11/63

    9

    2.1.3 Séries específicas ou categóricas

    Descrevem os valores da variável, em determinado tempo e local, discriminados

    segundo especificações ou categorias. Exemplo:

    2.1.4 Séries conjugadas  – Tabela de dupla entrada

    Muitas vezes temos necessidade de apresentar em uma única tabela, a variação

    de valores de mais de uma variável, isto é, fazer uma conjugação  de duas ou mais

    séries.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    12/63

    10

    Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla

    entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma

    horizontal  (linha) e uma vertical  (coluna). Exemplo:

    2.1.5 Distribuição de freqüência

    Por se tratar de um conceito estatístico de suma importância, merecerá um

    tratamento especial. Exemplo:

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    13/63

    11

    3 Distribuição de freqüência

    Quando da análise de dados, é comum procurar conferir certa ordem aos

    números tornando-os visualmente mais amigáveis. O procedimento mais comum é o dedivisão por classes ou categorias, verificando-se o número de indivíduos pertencentes

    a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as

    freqüências (repetições de seus valores).

    3.1 Tabela primitiva ou dados brutos

    É uma tabela ou relação de elementos que não foram numericamenteorganizados. É difícil formarmos uma idéia exata do comportamento do grupo como umtodo, a partir de dados não ordenados.

    Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

    3.2 ROL

    É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

    Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

    3.3 Distribuição de freqüência sem intervalo de classes

    É a simples condensação dos dados conforme as repetições de seus valores.Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, jáque exige muito espaço. Veja exemplo abaixo:

    Ex1. Um dado foi lançado 15 vezes, obtendo-se os seguintes pontos: 2, 5, 6, 6,1, 4, 2, 6, 5, 1, 3, 3, 2, 4, 6. Construa uma tabela de distribuição de freqüências

    absolutas, acumuladas e relativas.

    Dados(xi)

    Frequênciaabsoluta

    (f i)

    Freq. absolutaacumulada

    (f ac)

    Freq. Relativa(f r )%

    Freq. Relativaacumulada

    (f r ac)%1 2 2  13,33%  13,33% 2 3 5  20,00%  33,33% 3 2 7  13,33%  46,66% 4 2 9  13,33%  59,99% 5 2 11  13,33%  73,32% 6 4 15  26,68%  100% 

    Total  15  100% 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    14/63

    12

    Frequência absoluta  Número de vezes que a variável xi se repete

    Frequência absoluta acumulada   É a frequência atual somada às frequências

    anteriores

    Frequência Relativa É a relação entre a frequência absoluta e o numero de

    elementos da população estatística. f r =   Ex2. Um condomínio possui 25 apartamentos, sendo que esses apartamentos

    possuem áreas (m2) diferentes. Seguem os valores das áreas dos apartamentos: 50,

    65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60, 70, 50, 50, 59, 53, 65, 68, 50, 53,75. Construa uma tabela de distribuição de freqüências absolutas, acumuladas erelativas.

    xi f i f ac f r f r % f r  ac f r  ac%50  5  5  0,20  20%  0,20  20% 53  4  9  0,16  16%  0,36  36% 59  3  12  0,12  12%  0,48  48% 60  2  14  0,08  8%  0,56  56% 

    62  1  15  0,04  4%  0,60  60% 65  3  18  0,12  12%  0,72  72% 68  2  20  0,08  8%  0,80  80% 70  2  22  0,08  8%  0,88  88% 72  1  23  0,04  4%  0,92  92% 75  2  25  0,08  8%  1,00  100% 

    Total  25  1,00  100% 

    3.4 Distribuição de freqüência com intervalo de classes

    Quando o tamanho da amostra é elevado, é mais racional efetuar oagrupamento dos valores em vários intervalos de classe.

    Ex3. O tempo de cura em minutos de um determinado cimento foi de 45, 41, 42,41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51, construa a tabela dedistribuição de frequências.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    15/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    16/63

    14

      Amplitude do intervalo de classe: é obtida através da diferença entre o limitesuperior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabelaanterior hi = 53 - 49 = 4. Obs: Na distribuição de freqüências c/ classe o hipoderá ser igual em todas as classes.

      Amplitude total da distribuição: é a diferença entre o limite superior da últimaclasse e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabelaanterior AT = 61 - 41= 20.

      Amplitude total da amostra (rol): é a diferença entre o valor máximo e o valormínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA =

    60 - 41 = 19.

    Obs: AT sempre será maior que AA.

      Ponto médio de classe ( i ): é o ponto que divide o intervalo de classe emduas partes iguais.

    Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.

    3.4.1.1 Etap as : Dis tr ib uição de Freq üências c/ cl ass e

    1º - Organize os dados brutos em um ROL.

    2º - Calcule a amplitude amostral AA No nosso exemplo: AA = 60 - 41 = 19

    3º - Calcule o número de classes através da "Regra de Sturges"  K   1 +3,3*log n. Onde K é o número de classes e n o número total de dados, ou pelo Critério

    da Raiz K = √ n Obs: Qualquer regra para determinação do nº de classes da tabela não noslevam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal,que deve estar ligado à natureza dos dados.

    No nosso exemplo: n = 20 dados, então a regra sugere a adoção de 5 classes.

    4º - Decidido o nº de classes, calcule então a amplitude do intervalo  declasse h > AA / k. No nosso exemplo: AA/k = 19/5 = 3,8 . Obs: Como h > AA/k um valorligeiramente superior para haver folga na última classe. Utilizaremos então h = 4

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    17/63

    15

    5º - Temos então o menor nº da amostra, o nº de classes e a amplitude dointervalo. Podemos montar a tabela, com o cuidado para não aparecer classes comfreqüência = 0 (zero).

    No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classe

    será representada por

    41 |------- 45. As classes seguintes respeitarão o mesmo procedimento.

     A classe seguinte sempre terá como primeiro elemento o limite superior daclasse anterior.

    Ex4. Utilizando os dados do exercício 3 (45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50,46, 60, 54, 52, 58, 57, 58, 60, 51) Construa a tabela de distribuição de frequências comintervalo de classes.

    Tempo de cura do cimento X 

    Classes  xi  fi  fac  fr  fr%  frac  frac% 

    41ǀ---45  43  7  7  0,35  35  0,35  35 

    45ǀ---49  47  3  10  0,15  15  0,5  50 

    49ǀ---53  51  4  14  0,2  20  0,7  70 

    53ǀ---57  55  1  15  0,05  5  0,75  75 

    57ǀ---61  59  5  20  0,25  25  1  100 

    3.5 Gráficos

    Os principais gráficos utilizados na representação de distribuição de freqüências

    são:

      histograma e polígono de freqüência;

      ogiva ou polígono de freqüência acumulada.

    3.5.1 Histogramas

    É um conjunto de retângulos com bases sobre um eixo dividido de acordo com

    os tamanhos de classe, centro nos pontos médio das classes e áreas proporcionais às

    freqüências.

    Utilizando os dados do obtidos no EX4 montamos o histograma abaixo.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    18/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    19/63

    17

    3.5.3 Polígonos de freqüência acumulada ou ogivas

    É o gráfico representativo de uma distribuição acumulada de freqüências. É umapoligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no

    eixo vertical as freqüências acumuladas.

    Note que a freqüência acumulada relacionada com o limite inferior da primeiraclasse é sempre zero.

     Ao contrário do polígono de freqüência, a ogiva de freqüências acumuladasutiliza os pontos extremos

    Utilizando os dados do obtidos no EX4  montamos o polígono de freqüência

    acumulada.

    0

    5

    10

    15

    20

    25

    39 41 43 45 47 49 51 53 55 57 59 61 63

    Frequência

    Tempo de cura (min)

    Tempo de cura do cimento X

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    20/63

    18

    4 Medidas posição

    São as estatísticas que representam uma série de dados orientando-nos quanto

    à posição da distribuição em relação ao eixo horizontal do gráfico da curva defreqüência. As medidas de posição mais importantes são:

      Medidas de tendência central

    Verifica-se uma tendência dos dados observados a se agruparem em torno dos

    valores centrais.

     As medidas de tendência central mais utilizadas são: média aritmética, moda e

    mediana. Outros menos usados são as médias: geométrica, harmônica, quadrática,

    cúbica e biquadrática.

      Separatrizes

    Que englobam: a própria mediana, os decis, os quartis e os percentis.

    4.1 Medidas de tendência central para dados não agrupados

    4.1.1 Média Aritmética Simples

     A média aritmética simples ( x ) dos valores x1, x2, x3,....xn  é o quociente entre a

    soma desses valores e o seu número total (N):

     x =  N 

     xn

    i

    i1  ou seja:  x =

     N  x x x n...21    

    Ex5: Uma loja de materiais de construção vendeu as seguintes quantidades de

    caixas de pisos durante certa semana. Calcule a média dessas vendas

    2ª. feira 3ª. feira 4ª. feira 5ª. feira 6ª. feira sábado22 23 22 27 25 13

     x =6

    132527222322        x =

    6

    132     x  = 22

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    21/63

    19

    4.1.2 Moda

    Moda de um conjunto de valores é o valor que aparece o maior número de

    vezes, ou seja a característica com maior freqüência absoluta.

    Na seqüência anterior 28, 37, 37, 37, 40,41, 41,43, 44, 45 a moda será o número

    37.

    4.1.3 Mediana

    É o valor que ocupa a posição central de um conjunto de valores, colocados em

    ordem crescente ou decrescente de grandeza. Devemos, portanto, considerar duassituações: o número de valores é par ou, o número de valores é impar.

      O número de dados é impar

    Md = xp  onde  p  n  1

    2 (p = posição) ou

    EX7.  As nove classes de 1º Ano de engenharia têm respectivamente: 37, 28,

    40,41,45,37,37, 41 e 44 alunos. Calcule a mediana.

     p  n  1

    2    p

    2

    19  = 5

    Portanto a mediana ocupará a 5ª posição = 40.

    28, 37, 37, 37, 40, 41, 41, 44, 45

      O número de dados é par

    Mx x

    d

     p p    1

    2  onde  p

      n

    2.

    Neste caso a mediana é a Média Aritmética dos dois termos centrais.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    22/63

    20

    Ex8.  As dez classes de 1º. Ano de engenharia têm respectivamente: 37, 28,

    40,41,45,37,37, 41, 43 e 44 alunos. Calcule a mediana.

    Ordenando aos dados temos: 28, 37, 37, 37, 40, 41, 41,43, 44, 45

     p  n

    2  = 10/2 = 5

    Md= 2

    )( 155     x x 

    2

    4140Md

      Md= 40,5

    4.2 Medidas de tendência central para dados agrupados

    4.2.1 Média Aritmética Ponderada

    4.2.1.1 Sem intervalo de classes

     A média aritmética Ponderada difere da Média Aritmética Simples, pois algunsdos valores x1, x2, x3,..., xn se repetem como podemos ver no exemplo abaixo.

    EX6.  A Tabela abaixo representa o número de falhas em um determinado

    processo em uma indústria química.

    xi f i0 2

    1 6

    2 10

    3 12

    4 4

    ∑  34

    3,23478.

    iii

     f   f   x x

     

    4.2.1.2 Com intervalo de classes

    Neste caso, convencionamos que todos os valores incluídos em um determinado

    intervalo de classe coincidem com o seu ponto médio (   i x ), e determinamos a médiaaritmética ponderada por meio da fórmula:

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    23/63

    21

    i

    ii

     f 

     f  x .

     ou seja

    n

    nn

     f   f   f  

     f   x f   x f   x x

    ...

    ....

    21

    221.1

     

    Ex7. O quadro de distribuição de freqüências representa os salários mensais de

    40 empregados de uma firma. Calcule o salário médio mensal desses empregados.

    Classe em ReaisX10

    Ponto Médio da classe(   i x )

    Freq.(f i)

    [180,200[ 190 4[200,220[ 210 18[220,240[ 230 10

    [240,260[ 250 5[260,280[ 270 3

    40

    810175023003780760    x

     

     40

    8900 x     x = 222,50   x = 222,50 x 10 = R$2.225,00

    Ex8.  Calcular a altura média de uma série de pilares de uma obra, conforme atabela abaixo.

     Altura (cm) - xi  Freqüência - f i  Ponto médio i  xi . f i

    50 |------------ 54 4 52 20854 |------------ 58 9 56 50458 |------------ 62 11 60 66062 |------------ 66 8 64 51266 |------------ 70 5 68 34070 |------------ 74 3 72 216

    Total 40 2.440

     Aplicando a fórmula acima temos: 2.440 / 40.= 61, logo... = 61 cm

    3510184

    270.3250.5230.10210.18190.4

     x

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    24/63

    22

    4.2.2 Moda

    4.2.2.1 Sem intervalo de classes

    Neste caso basto fixar o valor da variável de maior frequência

    Temperaturas °C xi f i0 3

    1 9

    2 12

    3 6

    4 5

    ∑  34

    2° C é temperatura modal, pois é a de maior frequência.

    4.2.2.2 Com intervalo de classes

    Neste caso o modo mais simples é achar a classe modal e calcular o pontomédio dessa classe.

    Classe f i54 |------------ 58 958 |------------ 62 11

    62 |------------ 66 866 |------------ 70 5

    Total 33

     A classe Modal é 58 |------------ 62, pois é a classe de maior frequência, e o ponto

    médio dessa classe é (58+62)/2  60Há também um método mais elaborado no qual utiliza a seguinte formula:

    = +   2 ∗ + ∗ ℎ  = 58 + 1 1 92 ∗ 1 1 9 + 8 ∗ 4 = 5 9 , 6 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    25/63

    23

    4.2.3 Mediana

    4.2.3.1 Sem intervalo de classes

      Impar

    Temperaturas °C xi f i f ac0 2 2

    1 6 8

    2 9 17

    3 13 30

    4 5 35

    ∑  35

    2

    1

      n pimpar n

     

    =(35+1)/2 18° termo equivale a 3°

      Par

    Temperaturas °C xi f i f ac0 2 2

    1 6 8

    2 9 17

    3 13 30

    4 4 34∑  34

     

    2

    1 p p

     x x M 

      p

      n

    2  Md= 

    2

    )( 11717     x x 

    Nesse caso então serão a média entre os valores da posição 17° e 18°, 2 e 3

    respectivamente   5,22

    32

     

    4.2.3.2 Com intervalo de classes

    Nesse caso devemos seguir os seguintes passos:

    1º) Determinamos as freqüências acumuladas;

    2º) Calculamos ∑f i/2 ;

    3º) Marcamos a classe correspondente à freqüência acumulada imediatamente

    superior à ∑f i/2 . Tal classe será a classe mediana;

    4º) Calculamos a Mediana pela seguinte fórmula:

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    26/63

    24

    M d = li + [∑ f i2 Fant] ∗ hf i  

    onde: li é o limite inferior da classe mediana.

    F(ant) é a freqüência acumulada da classe anterior a classe mediana

    h é a amplitude do intervalo da classe mediana

    f i é a freqüência do intervalo da classe mediana

    classes freqüência = fi  Freqüência acumulada 50 |------------ 54 4  4 54 |------------ 58  9  13 58 |------------ 62  11  24 

    62 |------------ 66  8  32 66 |------------ 70  5  37 70 |------------ 74  3  40 total  40 

    ∑   = = 20, logo.a classe mediana será 58 |------ 62.li = 58 ; F(ant) =13 ; f i = 11 e h = 4 , Substituindo esses valores na fórmula, obtemos:

    M d = 5 8 + 20 13 ∗ 411 =60,54  No caso de

    ∑   = f i acontecer, a mediana será o limite superior da classe correspondente EX9.  Calcule a mediana

    8

    18

    29

    45

    58

    63

    64

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    27/63

    25

    ∑   = = 32, logo.a classe mediana será 750 |------ 850.li = 750 ; F(ant) =29 ; f i = 16 e h = 100 , Substituindo esses valores na fórmula, obtemos:

    M d = 7 5 0 + 32 29 ∗10016 =768,75  No caso de

    ∑   = f i acontecer, a mediana será o limite superior da classe correspondente 

    4.3 Relação entre a média, a mediana e a moda

    Para os dados agrupados representados por uma curva de freqüência, as

    diferenças entre os valores da média, da mediana e da moda são indicadores da forma

    da curva em termos de assimetria. Para uma distribuição unimodal simétrica, a média,

    a mediana e a moda são, todas, coincidentes em valor Para uma distribuição

    positivamente assimétrica, a média apresenta o valor mais elevado, enquanto a

    mediana é maior do que a moda, mas menor do que a média. Para uma distribuição

    negativamente assimétrica, a média apresenta o menor valor e a mediana se encontraabaixo da moda, mas acima da média.

    Moda Média 

    Mediana 

    (a) Simétrica  (b) Positivamenteassimétrica (c) Negativamente

    assimétrica 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    28/63

    26

    4.4 Exercícios.

    1) Calcular a média a moda e a mediana dos seguintes valores:27,27,30,30,30,30,30,32,32,32.

     x = 30

    Md=2

    )( 155     x x    2

    )( 155     x x  =2

    3030 = 30

    Mo= 30

    2) Calcular a média a moda e a mediana dos seguintes valores: 13,5; 13,5; 17,23;35,003; 45,72; 63,601; 37,13; 13,5; 52,13

     x = 32,368

    Md - Organizar os dados em ordem crescente

    Md= xp  onde  p  n  1

    2 (p = posição) p=5 Md= 35,003; Mo= 13,500

    Posição

    (p)

    Valores

    (xi)

    1 13,500

    2 13,500

    3 13,500

    4 17,230

    5 35,003

    6 37,130

    7 45,720

    8 52,130

    9 63,601

    3) A tabela nos dá uma distribuição de freqüências. Calcule a média dessadistribuição. Resp. 22,9

    xi f i xi* f i10 8 8020 11 22030 7 21040 5 200

    Total 31 710

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    29/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    30/63

    28

    1° Calcular a amplitude total AA = 75-50= 25

    2° Calcular o numero de classes K= 1+3,3*log25 = 5,6  5

    3° Calcular a Amplitude do intervalo Ai = AA/k = 5

    Obs confirmar se pode  li+( Ai * K) ≥ Ls  50+25 ≥ 75 75 ≥ 75 OK.

    4° Calcular os intervalos:

    Classes  x   f i f ac f r f rac50 ǀ--- 55 52,50 9 9 0,36 0,36

    55 ǀ--- 60 57,50 3 12 0,12 0,4860 ǀ--- 65 62,50 3 15 0,12 0,6065 ǀ--- 70 67,50 5 20 0,20 0,8070 ǀ--- 75 72,50 5 25 0,20 1,00

    Total 25 1

    5° Calculo da média = 1532,5/25 = 61,3

    Classes  x   f i f ac  x * f i

    50 ǀ--- 55 52,50 9 9 472,5 55 ǀ--- 60 57,50 3 12 172,5 

    60 ǀ--- 65 62,50 3 15 187,5 

    65 ǀ--- 70 67,50 5 20 337,5 

    70 ǀ--- 75 72,50 5 25 362,5 

    Total 25 1532,5 

    6° Calculo da mediana

    ∑f i/2 20/2 = 10

    Classe onde a f ac é imediatamente superior a ∑f i/2  essa será a classe damediana : 55 ǀ--- 60

    Usando a formula : Md = li* + [( ∑f i /2 - Fant ) . h*] / f i*

    Md= 55 + [( 10 – 9 ) * 5] / 3 = 56,66

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    31/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    32/63

    30

    4.5.1.2 Cálcu lo para dados agru pado s

    O processo a ser empregado é o mesmo que para o cálculo da mediana,

    bastando apenas no cálculo das posições (P) considerarem os denominadores, 4, 10 e

    100, respectivamente, para os quartis, decis e percentis.

    Q = li + [k ∗∑ f i4 Fant] ∗ hf i  

    D = li + [k ∗∑ f i10 Fant] ∗ h

    f i 

    P = li + [k ∗ ∑ f i100 Fant]∗hf i  Sendo k o número de ordem do quartil, do decil ou do percentil

    EX12. Calcular os quartis na seguinte série estatística

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    33/63

    31

    EX13. Calcular os quartis na seguinte série estatística

    EX13. Calcular o oitavo percentil na seguinte série estatística abaixo.

    P = li + [k ∗∑ f i100 Fant]∗hf i  

    K=8 

    8 ∗

    =3,2, logo a classe do percentil será 1°.

    li=150; F(ant) = 0; h=4; f i=4

    P = 1 5 0 + 3,20 ∗ 44 =150+3,4=153,2 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    34/63

    32

    5 Mediadas de dispersão ou de variabilidade

    Visam descrever os dados no sentido de informar o grau de dispersão ou

    afastamento dos valores observados em torno de um valor central (média). Informa seum conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita

    variabilidade).

    Medidas de dispersão então medem o afastamento dos valores observados em

    relação a uma medida de tendência central (normalmente em relação a média

    aritmética).

    Ex 14. Desejamos compara o desempenho de dois grupos, com base em um testeem uma prova do MEC:

    Grupo A { 70; 71; 69; 70; 70 }

    Grupo B { 55; 80; 70; 62; 83 }

    Calculando a média para cada um dos grupos vamos obter a=70 e b=70Baseado nestes resultados, diríamos que ambos os grupos apresentam a mesma

    performance. Mas, observando mais detalhadamente os dados, notamos que as notas

    do grupo A variam apenas de 69 a 71, ao passo que as de B variam de 55 a 83, o que

    revela que o desempenho de A é bem mais uniforme que o de B.

    Para avalia quantitativamente o grau de variabilidade ou dispersão de um grupo de

    valores utilizamos então as medidas de dispersão, onde as principais medidas são: a

    amplitude total, a variância, o desvio padrão e o coeficiente de variação de Pearson.

    5.1 Amplitude Total

    É a diferença entre o maior e o menor valor observado

    Sem Intervalo Com intervalo de classes

    AT = Xmax  –  Xmin  AT = L(Máx) –  l(Mín) 

    Quanto maior for à amplitude, maior será dispersão ou variabilidade dos valores

    da variável

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    35/63

    33

    5.2 Variância e desvio padrão

     A variância e o desvio padrão são medidas que levam em consideração a

    totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade

    bastante estáveis e, por isso mesmo, os mais geralmente utilizados.

     A variância baseia-se nos desvios em torno da média aritmética, porém

    determinado a média aritmética dos quadrados dos desvios, representamos a variância

    por s2.

    O desvio padrão é o valor positivo da raiz quadrada da variância absoluta. É

    uma medida estatística que representa, em média, os afastamentos, em valores

    absolutos, dos elementos observados em relação a respectiva média aritmética. É uma

    medida estatística que é dada na unidade da medida utilizada:

    = ∑ ̅

     Em geral a média aritmética (x) é um numero fracionário o que torna pouco

    prático o calculo das quantidades de ̅ .Podemos simplificar os cálculos fazendo a seguinte igualdade:

    ̅ =

     

    Substituindo na formula do desvio padrão temos:

    =  ∑   ∑  

    = ∑ ̅ ∑    = ∑ ̅

     

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    36/63

    34

    5.2.1 Dados não agrupados

    EX 15.

    EX16.

    EX17. Com os seguintes valores 8; 10; 11; 15; 16; 18, calcule o desvio padrão:

    (Xi) (Xi)2

    8 64

    10 100

    11 121

    15 225

    16 256

    18 324

    ∑= 78 ∑=1090

    =  ∑   ∑ → =  ∑ 10906 (786 )

     

    = 12,66 → =3,56

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    37/63

    35

    5.2.2 Dados agrupados sem intervalo de classes

    =  ∑  ∗

     ∑    ∑  ∗ ∑  

      =  ∑  ̅

    ∑  

    EX18.

    xi  f i  xi*f i (xi  – ) f i(xi  – )20 2 0 0 – 2,1 = – 2,1 2*4,41= 8,82

    1 6 6 1 – 2,1 = – 1,1 6*1,21= 7,262 12 24 2 – 2,1 = – 0,1 12*0,01= 0,123 7 21 3 – 2,1= 0,9 7*0,81=5,674 3 12 4 – 2,1 = 1,9 3*3,61=10,83

    ∑= 30  ∑= 63 ∑= 32,70 

    5.2.3 Dados agrupados com intervalo de classes

    EX19.

     Altura (cm) - xi  f i  ̅  xi*f i  (xi  – ̅)  f i(xi  – ̅)2 150 |------ 154 4 152 608 152-161 = - 9 4*81154 |------ 158 9 156 1404 -5 9*25158 |------ 162 11 160 1760 -1 11*1162 |------ 166 8 164 1312 3 8*9166 |------ 170 5 168 840 7 5*49170 |------ 174 3 172 516 11 3*121

    Total 40 6.440 1240

    =  16530 (

    6330)

     

    = 1,09 =1,044 

    = ∑  ̅

    ∑   

    = 32,7030  =1,044 

    = ∑ ̅ ̅ ∑    = 124040   = 5 , 5 7 cm

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    38/63

    36

    5.3 Coeficiente de variação

    O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de

    duas unidades pode ser considerado pequeno para uma série de valores cujo valormédio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além

    disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o

    seu emprego quando desejamos comparar duas ou mais séries de valores,

    relativamente à sua dispersão ou variabilidade, quando expressas em unidades

    diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a

    dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida

    essa denominada coeficiente de variação (CV):

    = ̅ EX.20 Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo

    grupo de indivíduos:

    Temos:

    = 5175 ∗100=2,85%  = 268 ∗100=2,94% 

    Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão

    que as estaturas.

    Ex.21 Para os dados abaixo calcule a variância e o desvio padrão

    a) 1,3,5,9

    b) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2

    c) 26, 14, 15, 19, 21, 22, 20

    d) -10, -6, 2, 3, 7, 9, 10

    R: a) 2,96; b) 3,016; c) 2,81; d) 7,04

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    39/63

    37

    Ex.22 Calcule o desvio padrão das distribuições abaixo:

    (R: a) 1,51; b) 0,159)

    EX.23 Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente

    calcule o desvio padrão:

    (R: 

    1,13)

    EX.24 Calcule o desvio padrão da distribuição:

    (R: 4,5)

    EX.25 Calcule o desvio padrão das distribuições de freqüência abaixo:

    (R: a) 2,43; b) 8,8 cm; c) R$ 229; d) 9,93 kg).

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    40/63

    38

    EX26. Sabendo que um conjunto de dados apresenta para média aritmética e para

    desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.

    (R:8,02%).

    EX27. Em uma obra A, foram inspecionadas 150 barras de ferro e média foi 7,8 cm e o

    desvio padrão, 0,80 cm. Em outra obra B, entretanto, a média foi de 7,3 cm e o desvio

    padrão, 0,76. Em qual obra houve uma maior a dispersão?

    (R: Obra B)

    EX28. Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01

    cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3

    kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?

    (R:estatura)

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    41/63

    39

    6 Correlação e Regressão

    Nos métodos estatísticos precedentes consideramos sempre a existência de uma

    única variável de interesse, porém vários problemas no trabalho estatístico, todavia,envolvem muitas variáveis. Veremos agora dois métodos estatísticos para lidar com

    este tipo de problema. Faremos nosso estudo com o caso mais simples em que temos

    apenas duas variáveis de interesse.

    6.1 Correlação linear entre duas variáveis

     Avaliar se existe associação entre duas características quantitativas é objetivo de

    muitos estudos em diversas áreas. Um ecologista pode estar interessado em saber, por

    exemplo, se há associação entre a quantidade de chumbo medida na água e o volume

    de dejetos despejados em determinado rio; um médico pode querer avaliar se a

    pressão arterial está relacionada à idade das pessoas. Quando se pode demonstrar

    que existe associação entre duas variáveis quantitativas, isto é, quando se constata

    que elas variam juntas, diz-se que as variáveis estão correlacionadas.

    Ex29. Consideremos uma amostra aleatória, formada por dez dos 98 alunos de

    uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística:

    Representando, em um sistema coordenado cartesiano ortogonal, os pares

    ordenados (x, y), obtemos uma nuvem de pontos que denominamos diagrama de

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    42/63

    40

    dispersão. Esse diagrama nos fornece uma idéia grosseira, porém útil, da correlação

    existente:

    Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos

    imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta.

    Dizemos, então, que a correlação de forma elíptica tem como "imagem" uma reta,

    sendo, por isso, denominada correlação linear. É possível verificar que a cada

    correlação está associada como "imagem" uma relação funcional. Por esse motivo, as

    relações funcionais são chamadas relações perfeitas.

    Como a correlação em estudo tem como "imagem" uma reta ascendente, ela é

    chamada correlação linear positiva.

     Assim, uma correlação é:

    a. linear positiva se os pontos do diagrama têm como "imagem" uma reta

    ascendente;b. linear negativa se os pontos têm como "imagem" uma reta descendente;

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    43/63

    41

    c. não-linear se os pontos têm como "imagem" uma curva .

    Se os pontos apresentam-se dispersos, não oferecendo uma "imagem" definida,

    concluímos que não há relação alguma entre as variáveis em estudo .

    Temos, então:

    6.1.1 Coeficiente de correlação linear

    O instrumento empregado para a medida da correlação linear é o coeficiente de

    correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre

    duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).

    Faremos uso do coeficiente de correlação de Pearson, que é dado por:

    = ∗ ∑ ∑ ∗ ∑   ∗ ∑ ∑ ∗ ∗ ∑ ∑  

    Onde n é o número de observações. Os valores limites de r são -1 e + 1, isto é, o

    valor de r pertence ao intervalo [-1, +1].

     Assim:

      se r = + 1, há uma correlação perfeita e positiva entre as variáveis;

      se r = -1, há uma correlação perfeita e negativa entre as variáveis;

      se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura

    exista não é linear.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    44/63

    42

    Para podermos tirar algumas conclusões significativas sobre o comportamento

    simultâneo das variáveis analisadas, é necessário que:

    0,6 ≤ I r I ≤ 1

    Se 0,3 ≤ I r I ≤ 0,6, há uma correlação relativamente fraca entre as variáveis.

    Se 0 < I r I < 0,3, a correlação é muito fraca e, praticamente, nada podemos

    concluir sobre a relação entre as variáveis em estudo.

    EX29. Vamos, então, calcular o coeficiente de correlação relativo à tabela dada.O

    modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos

    valores de x.y., x2 e y2. Assim:

    Resultado que indica uma correlação linear positiva altamente significativa entre as

    duas variáveis.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    45/63

    43

    Ex 30. Calcule o coeficiente de correlação para os valores das variáveis X i  e Yi 

    abaixo:

     A correlação linear entre as variáveis X e Y é positiva, porém fraca.

    EX31. Um grupo de pesquisadores fez uma avaliação do peso aparente de alguns

    objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se

    a tabela:

    Com os dados apresentados calcule o índice de correlação:

    Xi  Yi  Xi*Yi  Xi2  Yi2 

    18 10 180 324 100

    30 23 690 900 529

    42 33 1386 1764 1089

    62 60 3720 3844 3600

    73 91 6643 5329 8281

    97 98 9506 9409 9604120 159 19080 14400 25281

    442 474 41205 35970 48484

    Xi Yi Xi*Yi Xi2 Yi2

    4 12 48 16 144

    6 10 60 36 100

    8 8 64 64 64

    10 12 120 100 144

    12 14 168 144 196

    40 56 460 360 648

    = ∗ ∑ ∑ ∗ ∑   ∗ ∑ ∑ ∗ ∗ ∑ ∑  

    = 5 ∗ 4 6 0 4 0 ∗ 5 6 5 ∗ 3 6 0 40 ∗ 5 ∗ 6 4 8 56 =0,416 

    = 7∗41205442∗474 7∗35970 442 ∗ 7∗48484 474 =0,981 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    46/63

    44

    6.2 Regressão Linear

    Sempre que desejamos estudar determinada variável em função de outra,

    fazemos uma análise de regressão.

    Podemos dizer que a análise de regressão tem por objetivo descrever, através de

    um modelo matemático, a relação entre duas variáveis, partindo de n observações das

    mesmas.

     A variável sobre a qual desejamos fazer uma estimativa recebe o nome de

    variável dependente e a outra recebe o nome de variável independente.

     Assim, supondo X a variável independente e Y a dependente, vamos procurar

    determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos

    obter uma função definida por:

    Y = aX + b

    Onde os parametros a e b podem ser obtidos pelas formula:

    = ∑ ∑ ∑ ∑ ∑

     

    = ̅ → = ∑ ∑  Exemplo: Dada a tabela abaixo:

    = 1 0 ∗ 4 7 3 6 5 ∗ 6 510∗ 481 65 =0,8632  = 650,8632∗6510 =0,8893 =0,86+0,89

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    47/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    48/63

    46

    Xi  Yi  Xi*Yi  Xi2  Yi2 

    0 34 0 0 11561 36 36 1 12962 36 72 4 1296

    3 38 114 9 14444 41 164 16 16815 42 210 25 17646 43 258 36 1849

    7 44 308 49 19368 46 368 64 2116

    36 360 1530 204 14538

    c) = 1 , 5 + 3 4  = 1 , 5 ∗ 9 + 3 4 = 4 7 , 5 =1,5∗1989+2936=47,5 

    a) 

    = 9 ∗ 1 5 3 0 3 6 ∗ 3 6 0 9 ∗ 2 0 4 36 ∗ 9∗14538 360 

    =0,989 b)  = 9∗ 1530 36∗ 3609 ∗ 2 0 4 36 =1,5  = 3601,5∗369 = 34  = + → = 1 , 5 + 3 4 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    49/63

    47

    7 Analise combinatória

    7.1 Fatorial

    Seja n um número natural, tal que n2. Denomina-se fatorial de n e representado

    por n! o produto de todos os números naturais de n a 1, ou seja:

      Para n  N e n  2,

    12)...2)(1(!     nnnn 

      Para n=1 e n=0 define-se n!=1, isto é

    1!=1 e 0!=1

    Na utilização da calculadora podemos observar a existência de uma tecla n!,

    para a realização do cálculo fatorial. Vamos analisar alguns exemplos:

    a) 12012345!5    

    b)40320!567812345678!8  

     c) 8006283!8910!10    

    Em probabilidade, muitas vezes devemos calcular expressões como !!, e paracalculá-la devemos recorrer a seguinte simplificação:

    336678!5

    !5678

    !5

    !8

     

    De um modo geral, podemos escrever:

    ...)!2)(1()!1(!     nnnnnn 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    50/63

    48

    7.2 Princípio fundamental da contagem  – PFC

    Suponhamos que uma ação seja constituída de duas etapas sucessivas. A

    primeira etapa pode ser realizada de p maneiras distintas. Para cada uma dessas

    possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas. Então, o número

    de possibilidades de se efetuar a ação completa é dado por p x q.

    EX1. No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do

    alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado?

    Imaginemos a seguinte situação: Placa ACD – 2172.

    Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos

    (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como

    pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação

    aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4

    lugares, portanto:

    26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.

    EX2. No sistema antigo utilizavam se 2 letras do alfabeto e 4 algarismos. Qual o

    número máximo de veículos que podia ser licenciado neste sistema?

    26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.

    Concluímos que a inclusão de apenas uma letra faz com que sejam licenciados,

    aproximadamente, mais 170.000.000 de veículos.

    EX3. Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos

    distintos podemos formar?1ª escolha do algarismo das centenas: são seis possibilidades.

    2ª escolha do algarismo das dezenas: como não pode haver repetição de

    algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena.

     Assim, há cinco possibilidades.

    3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos

    dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro

    possibilidades.Pelo PFC, o resultado é: 6 x 5 x 4 = 120 números

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    51/63

    49

    EX4. Quantos números de três algarismos podemos formar com os algarismos 0,

    1, 2, 3, 4, 5, 6 e 7 ?

     Algarismo das centenas: com exceção do zero, qualquer um dos algarismos

    dados pode ser escolhido, havendo, portanto, sete possibilidades.

     Algarismo das dezenas e unidades não há restrição alguma

    Logo, pelo PFC: 7 x 8 x 8 = 448.

    7.3 Arranjos simples

    Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,

    tomados k a k, a qualquer seqüência ordenada de k elementos distintos escolhidosentre os n existentes.

    Ex5. Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses

    quatro elementos tomados dois a dois. A4,2

    (1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3).

    Notamos que (2, 3) ≠  (3, 2), isto é, a troca na ordem dos elementos de um

    possível agrupamento gera um agrupamento diferente.

    EX6. Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do

    cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa tentar abrir o

    cofre, quantas tentativas deverá fazer (no máximo) para conseguir abri-lo?

     As seqüências serão do tipo xyz. Para a primeira posição teremos 10 alternativas,

    para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de arranjos pelo PFC,

    chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3

    7.3.1 Cálculo do número de arranjos

    Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para

    o número de arranjos dos n elementos tomados k a k (An,k).

     , = ! ! 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    52/63

    50

    EX7. O quadrangular de um torneio de futebol é disputado por quatro seleções. De

    quantas maneiras distintas podemos ter os três primeiros colocados?

     , = 4!4 3! = 24 EX8. Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com

    3 letras podem ser montados?

     , = 26!2 6 3! =15600 

    EX9. A senha de um cartão de banco é formada por duas letras distintas seguidas por

    uma seqüência de três algarismos distintos. Quantas senhas poderiam ser

    confeccionadas?

    1° As letras A26,2 = 650

    2° Os Números A10,3 = 720

    Pelo PFC A26,2 x A10,3 = 650 x 720 = 468.000.

    7.4 Permutações simples

    De outro modo, podemos entender permutação simples como um caso especial de

    arranjo, onde n = k.

    = ! EX10. Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é

    qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou

    sem sentido: SOL, SLO, OSL, OLS, LOS, LSO.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    53/63

    51

    7.4.1 Permutações com elementos repetidos

    Se entre os n elementos de um conjunto, existem a elementos repetidos, b

    elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de

    permutações que podemos formar é dado por:

    ,, ! ! ∗ ! ∗ ! EX11. Determine o número de anagramas da palavra MATEMÁTICA Temos 10

    elementos, com repetições. A letra M está repetida duas vezes, a letra A três, a letra T,

    duas vezes. Na fórmula anterior, teremos:

    ,, 10!2 ! ∗ 3 ! ∗ 2 ! =151200 

    7.5 Combinações simples

    Dado um conjunto A com n elementos distintos, chama-se combinação dos n

    elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto

    é, temos uma combinação quando os agrupamentos conseguidos permanecem iguais

    ao se inverter a posição dos seus elementos.

    Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de

    três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís,

    Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos de

    três.

    , !! ! 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    54/63

    52

    EX12. Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de

    três alunos para representação discente na universidade. De quantas maneiras

    podemos fazer tal escolha?

    Neste caso tanto faz a posição dos três alunos no conjunto ( A, B, C); (B, A, C) ....

    desde que os três sejam os escolhidos

    Se fosse importante a ordem deles nos subconjunto usaríamos o Arranjo simples

     , = 10!1 0 3! =720 Mas não nos importa a ordem então utilizaremos a combinação simples.

    , 10!3! 1 0 3! =120 Ex13. Uma loja de materiais de construção oferece 15 tipos de pisos diferentes

    a) De quantas maneiras se pode escolher três tipos desses pisos?

    b) Suponha que certo comprador sempre opte por um piso tipo A. Como poderão

    ser escolhidos os outros dois pisos?

    a) Escolher os pisos {A, B, C} é o mesmo que escolher os Pisos {C, B, A}. Assim,

    cada possível escolha é uma combinação dos 15 pisos tomados três a três

    , 15!3! 1 5 3! =455 b) Como um dos pisos já foi definido, os outros dois serão escolhidos entre os 14

    restantes.

    , 14!3! 1 4 3! =364 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    55/63

    53

    7.6 Números Binomiais

    Sejam n e p dois números naturais quaisquer e tais que n   p. Denomina-se

    número binomial, e indica-se por  , o número assim definido:   = !! ! 

    Onde n,p  N e n  p, e devemos lembrar que n é o numerador e p é a classe do

    número binomial

      , e lê-se: binomial n classe p.

    Vamos calcular o seguinte exemplo, aplicando-se a expressão dada acima:

    73  = 7!3! 7 3! = 7!3! ∗ 4! = 7 ∗ 6 ∗ 5 ∗ 4 !3 ∗ 2 ∗ 1 ∗ 4 ! = 35 Existem também os binomiais complementares, que recebem esta

    denominação, quando dois números binomiais apresentam o mesmo numerador, e asoma de suas classes é igual a esse numerador, isto é, se n, p, q   N, então:

        São complementares se p+q=n.Vamos analisar os seguintes exemplos:

    156   159   Observamos que a soma: 6+9=15Dois números binominais complementares são iguais, se n, p, q  N, isto é:

    p + q=n   =   Devemos observar como conseqüência dessa propriedade dos números

    binominais complementares, a seguinte relação:

    Para n, p  N e np

      n p xou p x p

    n

     x

    n

     

     

     

     

     

     

     

     

     

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    56/63

    54

    8 Probabilidade

     A Probabilidade pode ser definida como a possibilidade ou chance de que um

    evento venha a ocorrer. O estudo das probabilidades se justifica pelo fato de a maioriados fenômenos de que trata a Estatística serem de natureza aleatória ou probabilística.

    Fenômenos onde o resultado final depende do acaso são chamados fenômenos

    aleatórios ou experimentos aleatórios.

    8.1 Experimentos ou fenômenos aleatórios

    São aqueles que, mesmo repetidos várias vezes sob condições semelhantes,apresentam resultados imprevisíveis.

     Assim, da afirmação "é provável que o meu time ganhe a partida de hoje" pode

    resultar:

    a. que, apesar do favoritismo, ele perca;

    b. que, como pensamos, ele ganhe;

    c. que empate.

    8.2 Espaço amostral

     A cada experimento correspondem, em geral, vários resultados possíveis. Assim,

    ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa.

    Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.

     Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou

    conjunto universo, representado por S.

    Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:

      lançamento de uma moeda: S = {Ca, Co};

      lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.

    Se lançarmos duas vezes a moeda teremos:

      S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.

    Cada elemento de S que corresponde a um resultado recebe o nome de ponto

    amostral.

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    57/63

    55

    8.3 Eventos

    Chamamos de evento qualquer subconjunto de espaço amostral S de um

    experimento aleatório.

     Assim, qualquer que seja E, se E C S (E está contido em S), então E é um evento

    de S.

    Se E = S, E é chamado evento certo;

    Se E C S e E é um conjunto unitário, E é chamado evento elementar. Se

    E=conjunto vazio, então é chamado evento impossível.

    Ex1.

    No lançamento de um dado, onde S = {1,2,3,4,5,6}, temos:

     A = {2,4,6} C S; logo, A é um evento de S;

    B = {1,2,3,4,5,6} C S; logo, B é um evento certo de S;

    C = {4} C S; logo, C é um evento elementar de S;

    D = C S; logo, D é um evento impossível de S.

    8.4 Função Probabilidade

    Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir

    que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é

    um conjunto equiprovável.

    Chamamos de probabilidade de um evento A (A C S) o número real P(A), tal que:

    n(A) é o número de elementos de A;

    n(S) é o número de elementos de S.

    Ex2:

      a) Considerando o lançamento de uma moeda e o evento A "obter cara", temos:

    S = {Ca, Co} n(S) = 2

     A = {Ca) n(A ) = 1

     

    S n An

     A P   

    2

    1 A P 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    58/63

    56

    O resultado acima nos permite afirmar que, ao lançarmos uma moeda

    equilibrada, temos 50% de chance de que apareça cara na face superior.

     b) Considerando o lançamento de um dado, vamos calcular:

    1° Probabilidade do evento A "obter um número par na face superior".

    Temos:

    S = {1, 2, 3, 4, 5, 6} n(S) = 6

     A = {2, 4, 6} n(A) = 3

    2° Probabilidade do evento B "obter um número menor ou igual a 6 na face superior" .

    Temos:

    S = {1, 2, 3, 4, 5, 6} n(S) = 6

    B = {1, 2,3, 4, 5, 6} n(B) = 6

    8.5 Eventos complementares

    Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de queele ocorra (sucesso) e “q” a probabilidade de que ele não ocorra (fracasso), para ummesmo evento existe sempre a relação:

    p + q = 1 q = 1  – p

     Assim, se a probabilidade de se realizar o evento é5

    1 p , a probabilidade de que

    ele não ocorra é5

    4q .

    8.6 Eventos independentes

    Dizemos que dois eventos são independentes quando a realização ou a não-

    realização de um dos eventos não afeta a probabilidade de realização do outro e vice-

    versa.

    Por exemplo, quando lançamos dois dados, o resultado obtido em um deles

    independe do resultado obtido no outro.

    2

    1

    6

    3 A P 

      16

    6 A P 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    59/63

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    60/63

    58

    2) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro

    baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho

    ser um rei e a do segundo ser o 5 de paus?

    = 452 ∗ 152 = 42704 = 1676 

    3)

     

    4)

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    61/63

    59

    5)

    6)

    a) 14/16 = 7/8

    b) 10/16 = 5/8

    c)10/16 + 2/16 = 3/4

    a) 10/16 * 9/15 = 90/ 240 = 3/8

    b) = 7/8

    c) 14/16 * 13/15 = 91/120

    d) 6/16 * 5/15 = 1/8

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    62/63

    60

    9 Distribuição Binomial

    Uma distribuição de probabilidade binomial resulta de um experimento que

    satisfaz os seguintes requisitos:

      O experimento deve ser repetido, nas mesmas condições, um número finito de

    vezes (n);

      As tentativas devem ser independentes, ou seja, o resultado de uma não afeta

    os resultados das sucessivas;

      Cada tentativa deve ter todos os resultados classificados em duas categorias

    (sucesso e insucesso);

      No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q

    (q = 1 – p) do insucesso devem permanecer constantes.

    Se um experimento satisfaz esses quatro requisitos, a distribuição da variável

    aleatória x   é chamada de distribuição de probabilidade binomial ou (distribuição

    binomial).

    Em uma distribuição binomial, as probabilidades podem ser calculadas atravésda fórmula da probabilidade binomial.

    = !! ! ∗ ∗ − 

    Onde: n = número de tentativas

    k = número de sucessos em n tentativas

    p = probabilidade de sucesso em qualquer tentativa

    q = probabilidade de fracasso em qualquer tentativa (q = 1  – p) 

  • 8/18/2019 Apostila Estatistica-Prof. Fabio

    63/63

    Ex1. Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a

    probabilidade de obter 3 caras, nessas 5 provas. Para o exemplo dado temos que:

    n= 5

    k=3

    p =  ( probabilidade de obter cara – sucesso)q =   (probabilidade de obter coroa – insucesso)Daí:

    3 =5!

    3! ∗ 5 3! ∗ (12)

    ∗ (12)

    =5!

    3! ∗ 2! ∗18 ∗

    14 =

    516

     

    Ex2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de

    o time A ganhar 4 jogos.

    n = 6

    k = 4

    p = 1/3 (Pode ganhar empatar ou perder)

    q = 1 – 1/3 = 2/3

    4 = 6!4! ∗ 6 4! ∗ (13) ∗ (23)

    − = 6!4! ∗ 2! ∗ 181 ∗ 29 = 20243