Morcillo - Estatisticas

133
AMOSTRAS E POPULAÇÕES André Moreno Morcillo 1   Nem sempre é possível incluir no estudo todos os elementos de uma populaçã o, seja em decorrência dos altos custos implicados, por premência de tempo, por questões operacionais, etc. Nestes casos, a solução é estudar um grupo (amostra) desta  população. Por mais adequado que seja o planejamento e a execução do processo de amostragem, os resultados obtidos a partir de amostras raramente são iguais aos da  população. A média, o desvio padrão e outros parâmetros da amostra serão  provavelmente próximos aos da população de origem, mas raramente iguais. Esta diferença se deve ao acaso, fenômeno também chamado de erro amostral. Considerando que o processo de seleção da amostra foi realizado de forma técnica correta, o tamanho da amostra (n) passa a ser o principal responsável para diminuir a importância do erro amostral. Amostras com pequeno número de casos geram dados mais imprecisos; quanto maior o n mais seus parâmetros se aproximarão daqueles da  população. Daí a importância que no momento se dá ao dimensionamento da amostra durante a elaboração do projeto e da apresentação do chamado Intervalo de Confiança nos resultados. Ambos tentam tornar claro ao leitor o grau de precisão dos nossos resultados. A relação existente entre os parâmetros (média e variância) da população e das amostras podem ser deduzidas a partir de um exemplo bastante simples.  Na tabela 1 e figura 1 são apresentadas as idades de uma população de crianças com uma doença muito rara. Tabela 1 – Idades (anos) Caso Idade (anos)  paciente 1 2  paciente 2 4  paciente 3 6  paciente 4 8 1  Professor Doutor do Departamento de Pediatria da FCM/Unicamp 1

Transcript of Morcillo - Estatisticas

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 1/133

AMOSTRAS E POPULAÇÕES 

André Moreno Morcillo1 

 Nem sempre é possível incluir no estudo todos os elementos de uma população, seja em

decorrência dos altos custos implicados, por premência de tempo, por questões

operacionais, etc. Nestes casos, a solução é estudar um grupo (amostra) desta

 população. Por mais adequado que seja o planejamento e a execução do processo de

amostragem, os resultados obtidos a partir de amostras raramente são iguais aos da

 população. A média, o desvio padrão e outros parâmetros da amostra serão

 provavelmente próximos aos da população de origem, mas raramente iguais. Esta

diferença se deve ao acaso, fenômeno também chamado de erro amostral.

Considerando que o processo de seleção da amostra foi realizado de forma técnica

correta, o tamanho da amostra (n) passa a ser o principal responsável para diminuir a

importância do erro amostral. Amostras com pequeno número de casos geram dados

mais imprecisos; quanto maior o n mais seus parâmetros se aproximarão daqueles da

 população.

Daí a importância que no momento se dá ao dimensionamento da amostra durante aelaboração do projeto e da apresentação do chamado Intervalo de Confiança nos

resultados. Ambos tentam tornar claro ao leitor o grau de precisão dos nossos

resultados.

A relação existente entre os parâmetros (média e variância) da população e das

amostras podem ser deduzidas a partir de um exemplo bastante simples. Na tabela 1 e figura 1 são apresentadas as idades de uma população de crianças com

uma doença muito rara.

Tabela 1 – Idades (anos)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 2/133

 

Idade (anos) 8 6 4 2 

Fre

ên

cia 

2,0 

1,0 

0,0 

  Figura 1 – Distribuição das idades (anos)

Como estes quatro pacientes formam uma população, seus parâmetros são:

54

20===∑

n

 xµ   

( )5,0

44

202

120

nn

x2

x2σ

2   =−

=∑−∑

=  

Se não pudéssemos estudar todos as crianças, poderíamos sortear amostras com um,

dois ou três elementos. Sabemos que amostras com n=1 serão imprecisas, com n=3

muito melhor, mas vamos estudar o comportamento de amostras com n=2.

Considerando um processo de amostragem com reposição, teremos 16 possibilidades decomposição, cada uma com sua média e desvio padrão. Como tomamos todas as

amostras possíveis, neste caso temos uma "população de amostras" e uma "população

de médias das amostras". As amostras e suas médias são apresentadas na tabela 2 e

figura 2.

Tabela 2 -Distribuição das amostras de 2 elementos e suas médias (anos)

Amostras Média da amostra ( x )

2 e 2 22 e 4 32 e 6 42 8 5

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 3/133

 

Os parâmetros desta população de médias amostrais são:

516

80===

∑µn

 x

 x 

( )

5,2

16

1680440

n

n

xx

x

22

2

2 =−

=

∑−∑

=σ  

1. A média da população de médias  das amostras (µ ) é igual à média da

 população (µ)

 x

2. A variância das médias amostrais (σ2

x) é menor que a da população inicial (σ2).

A razão entre a variância da população e a variância das médias amostrais é:

amostrasdastamanho n

x

⇒===σσ

25,2

0,52

2

 

3. A distribuição das médias amostrais tem distribuição aproximadamente normal.

Distribuição das m édias das amostras 

8,0 - 10,0 6,0 - 8,0 4,0 - 6,0 2,0 - 4,0 0,0 - 2,0 

Fr 

eq

üê

6 5 

1 0

 

 Figura 2 – Distribuição das médias das amostras

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 4/133

distribuição. Na pesquisa o caminho é diferente: só conhecemos alguns dados de uma

das possíveis amostras e queremos concluir a respeito da população. Como isto é

 possível?

CONCEITOS FUNDAMENTAIS:

1. Sabe-se que a média de uma amostra obtida em condições técnicas razoáveis é um

 bom parâmetro da média da população que a originou.

2. A variância de uma amostra quando calculada com n-1 casos é um bom parâmetro

da variância da população que a originou.

3. Quando a população de estudo tem distribuição normal, as médias amostrais têm

distribuição normal; nos casos em que a população de estudo não tem distribuição

normal, a distribuição das médias amostrais tem distribuição aproximadamentenormal se o tamanho das amostras for grande (n>30).

Transformando-se algebricamente a fórmula anterior:

nx =σ

σ2

2

  e nx

σ

=

22

σ  

nnEPx

σ=σ=

2

  (1)

Aplicando-se a fórmula (1) com os parâmetros obtidos de uma amostra qualquer

teremos:

n

sEPx =  

A partir da média da amostra e do Erro Padrão podemos determinar o intervalo de

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 5/133

790,040

0,5

=== n

s

EPx  

2. Como n é maior que 30 as médias das amostras tem distribuição normal ou

aproximadamente normal. Assim, a seguir calculamos o valor de z equivalente a

98 cm considerando a média 100,0 cm e o erro padrão igual a 0,790 cm.

531,2790,0

10098−=

−=

µ−=

EP

xz

x

 

A probabilidade de uma amostra com 40 casos ter média menor que 98cm é equivalente

à probabilidade de z < -2,531 (probabilidade da curva normal reduzida), que é igual a

0,005687 ou 0,56 % (figura 3).

Probability Density Function

y=normal(x;0;1)

0,00

0,15

0,30

0,45

0,60

-3,50 -1,75 0,00 1,75 3,50

 

 Figura 3 – Curva normal

I NTERVALO DE CONFIANÇA DA MÉDIA POPULACIONAL 

A primeira aplicação prática destes conceitos é a determinação do intervalo de

confiança da média populacional [IC] a partir das informações obtidas de uma amostra

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 6/133

A amplitude do intervalo de confiança [IC] está relacionada com a precisão desejada.

Para um intervalo de confiança de 95% (IC95%), usamos z = 1,96; para IC99%

tomamos z = 2,58; para IC90% o valor de z será 1,64.

O intervalo de confiança tem dois limites:

1. Limite inferior: que é igual à média + z.EP

2. Limite superior: que é igual à média - z.EP

.EPx.EP 2/2/  z  z  x   αα   +⇔−  

Para o cálculo do IC95% o cálculo é apresentado abaixo.

1,96.EPxEP.96,1   +⇔− x  

Por exemplo, um pesquisador ao estudar a altura de uma amostra da 120 crianças obteve

média 120 cm e desvio padrão de 5,6 cm. O intervalo de confiança de 95% [IC95%] da

média populacional será:

511,0120

6,5===

n

 s EP   

131,95]-[108,08IC95%

1)1,96.(0,51120 |---| 1)1,96.(0,51-120

1,96.EPxEPx

=

+

+⇔− .96,1

 

Estima-se com 95% de precisão que a média populacional esteja contida no intervalo

108,08 cm a 131,95 cm.

OS CASOS COM PEQUENAS AMOSTRAS 

Quando as amostras são pequenas (n < 30) temos que fazer uma pequena modificação

no procedimento. Trocamos z pelo valor de t, estatística que leva em consideração o

número de casos estudado.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 7/133

 

DETERMINANDO O TAMANHO DA AMOSTRA 

Para calcular o número de casos (n) que terão que ser incluídos na amostra

necessitaremos de informações sobre a média e o desvio padrão da variável que vamos

estudar, que podem ser obtidas da literatura ou então de estudos piloto. Empiricamente

estabelece-se a amplitude do intervalo de confiança desejado.Sabendo-se que µ + 1,96.(EP) = µ - 1,96.(EP), chamaremos d = µ + 1,96.(EP).

Usaremos  x  no lugar de µ e s no lugar de σ.

n

sEPx =  

d

s

n

d

sn

n

s1,96.d

EPd X

2

22

.96,1

.96,1

.96,1

=

=

=

=

 

Exemplo: se um pesquisador planeja estudar a altura de crianças, inicialmente realiza

um estudo piloto a partir do qual obteve média = 120 cm e desvio padrão = 5,6 cm.

Arbitrariamente define d = 1% da média da amostra (1,2 cm) e IC95%. O número

mínimo de casos a ser incluído na amostra será:

77,2144,1

36,31.8416,3.96,1

2

22 =

 

  

 ==

 sn  

Portanto, serão necessários somente 22 casos para se obter a precisão desejada com

confiança de 95%

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 8/133

3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas

Científica de Ribeirão Preto, 2002.4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.

6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.

8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.

11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.

13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos

Editora Ltda, 1999.

15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 9/133

COMPARAÇÃO DE TRÊS OU MAIS AMOSTRAS INDEPENDENTES 

A NÁLISE DE VARIÂNCIA  André M. Morcillo1 

A comparação de três ou mais amostras independentes, tomadas ao acaso, de uma população com

distribuição normal, deve ser realizada pela Análise de Variância, que. tem sido considerada a mais

importante e poderosa prova paramétrica.

Apesar das hipóteses de trabalho contemplarem a igualdade ou não das médias, toda a análise é realizada

comparando a dispersão dos dados das amostras.

Esta prova exige:

1. a variável estudada deve ser contínua e ter distribuição normal

2. as amostras devem ser independentes e tomadas ao acaso

3. as variâncias das amostras devem ser homogêneas (“iguais”).

Se forem tomadas duas amostras razoavelmente grandes, ao acaso, de uma determinada população com

distribuição normal, observa-se que as médias e respectivas variâncias têm valores muito próximos, não

exatamente iguais. Esta diferença expressa o papel do acaso, o chamado erro amostral, que ocorreu na

seleção dos elementos.

Como as variâncias são homogêneas, as dispersões das amostras são muito semelhantes. O mesmo ocorre

em relação às médias. Um gráfico de toda a população e das amostras que se está estudando, mostrará que

as curvas praticamente se sobrepõem.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 10/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Por outro lado, se no caso extremo, as amostras tivessem sido tomadas de duas populações distintas, suas

médias e variâncias seriam diferentes. Teremos distribuições totalmente diferentes.

m e d i a 1

m e d i a 2med ia g e r a l

 

G r u p o 2G r u p o 1

 

O princípio da análise de variância é comparar a dispersão dos dados entre as amostras com a dispersão

observada dentro das mesmas.

A dispersão observada, considerando todos os N elementos que compõem a população, pode ser dividida

em:

1. a dispersão observada dentro dos grupos

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 11/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Uma boa maneira de avaliar a dispersão de um conjunto de dados é estudar o desvio que cada elemento

tem em relação à média, mais precisamente, o quadrado destes desvios. Considerando uma observação

qualquer xi e a média da amostra de  x , o quadrado do seu desvio será:

( ) x xiQD   −= 2  

A soma dos quadrados dos desvios (SQD) de todos os n elementos da amostra será:

( )∑   −=

=n

i x xiSQD

12  

Calculando a SQD da população ou SQD total (SQDT)

A partir do conceito acima, pode-se calcular a soma dos quadrados dos desvios, em relação à média da

 população, para o conjunto das N observações envolvidas no estudo:

 N 

 X 

 X 

 N 

i∑== 1  

O cálculo da soma dos quadrados dos desvios passa a ser: .

( )∑   −=

= N 

iT   X  X SQD

1

Calculando a SQD dentro das amostras (SQDD)

Calcula-se a soma dos quadrados dos desvios de cada amostra. Tem-se uma SQD da primeira amostra,

outra para a segunda, etc., cuja soma recebe o nome de soma dos quadrados dos desvios dentro dos

grupos (SQDD). A SQDD expressa a variação ocorrida dentro dos grupos em decorrência do acaso - o

chamado Erro Amostral.

SQDD = SQD1 + SQD2 + SQD3 + ... + SQDk

( ) ( ) ( ) ( )∑ ∑ ∑ −−−∑ − ++++=n n nn

D xxxxxxxxSQD kiiii2222

...321  

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 12/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

A SQDE  é fundamental na Análise de Variância, pois expressa a variação ocorrida na formação dos

grupos. Se o fator que se estuda tem significativo impacto, haverá grande diferença entre os grupos, queresultará em importante desvio entre os grupos (SQDE).

Comparando as somas dos quadrados dos desvios 

Como saber se uma determinada SQD=15 é ou não maior do que outra SQD=13 ?

Esta comparação torna-se mais clara quando se leva em conta o tamanho das amostras envolvidas.

Calcula-se a média das somas dos quadrados dos desvios (QMD) de cada amostra:

n

SQDQMD =  

Uma amostra com 20 elementos e SQD = 15 tem QMD = 15/20 = 0,75 . Outra com 10 elementos com

SQD=13 terá QMD = 13/10 = 1,3

Portanto, compara-se as médias das somas dos quadrados (QMD), porém, estas serão calculadas a partir

dos respectivos graus de liberdade, que é o número de elementos de cada amostra menos um [gli= ni - 1].

Assim, os quadrados médios serão calculados da seguinte forma:

 gl SQDQMD =  

Quadrado médio dentro das amostras (QMDD)

O QMDD é calculado a partir da SQDD e seus graus de liberdade (N-k) [gld = N - k] 

k  N 

SQDQMD  D

 D −=  

k

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 13/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

1−=

SQDQMD  E 

 E 

 

Calculando a estatística F

A estatística F avalia a relação existente entre o QMDE e o QMDD. Quanto maior a diferença entre os

grupos, maior será o valor de F.

QMD

QMD

 D

 E  F  =  

Teste de hipótese

A Análise de Variância avalia se as amostras, que têm variâncias homogêneas, têm médias iguais ou

diferentes. A hipótese inicial prevê a igualdade das médias, enquanto que a hipótese alternativa afirma

que pelo menos uma das médias é diferente (o que significa dizer que pelo menos uma amostra não é procedente da mesma população).

H0 : todas as médias das amostras são iguaisH1 : pelo menos uma amostra tem média diferente

As hipóteses também poderiam ser escritas da seguinte forma:

x...xxx :HO k 321   ====  

x...xxx :H1k 321

  ≠≠≠≠  

Uma vez estabelecido o nível de significância desejado (α) e calculada a estatística F. Procura-se na

tabela de distribuição de F o valor de Fcrítico para k-1 graus de liberdade entre os grupos e N-k graus de

liberdade dentro dos grupos.

Se o valor de F obtido é igual ou maior ao Fcrítico rejeita-se H0

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 14/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Exemplo: desejando saber se havia diferença significativa entre as idades de crianças de três classes da

quarta série de uma escola do ensino fundamental, um pesquisador tomou uma amostra ao acaso (n=15)de cada classe.

 H0 : não há diferença entre as idades das crianças das três classes

 H1 : pelo menos uma classe tem crianças com idades diferentes

 Nível de significância adotado: 0,05 

Calculando a Soma dos Quadrados das Diferenças do Total (SQDT)

1. Calculando a soma das idades de todas as crianças: ΣX = 450

2. Calculando a média (geral) de todas as crianças: 1045

450== X   

3. Calculando o quadrado da diferença de cada criança em relação à media geral: ( )   X  X  −2

4. Calculando a soma dos quadrados das diferenças de todas as crianças: ( ) 461

2== ∑   −

=

 N 

iT   X  X SQD  

Classe A Classe B Classe C

 X   ( ) X  X  −2

  X ( ) X  X  −

 X ( ) X  X  −2

 

8,00 4,00 10,00 0,00 10,00 0,008,00 4,00 11,00 1,00 11,00 1,00

11,00 1,00 9,00 1,00 10,00 0,00

11,00 1,00 10,00 0,00 10,00 0,00

11,00 1,00 9,00 1,00 10,00 0,00

10,00 0,00 10,00 0,00 9,00 1,00

9,00 1,00 9,00 1,00 7,00 9,00

12,00 4,00 11,00 1,00 11,00 1,00

10,00 0,00 11,00 1,00 11,00 1,00

10,00 0,00 9,00 1,00 11,00 1,00

11,00 1,00 10,00 0,00 10,00 0,00

10,00 0,00 10,00 0,00 9,00 1,00

10,00 0,00 10,00 0,00 10,00 0,00

11,00 1,00 10,00 0,00 12,00 4,00

9 00 1 00 10 00 0 00 9 00 1 00

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 15/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Calculando a Soma dos Quadrados das Diferenças dentro dos grupos (SQDD)

1. Calculando a média das idades das crianças dentro de cada classe:n

 x

 x

n

i∑== 1  

2. C o quadrado da diferença de cada criança em relação à media da respectiva classe:alculando( ) x x− 2

 

3. Calculando a soma dos quadrados das diferenças dentro cada classe: ( )∑   −=  x xSQD2

 

4. Calculando a soma dos quadrados das diferenças dentro das três classes:

SQDD= SQDClasse A + SQDClasse B + SQDClasse C 

SQDD= 18,9335 + 6,9335 + 20 = 45,867

Classe A Classe B Classe C

 x   ( ) x x− 2    x   ( ) x x− 2    x   ( ) x x− 2  

8,00 4,2711 10,00 0,0044 10,00 0,00008,00

4,2711 11,00 1,1378 11,00 1,000011,00

0,8711 9,00 0,8711 10,00 0,000011,00

0,8711 10,00 0,0044 10,00 0,000011,00

0,8711 9,00 0,8711 10,00 0,000010,000,0044 10,00 0,0044 9,00 1,0000

9,001,1378 9,00 0,8711 7,00 9,0000

12,003,7378 11,00 1,1378 11,00 1,0000

10,000,0044 11,00 1,1378 11,00 1,0000

10,000,0044 9,00 0,8711 11,00 1,0000

11,000,8711 10,00 0,0044 10,00 0,0000

10,000,0044 10,00 0,0044 9,00 1,0000

10,000,0044 10,00 0,0044 10,00 0,0000

11,000,8711 10,00 0,0044 12,00 4,0000

9,001,1378 10,00 0,0044 9,00 1,0000

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 16/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Construindo a tabela da Análise de Variância

Uma forma clássica de apresentação dos dados da análise de variância é a da tabela abaixo:

SQD Gl QMD F

Entre as amostras 0,1339 2 0,06695 0,061307

Dentro das amostras 45,8661 42 1,09205

Do total (as três amostras juntas) 46 44

Comparando o F calculado e tomando decisão

F = QMDE / QMDD = 0,06695 / 1,09205 = 0,061307

O valor de F crítico para 2 gl  entre as classe e 42 gl  dentro das classes é F =0,05;2;42 = 4,05 

Como o F calculado é menor que o Fcrítico não se pode rejeitar H0, concluindo que as três classes têmmédias de idade iguais.

 x A =  x B =  x C 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 17/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

FORMA PRÁTICA PARA CALCULAR AS SOMAS DE QUADRADOS 

Há uma forma mais simples que permite que as somas dos quadrados sejam calculadas sem usar

diretamente os desvios (  x x− 2) , diminuindo o número operações efetuadas e, consequentemente, de erros

cometidos. Serão utilizados nos cálculos somente os valores originais (x) e seus quadrados (x2).

Calculando a soma dos quadrados do conjunto das amostras (SQDT)

( ) N 

 X  X SQD

∑−= ∑

22  

onde

ΣX : soma de todos os elementosΣX2 : soma dos quadrados de todos os elementosn : número de elementos da amostra i N: total de elementos de todas as amostras

Calculando a soma dos quadrados dos desvios dentro das amostras (SQDD)

( )∑ ∑=  

 

 

 

 ∑

−  

  =

 K 

 I  D n

 x xSQD

1

22  

onde

Σx : soma de todos os elementos da amostra ix2 : quadrado de qualquer elemento da amostra i n : número de elementos da amostra i 

Calculando a soma dos quadrados dos desvios entre as amostras (SQDE)

SQDDSQDTSQDE   −=  

Calculando os quadrados médios das diferenças (QMD)

QMDE = SQDE / k-1

QMDD = SQDD / N – k

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 18/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

Classe A Classe B Classe C

 x   x2   x   x2   x   x2 

8,00 64 10,00 100 10,00 1008,00 64 11,00 121 11,00 121

11,00 121 9,00 81 10,00 100

11,00 121 10,00 100 10,00 100

11,00 121 9,00 81 10,00 100

10,00 100 10,00 100 9,00 819,00 81 9,00 81 7,00 49

12,00 144 11,00 121 11,00 121

10,00 100 11,00 121 11,00 121

10,00 100 9,00 81 11,00 121

11,00 121 10,00 100 10,00 100

10,00 100 10,00 100 9,00 81

10,00 100 10,00 100 10,00 100

11,00 121 10,00 100 12,00 144

9,00 81 10,00 100 9,00 81

151 1539 149 1487 150 1520

Soma de x Soma de x2  n

Classe A 151 1539 15

Classe B 149 1487 15

Classe C 150 1520 15

Total 450 4546 45

SQDT = 4546 - (450)2

 / 45 = 46SQDD = 18,9333 + 6,9333 + 20 =45,867

SQDE = 46 – 45,867 = 0,133

QMDE = 0,133 / 2 = 0,0665

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 19/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

ESTUDANDO A HOMOGENEIDADE DAS VARIÂNCIAS - O TESTE DE BARTLETT 

Antes de iniciar a Análise de Variância é importante demonstrar que as variâncias das amostras são

homogêneas ("iguais"). Para isto emprega-se o Teste de Bartlett, uma forma de χ2 que indica se há ou não

diferenças significantes entre as variâncias dos grupos estudados.

Teste de Bartlett para k  amostras de mesmo tamanho n (n1=n2=n3=...=nk =n) 

( )    

  

 −××−×=   ∑

=

i s sk n

1

222 loglog13026,2 χ   

onde n é numero de casos das amostras (todas têm o mesmo número de casos) e s2

 é a média aritmética das

variâncias observadas nas k  amostras, calculadas por:

i s

 s∑

== 1

2

Compara-se o χ2 calculado com o χ2crítico com k-1 graus de liberdade. Quando o χ2 calculado for ≥ χ2

crítico rejeita-se a

hipótese de que as amostras sejam homogêneas.

Quando o χ2 for estatisticamente significante, torna-se necessário aplicar um fator de correção (C), tal como segue

abaixo. 

( )13

1

1 −××

+= nk 

C   

 χ χ

22

=

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 20/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

k  N 

SQD

QMD s D

 D −==

2

 

onde SQDD é a soma dos quadrados dos desvios dentro das amostras e N é o número total de elementos encontrados

nas k  amostras. 

( )[ ]   ( )[ ]

×−−−××=   ∑=

i  s s nk  N  1

222

log1log3026,2 χ   

Quando o χ2  for maior que o χ2crítico, deverá ser corrigido da seguinte maneira:

( ) ( ) ( )

 

 

 

 

−−

−×

−×+=   ∑

=k  N 

nk 

C k 

i i

1

1

1

13

11

1

 

C corr 

 χ  χ 

22

=  

Se o χ2corr  for maior ou igual ao χ2

crítico com k-1 graus de liberdade rejeita-se a hipótese de que as amostras sejam

homogêneas. 

Retomando o exemplo anterior:

Classes N n-1  s2  Log s2 

A 15 14 1,352 0,1309766

B 15 14 0,495 -0,3053948

C 15 14 1,429 0,15503222

Retomando o exemplo anterior, todas as amostras têm o mesmo tamanho.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 21/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

( ) (( )

( )( )

321416,4134054,02364,32

019386,0038223,03143026,2

019386,0092,1log31153026,2

2

2

2

=×=

+×××=

−−××−×=

 χ 

 χ 

 χ    )

 

Considerando que são 2 graus de liberdade o valor do χ20,05,2gl é 5,991

Portanto, 

χ2 < χ20,05,2gl 

 Neste caso, por não haver significância não há necessidade de aplicar o fator de correção.

 Não se pode rejeitar a hipótese de que a amostras têm variâncias homogêneas, concluindo-se que as variâncias são

"iguais".

Observação: o teste de Bartlett é poderoso quando a população tem distribuição normal. Não deve ser utilizado

quando esta condição não é observada. Portanto, antes de aplicar o teste de Bartlett deve-se avaliar a condição de

normalidade da população.

BIBLIOGRAFIA

1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.

2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.

2ª ed. São Paulo: Pioneira, 2002.

3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de PesquisasCientífica de Ribeirão Preto, 2002.

4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.

6 BUNCHAFT G Estatística sem mistérios 4ª ed Petrópolis RJ: Vozes 1997

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 22/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e CientíficosEditora Ltda, 1999.

15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 23/133

 Análise de Variância - André Moreno Morcillo

 __________________________________________________________________________________________________  

COMO PROCESSAR NO SPSS 

A estrutura da planilha deve ter duas variáveis: uma que receberá o código dos grupos e a outra para

os dados da variável independente. 

Classe Idade Var0003

1 A 82 A 8

3 A 114 A 115 A 116 ... ...16 B 1017 B 1118 B 919 B 1020 B 9... ... ...31 C 1032 C 1133 C 1034 C 1035 C 10... ... ...

1,223 2 42 ,305IDADE

Levene

Statistic df1 df2 Sig.

Test of Homogeneity of Variances

 

,133 2 6,667E-02 ,061 ,941

45,867 42 1,092

46 000 44

Between

Groups

Within

Groups

Total

IDADE

Sum of 

Squares df  

Mean

Square F Sig.

ANOVA

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 24/133

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 25/133

A CURVA NORMAL  André Moreno Morcillo1 

O conhecimento desta distribuição de probabilidades se deve a Abraham de Moivre

(1667-1754) que, em 1733, apresentou a função que a representa. Tratava-se até então

de um exercício teórico, sem aplicação prática. J. Bernoulli (1654-1705) acreditava que

 poderia haver aplicação na área da economia, no entanto, o uso desses conhecimentos

na prática se deve a Pierre-Simon Laplace (1749-1827) na França e a Johan K. F. Gauss

(1777-1855) na Alemanha. O nome “Curva de Gauss” se deve à suposição que Gauss

tivesse sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1924,

Karl Pearson reafirmou o papel fundamental de Abraham de Moivre.2 

Esta distribuição de probabilidades é definida pela função:

e   σ

µx.

2.πσ.

1y 2

2

2. 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 26/133

Esta curva é definida por dois parâmetros: sua média (µ) e sua variância (σ2). Dessa

forma são possíveis infinitas curvas normais, ora variando a média, ora a sua variância.

Suas principais características são:

A variável x pode assumir qualquer valor real (-∞ a +∞)

Os valores de y são assintóticos em relação ao eixo das abcissas, isto é, nunca tocam oeixo de x.

A curva é simétrica e unimodal, apresentando um ponto de inflexão à esquerda (x = µ -

1σ) e outro à direita (x = µ +1σ). 

Sua aplicação na análise de dados na área biomédica é grande, pois muitas variáveis

numéricas contínuas que estudamos têm distribuição normal ou aproximadamente

normal. Em alguns casos é possível transformá-las, tornando-as compatíveis com a

normal. Como exemplo podemos citar a altura, o peso, o índice de massa corporal, etc.

Alguns dos principais métodos empregados na análise estatística (teste t de Student,

análise de variância, análise de regressão, etc.) exigem que os dados tenham distribuiçãonormal.

Como se trata de distribuição de probabilidade contínua, a área que fica entre a curva e

o eixo das abcissas representa a  probabilidade. A probabilidade de ocorrer um evento

entre os pontos a e b é calculada pela integral definida da função entre os pontos a e b,

representada pela área azul no gráfico seguinte.

 

b µx2

1

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 27/133

 

A probabilidade de ocorrer um evento entre x=-∞  e x=+∞  é igual a 1 ou 100%,representada pela área azul no gráfico seguinte.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 28/133

 

A probabilidade de ocorrer um evento entre x=µ e x=+∞  é 0,5 ou 50%, representada

 pela área azul no gráfico seguinte..

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 29/133

 

A CURVA NORMAL REDUZIDA 

Curvas normais, com qualquer µ e σ, podem ser transformadas em uma normal muito

especial que tem média 0 (µ = 0) e desvio padrão 1 (σ = 1). Esta curva normal com

média 0 e desvio padrão 1 é conhecida como curva normal reduzida. Suas

 probabilidades já foram calculadas e são apresentadas em tabelas de fácil utilização.

Como a normal é simétrica, os livros apresentam somente as probabilidades da metade

direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à

 probabilidade do intervalo equivalente na metade direita.

 Na normal reduzida P(0,z) = p enquanto P(> z) = 0,5 – p

P(-z,0) = P(0,+z)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 30/133

 

COMO USAR A TABELA PARA OBTER AS ÁREAS OU PROBABILIDADE 

A tabela que apresentamos3 dá a probabilidade de ocorrência de um evento entre 0 e z.

 Na margem esquerda temos o valor de z com uma decimal e, se necessitamos considerar

a segunda decimal, a procuramos na margem superior. No interior obtemos as

 probabilidades.

Para calcular a probabilidade de z entre 0 e 1, procuramos na margem esquerda a linha

que tem z = 1,0 e a coluna 0,00 e encontramos o valor 0,3413. Isto significa que a

 probabilidade de encontrar um valor de x entre a média zero e z=1,0 é 0,3413 ou

34,13%.

Por outro lado, para se obter a probabilidade de z maior que 1, calculamos a

 probabilidade de z entre 0 e 1 que é 0,3413 e a seguir fazemos 0,5-0,3413 = 0,1587 ou

15,87%.

Para se obter a probabilidade de z entre 0 e 1,87, procuramos a célula cuja linha é 1,8 e

coluna 0,07 o que resulta o valor 0,4693 ou 46,93%.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 31/133

Curva Normal (p = área entre 0 e z)

segunda casa decimal

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 32/133

 

COMO TRANSFORMAR UMA NORMAL QUALQUER NA NORMAL REDUZIDA 

Devemos calcular o z equivalente aos limites desejados utilizando a fórmula:

 x  z   

onde

x = ponto que se deseja converter em z

µ = média da normal original

σ = desvio padrão da normal original

Dada uma distribuição normal com média 100 e desvio padrão 5, calcule a

 probabilidade x entre 100 e 107.

O procedimento é simples. Precisamos saber qual é o intervalo da normal reduzida que

é equivalente ao intervalo 100 a 107 da normal com média 100 e desvio padrão 5.

Aplicando a fórmula acima, calcula-se o valor de z para x=100 e para x=107.

05

100100 

 x  z   

4,15

100107 

 x  z   

O ponto 100 corresponde a z = 0 e o ponto 107 a z = 1,4. Assim, o intervalo 100-107 é

equivalente ao intervalo 0-1,4 da normal reduzida.

Como a probabilidade de z entre 0 e 1,4 é 0,4192 ou 41,92% podemos afirmar que a

 probabilidade de z entre 100-107 é igual a 0,4192 ou 41,92%

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 33/133

Alguns exemplos de aplicação na área biomédica:

Sabendo-se que a altura de crianças dos sexo masculino aos 4 anos de idade tem

distribuição normal com média 100 cm e desvio padrão 6,0 cm, pergunta-se:

1. Qual é a probabilidade de uma criança ter altura menor que 110 cm?

z = (110 – 100)/6 = 1,67

A probabilidade de 0 < z < 1,67 = 0,4525 . A probabilidade de z < 0 é 0,5

Assim a probabilidade de uma criança ter altura menor que 110 cm é 0,50 +

0,4525 = 0,9525 ou 95,25%

2. Qual é a probabilidade de uma criança ter altura maior que 103 cm?

z = (103 – 100)/6 = 0,50

A probabilidade de 0 < z < 0,50 = 0,1915. A probabilidade de z > 0,50 é

0,50 – 0,1915 = 0,3085 ou 30,85%.

3. Qual é a probabilidade de uma criança ter altura menor que 100 cm?

Assim a probabilidade de uma criança ter altura menor que 100 cm é 0,50 +0,1915 = 0,6915 ou 69,15%.

4. Qual é a probabilidade de uma criança ter altura entre 103 cm e 110 cm?

Para 103 z = 0,50 sendo que a probabilidade de 0 < z < 0,50 é 0,1915

Para 110 z = 1,67 sendo que a probabilidade de 0 < z < 1,67 = 0,4525

A probabilidade de ser maior que 103 e menor que 107 é igual a 0,4525 –

0,1915 = 0,2610 ou 26,10%.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 34/133

4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

5. Bland M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.

8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.

11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.

13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos

Editora Ltda, 1999.

15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

16. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 35/133

ESTATÍSTICA DESCRITIVA 

 André Moreno Morcillo1 

A divulgação de dados de pesquisa requer o uso de técnicas universalmente reconhecidas, de tal

forma, que os trabalhos e relatórios possam ser lidos e avaliados por pesquisadores em

diferentes cidades ou países.

Esta parte da estatística, cujo objetivo é sintetizar e tornar clara a apresentação de dados, é

chamada de estatística descritiva. Entre outras técnicas, utiliza as tabelas, os gráficos, as

medidas de tendência central, de dispersão e de posição, etc.

TABELAS

a) DISTRIBUIÇÃO DE FREQÜÊNCIAS 

Para obtermos uma distribuição de freqüência de dados categóricos, basta contarmos quantos

casos ocorrem em cada categoria. Quanto aos dados numéricos, inicialmente criamos os

intervalos de classe e, posteriormente, contamos quantos casos ocorrem em cada intervalo.

As freqüências das categorias ou intervalos de classe podem ser expressas por seu número

absoluto, pela proporção em relação ao total de casos ou pela porcentagem.

 Avaliação nutricional pelo critério de Gomez de 521 crianças de pré-escolas da cidade de

 Paulínia – São Paulo (Zanolli,1992)2.

Estado NutricionalFreqüência absoluta

(N)Porcentagem

(%) Proporção

Eutrófico 412 79,1 0,79Desnutridos de Iº 104 20,0 0,20

Desnutridos de IIº 5 1,0 0,01

Desnutridos de IIIº 0 0 0

Total 521 100,0 1,0

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 36/133

 Neste caso é conveniente fazer a aproximação para três casas decimais.

O calculo da porcentagem de uma determinada categoria é muito simples: divide-se afreqüência absoluta pelo total e multiplica-se por 100.

 No exemplo anterior, para o grupo dos eutróficos seria:

% = 412 : 521 x 100 = 79,07869 

Geralmente fazemos a aproximação para uma casa decimal que, no exemplo acima, resulta

79,1%.A interpretação destes dados é muito simples. Ao lermos a tabela verificamos que 412 crianças

entre as 512 eram nutridas, o que corresponde a 0,790 ou 79,1% do total.

Em algumas circunstâncias pode interessar ao pesquisador apresentar também a freqüência

acumulada.

 Avaliação nutricional pelo critério de Gomez de 521 crianças de pré-escolas da cidade de

 Paulínia – São Paulo (Zanolli, 1992)3 

Estado NutricionalFreqüência absoluta

(N)

Porcentagem

(%)

Porcentagem acumulada

(%)

Eutrófico 412 79,1 79,1

Desnutridos de Iº 104 20,0 99,1

Desnutridos de IIº 5 1,0 100,1

Desnutridos de IIIº 0 0 0

Total 521 100,1 100,1

Quando trabalhamos com variáveis numéricas contínuas  torna-se necessário agrupar os dados para poder apresentá-los na forma de distribuição de freqüências. Os dados são agrupados em

intervalos de classes, cujo número não deve ser pequeno ou muito grande, recomendando-se que

varie de 5 a 20. Há algumas fórmulas para determinar o número de classes, mas a lógica e o

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 37/133

 

 Distribuição da idade(anos) de 521 crianças de pré-escolas da cidade de Paulínia –

São Paulo (Zanolli, 1992)4.

Classes de Idade(meses)

Freqüência absoluta(N)

Porcentagem(%)

36,0 –| 48,0 35 6,748,0 –| 60,0 70 13,460,0 –| 72,0 168 32,272,0 –| 83,9 204 39,284,0 –| 96,0 44 8,4

Total 521 99,9

 b) DISTRIBUIÇÃO DE FREQÜÊNCIA DE UMA AMOSTRA EM RELAÇÃO A DUAS VARIÁVEIS

QUALITATIVAS – TABELA DE CONTINGÊNCIA 

 Neste caso o objetivo é contruir uma tabela contendo informações sobre o comportamento de

uma população ou amostra com relação a duas variáveis.

 Distribuição de 521 crianças de pré-escolas da cidade de Paulínia – São Paulo em relação ao sexo eà idade (Zanolli,1992)5. 

Sexo

Classes de Idade(meses) Feminino

 N (%)Masculino N (%)

Total

 N (%)

36,0 – 47,9 15 (42,9) 20 (57,1) 35 (100,0)

48,0 – 59,9 41 (58,6) 29 (41,4) 70 (100,0)

60,0 – 71,9 81 (48,2) 87 (51,8) 168 (100,0)

72,0 – 83,9 99 (48,5) 105 (51,5) 204 (100,0)

84 0 95 9 24 (54 5) 20 (45 5) 44 (100 0)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 38/133

 Avaliação nutricional pelo critério de Gomez em relação sexo de 567 crianças matriculadas nas 14creches do município de Paulínia – SP, 1995 (Antonio,1995)6 . 

Sexo Eutrofia D. Leve D. Moderada Total

Masculino 221 (81,0) 49 (17,9) 3 (1,1) 273

Feminino 227 (77,2) 66 (22,4) 1 (0,3) 294

Total 448 (79,0) 115 (20,3) 4 (0,7) 567

 D. Leve – desnutrição de Iº grau; D. Moderada – Desnutrição de IIº; N (%) 

GRÁFICOS

Os dados categóricos podem ser apresentados em gráficos do tipo setorial e de barras, enquanto

os numéricos podem ser apresentados na forma de histograma, diagrama esquemático (box-plot)

e de erro padrão.

a) GRÁFICOS SETORIAIS 

Os gráficos setoriais (pie chart, “pizza”) são indicados para apresentar a distribuição de dados 

qualitativos. A área do círculo atribuída para cada categoria é proporcional à sua freqüência. A

maneira mais prática para determiná-la, sabendo-se que ao total (100%) corresponde um ângulo

de 360º, é:

Ângulo desejado = (% x 360)/100

Por exemplo, para uma freqüência de 45% devemos tomar um ângulo de 162º:

Ângulo desejado = (45 x 360)/100 = 162º

A seguir apresentamos um gráfico setorial com os dados do exemplo anterior.

  

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 39/133

 b) GRÁFICOS DE BARRA 

Da mesma forma que o anterior, este tipo de gráfico é indicado para apresentar a freqüência dedados qualitativos. Neste caso a freqüência está relacionada à altura da barra, sendo que as

 barras devem ter a mesma largura.

A seguir apresentamos um gráfico de barras com os dados do exemplo anterior.

 No figura seguinte apresentamos um gráfico de barras expressando a freqüência em relação aos

grupos etários e sexo de uma amostra.

40 

50 

60 

70 

Eutroficos 

Desnutridos Iº  Desnutridos IIº  Desnutridos IIIº Estado Nutricional 

20 

40 

60 

80 

100 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 40/133

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 41/133

 

     z   -     s     c     o     r     e

5

4

3

2

1

0

-1

-2

-3

-4

2441109949025245964158824326748085003533348449152366329418422270859

457836792390351953748662833275467446444663010985413426582078241117594447

2733

1466

Mínimo 

Máximo 

Mediana

Iº uartil

IIIº Quartil 

e) GRAFICO DE ERRO PADRÃO 

Este gráfico apresenta o intervalo de confiança da média populacional de dados quantitativos.

A partir de uma amostra, calculamos a média e o erro padrão. Desenhamos um segmento de reta

com comprimento igual ao intervalo de confiança da média da população e assinalamos a média

da amostra.

95

%CI

z-

sco

,06 

,05 

,04 

,03 

,02 

,01 

0 00

Média da

amostra

Intervalo deconfiança

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 42/133

 

f) DIAGRAMA DE DISPERSÃO O diagrama de dispersão é uma apresentação gráfica da relação existente entre duas variáveis

quantitativas. No exemplo abaixo o gráfico expressa a distribuição da altura em relação à idade,

 podendo-se observar que como o aumento da idade ocorre um aumento na altura.

Idade (anos)

161412108642

   A   l   t

  u  r  a   (  c  m   )

170

160

150

140

130

120

110

100

90

 

Alguns tipos de gráficos não foram aqui apresentados (de linhas, de área, etc.) mas que devem

ser considerados úteis.

A recomendação final é, se possível, evitar os gráficos em três dimensões, cuja interpretação

 pelo leitor fica comprometida. No exemplo abaixo apresentamos os mesmos dados apresentados

em gráficos de duas e três dimensões.

60 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 43/133

 Para a apresentação de dados quantitativos, além das tabelas e gráficos, podemos utilizar

alguns métodos numéricos, cujo objetivo é descrever o que ocorre no centro da distribuição e a

forma como os dados da amostra estão dispersos. Estes métodos podem ser divididos em:

• MEDIDAS DE TENDÊNCIA CENTRAL: média, moda e mediana

• MEDIDAS DE DISPERSÃO: amplitude máxima, amplitude interquartil, variância, desvio

 padrão e coeficiente de variação• MEDIDAS DE POSIÇÃO: quartis e z-score

MEDIDAS DE TENDÊNCIA CENTRAL

MÉDIA ARITMÉTICA

A média aritmética é a soma dos valores medidos, dividida pelo número de casos. Indicamos a

média de uma população por µ e a da amostra por  x .

 N 

 X ∑=µ  

ΣX = soma dos valores da população N = número de casos da população

n

 x x  ∑=  

Σx = soma dos valores da amostran = número de elementos da amostra

Exemplo: dado um conjunto de números [ 100; 101; 105,2; 99,2; 100,5] sua média será:

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 44/133

( )93,18

5

5,1002,992,10510160=

++++= x   

A troca de um único elemento da amostra causou uma diminuição de 8 unidades na média.

A média aritmética representa com certeza o centro da distribuição, quando as variáveis têm

distribuição simétrica.

MEDIANA

Se ordenarmos a amostra (ordem crescente), a mediana (percentil 50º ou IIº quartil) é o valor da

variável do elemento que ocupa o centro da distribuição. A mediana divide a amostra em dois

grupos que têm o mesmo número de casos, sendo que metade destes têm valores menores que a

mediana e a outra metade, valores maiores.

Para a sua determinação, primeiramente a amostra deve ser ordenada (ordem crescente) e, a

seguir, identifica-se o elemento que ocupa a posição central. O valor da variável deste elemento

será a mediana.

 No exemplo anterior - dado um conjunto de números [ 100; 101; 105,2; 99,2; 100,5] :

Inicialmente ordenamos os dados – [99,2; 100; 100,5; 101; 105,2]

Ordem 1º 2º 3º 4º 5º

Valor 99,2 100 100,5 101 105,2

O centro da distribuição é ocupado pelo 3º elemento cujo valor é 100,5. A mediana destaamostra é 100,5

md = 100,5

A etapa fundamental na determinação da mediana é a identificação do elemento que

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 45/133

 b) O número de casos da amostra é par

 Nesta circunstância dois elementos ocupam o centro da distribuição, cujas ordens podem ser

determinadas por:

2

nElementoPrimeiro   =  

12

nElementoSegundo   +=  

n = número de casos da amostra.

A mediana será estimada por interpolação, correspondendo à média aritmética dos valores

destes dois elementos.

Por exemplo, se tivermos uma amostra com 10 elementos:

º52

10ElementoPrimeiro   ==   º612

10ElementoSegundo   =+=  

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º

↓  ↓ 

Outro exemplo: em um conjunto de 6 elementos [100; 105; 101; 98; 99; 103]

1. ordenamos a amostra: - [98; 99; 100; 101; 103; 105]

2. determinamos os elementos centrais:

Primeiro elemento = 6 / 2 = 3º

Segundo elemento será o 4º

1º 2º 3º 4º 5º 6º

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 46/133

MODA

A moda expressa os valores que têm maior freqüência no grupo de estudo.

Uma vez realizada a distribuição de freqüências, fica fácil determinar a moda: basta identificar o

valor ou valores que apresentam maior freqüência.

Podemos ter distribuições de dados sem moda, com uma moda (unimodal), com duas (bimodal)

ou mais de duas modas (multimodal).

 No exemplo acima todos os valores ocorrem uma única vez, portanto esta distribuição nãoapresenta moda.

Ao tomarmos uma amostra com 15 crianças de uma escola, poderíamos obter as seguintes

idades (anos):

7; 6; 7; 7; 8; 5; 4; 7; 8; 9; 7; 7; 7; 7;7

A distribuição de freqüências será:

Valor Freqüência4 15 16 17 9

8 2

9 1

A idade que apresentou a maior freqüência é 7 anos; portanto, a moda desta distribuição é 7

anos.

MEDIDAS DE DISPERSÃO

APLITUDE MÁXIMA [RANGE]

A amplitude máxima é a diferença existente entre o maior (máximo) e o menor (mínimo) valor

observado Por ser uma medida de dispersão calculada a partir de dois elementos expressa de

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 47/133

 

VARIÂNCIA

Para determinar a variância calculamos a diferença (desvio) de cada elemento da amostra em

relação à média aritmética. A seguir, estas diferenças (desvios) são elevadas ao quadrado e,

finalmente, calculamos a sua média.

Indicamos a variância de uma população por σ2 e de uma amostra por s2 

( ) N 

 X ∑   −=   µσ2

2  

Quando trabalhamos com amostras, temos o interesse de que a variância (s2) calculada seja

representativa da variância da população. Levando em conta este fato, a variância da amostra

deve ser calculada pela fórmula:

( )1

2

2

−=∑ n

 x  x 

s  

Observe que a soma dos quadrados dos desvios foi dividida por (n-1).

Exemplo: considerando as idades (anos) de uma amostra de 10 crianças:

7; 5; 6; 7; 8; 6; 6; 8; 5; 4

1. calculamos a média

( )2,6

10

4586687657=

+++++++++= x   

2. montamos uma tabela para facilitar os cálculos.

Idades ( ) x  x  −  desvio 

( ) x  x −2

 desvio2 

7 0,8 0,645 -1,2 1,446 -0,2 0,047 0,8 0,648 1 8 3 24

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 48/133

 Se tivermos um pouco de paciência, por transformações algébricas simples, podemos

desenvolver (∑   − x  x 2

) , chegando a uma expressão equivalente, que apresenta a vantagem de

não usar a média.

( )  ( )

n

 x  x   x  x 

∑−=−   ∑∑

2

22

 

Assim, passamos a contar com uma nova maneira de calcular a variância:

( )

1

2

2

2

∑−

=∑

n

n

 x  x 

s  

Retomando o exemplo anterior e aplicando este novo método temos:

Idades x x2 

7 7 495 5 256 6 367 7 498 8 646 6 36

6 6 368 8 645 5 254 4 16

Total 62 400

( )anos 73331

9

615

910)62(

2

400

1

2

22 2 , ,

n

n

 x  x 

s   ==−

=−

∑−∑

=  

DESVIO PADRÃO

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 49/133

Como o desvio padrão é a raiz quadrada da variância, ele passa a receber a unidade original em

que os dados foram medidos. No exemplo anterior a unidade da variância era anos2  e a do

desvio padrão é anos.

O desvio padrão representa quanto, em média, cada observação está distante da média. Quanto

mais próximas da média, menor será o desvio padrão, quanto mais distantes maior ele será.

Quando em uma amostra todas as observações têm o mesmo valor, o desvio padrão será igual a

zero.

COEFICIENTE DE VARIAÇÃO

O coeficiente de variação é a razão entre o desvio padrão e a média da amostra, expressa em

 porcentagem. O coeficiente de variação é uma medida usada para comparar as dispersões de

duas amostras.

100. x

 sCV  =  

Por exemplo: deseja-se saber se a dispersão das idades de alunos de duas classes são muito

diferentes:

Classe A –  x =10,2 e s = 2,4 %5,23100.2,10

4,2100.   ===

 x

 sCV   

Classe B –  x =8,9 e s = 3,2 %9,35100.9,8 2,3100.   === x sCV   

A dispersão da classe B é 1,52 vezes à da classe A.

MEDIDAS DE POSIÇÃO

QUARTIS

Estando a amostra ordenada (crescente), os quartis são valores da variável que dividem o

conjunto dos dados em quatro partes iguais, cada uma contendo 25% dos casos.

O Iº quartil corresponde ao percentil 25º; o IIº quartil correponde ao percentil 50º, sendo

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 50/133

 

P25

Iº Quartil

↓ 

P50

Mediana

IIº Quartil

↓ 

P75

IIIºQuartil

↓ 

25% dos casos 25% dos casos 25% dos casos 25% dos casos

→  Amplitude Interquartil  ← 

Inicialmente ordenamos a amostra (crescente) e, a seguir, identificamos os elementos que

dividem a população em quatro grupos com igual número de casos.

Para determinar a ordem do elemento que corresponde ao percentil desejado, utiliza-se a

seguinte fórmula:

( )100

P.1nJ

  +=  

onde n é o tamanho da amostra e P o percentil desejado.

Abaixo apresentamos exemplos da forma de se determinar o elemento correspondente ao Iº

quartil, IIIº quartil e à mediana

Para o Iº Quartil:

( )

100

251n

J

  ×+

=  

Para o IIIº Quartil:( )

100

751nJ

  ×+=  

Para a mediana:( )

100

051nJ

  ×+=  

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 51/133

( ) ( )

++=  x x x  g 

J1J.Quartil

J  

Por exemplo, para calcular o Iº quartil quando n = 11, :

( )3

100

2512

100

25111J   =

×=

×+=  

Como J = 3 é um número inteiro, o Iº quartil será o valor da variável do elemento de ordem

 j = 3 

Por outro lado, para calcular o Iº quartil quando n = 10:

( )75,2

100

2511

100

251nJ   =

×=

×+=  

como J = 2,75  não é um número inteiro temos:

 j = 2 ; (j + 1) = 3;  g  = 0,75

Aplicando a fórmula para interpolação teremos:

xxx 2320,75.Quartil   −+=  

Basta verificar o valor X2 e X

3 na série ordenada e realizar o cálculo para se obter a estimativa

do Iº quartil.

Z-SCORE

O z-score é a posição relativa dos elementos da amostra em relação à média aritmética. O

objetivo é expressar em unidades de desvio padrão quanto um determinado caso está distante da

média.

Para o cálculo do z-score é necessário conhecer a média e o desvio padrão. A partir deste dados,

utilizamos a fórmula:

( )

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 52/133

 Inicialmente calculamos e média e o desvio padrão:

101,18= x    e s = 2,34

O z-score de 105,2 é:

( )71,1

34,2

18,1012,105scorez   =

−=

−=−

s

 x  x  

Este elemento está situado 1,71 unidades de desvio padrão acima da média

O z-score de 100 é:

( )50,0

34,2

18,1010,100scorez   −=

−=

−=−

s

 x  x  

Este caso está situado 0,50 unidades de desvio padrão abaixo da média

O z-score de 101,18 é:

( )0

34,2

18,10118,101scorez   =

−=

−=−

s

 x  x   

Z-score = 0 significa que o caso tem valor igual à média

ANÁLISE EXPLORATÓRIA DE DADOS

Antes de iniciar a descrição da amostra ou mesmo a aplicação de testes estatísticos é necessário

fazer uma análise preliminar, cujo objetivo é conhecer a intimidade dos dados e detectar

 possíveis erros que possam interferir com os resultados da pesquisa.

Os dados suspeitos são aqueles que estão muito distantes do centro da distribuição, que até podem ocorrer, mas que, às vezes, resultam de erro de medida, de anotação ou de digitação.

Por exemplo, em um estudo sobre altura de crianças de idade escolar, encontramos casos com

l i l h id d d di i

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 53/133

o mínimo, o Iº quartil, a mediana, o IIIº quartil e o máximo. Com estes pontos calculamos a

amplitude interquartil (AIQ). A seguir construímos um gráfico que recebe o nome de Diagrama

Esquemático (Box-Plot).

Marcamos o mínimo e o máximo; desenhamos um retángulo que passa por Q1 e Q3; no interior

do retángulo assinalamos a mediana. Desenhamos dois segmentos de reta com comprimento

igual a 1,5 a AIQ. O primeiro, acima do bordo superior do retángulo e o outro, abaixo da bordo

inferior. Na figura abaixo apresentamos, com finalidade didática, a estrutura do diagrama

esquemático na posição horizontal.

*  * 

↑ 

mínimo

↑ 

Q1

↑ 

mediana

↑ 

Q3

↑ 

máximo

Os casos cujos valores não estão incluídos entre os dois extremos dos segmentos de reta devem

ser reavaliados antes de se prosseguir na análise dos dados. Na figura abaixo apresentamos um

típico gráfico de box-plot.

  v  a   l  o  r  e  s  a   b  s  o   l  u   t  o

  s

80

60

40

20

0

-20

8893232687238418377897888461293442635933221989413609448465743324709757093018221683976144415138748706649835291093148450327648261863076

6710

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 54/133

BIBLIOGRAFIA

1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.

2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.

2ª ed. São Paulo: Pioneira, 2002.

3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas

Científica de Ribeirão Preto, 2002.

4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

5. Bland M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.

6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.

8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.

11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.

13. PIEDRABUENA AE – Elementos de bioestatística. Unicamp [apostila], 1995.

14. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

15. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e CientíficosEditora Ltda, 1999.

16. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

17. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 55/133

TESTE DE HIPÓTESES 

 André M. Morcillo 1 

“O objetivo fundamental é verificar se os dados amostrais (ou estimativas obtidasa partir deles) são ou não compatíveis com determinadas populações (ou comvalores previamente fixados dos correspondentes parâmetros populacionais.” 

Trata-se, na verdade, de uma forma lógica de organização do pensamento, que nos ajudará adecidir se os resultados obtidos na pesquisa confirmam ou contradizem os dados existentes atéentão na literatura.

Tomar decisões é parte do nosso cotidiano:

Decidir sobre o trajeto para ir à cidade; qual roupa colocar para ir a uma festa; qual escolacolocar os filhos; quando realizar a compra de um automóvel melhor e mais caro; comprar ou

não os livros de Bioestatística; etc.Em todos os casos pondera-se as vantagens e os riscos. Em condições normais, um adulto sadio,sempre escolherá a opção que lhe ofereça mais vantagens e menor risco.

Este processo é automático – não se escrevem as hipóteses, não se aplica um método técnico,não se calculam as probabilidades. Isto se deve ao fato de que ao longo dos anos fomostreinados para realizar estas tarefas.

 No entanto, quando o empreendimento é muito importante – comprar uma nova casa, viajar ao

exterior, etc. – reunimos a família várias vezes, com muito papel e lápis e, após muitas horas emuita ansiedade, decide-se sobre o assunto.

 Importante: em todos os casos sabíamos com clareza qual era o nosso problema,conhecíamos os riscos.

Decidir sobre o trajeto de uma viagem implica em ter conhecimento dos problemas de trânsitolocal, da planta da cidade, etc. Não há como decidir sobre o melhor trajeto a ser tomado em umacidade desconhecida, de um país desconhecido.

Quanto a roupa, temos que saber como será a festa: uma reunião de amigos, uma solenidadeformal com autoridades, etc.

 Não se pode decidir sobre a compra de uma nova casa se não se sabe como ela é, em qual bairro, rua ou cidade está localizada.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 56/133

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 57/133

 

♦ A Hipótese Alternativa (H1)

Ela expressará a hipótese de trabalho do pesquisador, recomendando-se que sempre sejaestabelecida na forma de “diferenças” do tipo maior  que, menor  que, diferente de.

 Novamente, em relação às crianças asmáticas.

H1: a média das alturas das crianças asmáticas de nível social menos favorecido é menor que amédia das crianças asmáticas de nível social superior.

Do ponto de vista da Bioestatística escrevemos:

H1: µ NSB < µ NSA

Finalmente, temos:

H0: µ NSB > µ NSA

H1: µ NSB < µ NSA

•  Nível de Significância (α)

É um ponto de corte arbitrário, adotado pelo pesquisador, para definir um risco máximo que se

 pode corre ao rejeitar H0 em função dos resultados obtidos. Na verdade temos uma distribuição de probabilidades sob condição de H0. Se encontramos nonosso experimento uma probabilidade de ocorrência do evento sob H0 muito pequena, sabemosque é pequena (≤α) a probabilidade de rejeitarmos H0 sendo ela verdadeira.

• Testes Unilaterais e Bilaterais

Os testes são unilaterais quando eles exprimem claramente qual é o sentido da diferença que seestuda (maior que ou menor que). Por outro lado, quando o pesquisador não sabe exatamente oque busca, ele define H1 coma uma diferença (por ser maior que ou menor que)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 58/133

Bilaterais:

H0: µ NSB = µ NSA

H1: µ NSB ≠  µ NSA 

• Erros tipo I e tipo II

Em relação a H0 pode-se cometer dois tipos de erro:

a) ela é rejeitada sendo verdadeira

 Neste caso temos o erro tipo I que é determinado pelo pesquisador ao definir o nível designificância (α) = 1%, 5%, 10%, etc

b) ela não é rejeitada sendo falsa

 Neste caso temos o erro tipo II cuja probabilidade é β. É mais difícil de ser controlado pelo pesquisador e está relacionado ao α e ao N.

Para um determinado N ao diminuirmos α consequentemente elevamos β.

Como o pesquisador define α previamente e o mantém fixo durante a pesquisa, a única maneirade diminuir β é aumentar o tamanho da amostra (N).

Chama-se poder de um teste a probabilidade complementar de β que é igual a:

Poder = 1- β 

A condição ideal para o pesquisador é aquela em que tanto α quanto β são pequenos.

Decisões possíveis em um teste de hipóteses

H0 é verdadeira H0 é falsa

Rejeita-se H0 Erro tipo I (α) decisão correta (1-β)

Aceita-se H0 decisão correta (1-α) Erro tipo II (β)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 59/133

 

ETAPAS DE UM TESTE DE HIPÓTESES 

Tomada de decisão

Seleciona-se e aplica-se um teste

estatístico

Levantamento dos dados

Estabelece-se H0 e H1

Determina-se N, e

Revisão da literatura

Faz-se um questionamento

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 60/133

 

BIBLIOGRAFIA

1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.

2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.

2ª ed. São Paulo: Pioneira, 2002.

3. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.

4. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

5. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.

6. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

7. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.8. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

9. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

10. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

T K S

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 61/133

TESTE DE K OLMOGOROV-SMIRNOV 

André M. Morcillo

1

 

Esta prova avalia se duas amostras têm distribuições semelhantes ou, melhor dizendo, se foram

extraídas de uma mesma população. Se as diferenças observadas entre elas forem grandes é

 provável que não se devam ao acaso. É muito sensível, detectando diferenças em relação à

tendência central, dispersão e simetria. Pode ser utilizada para dados medidos nas escalas

ordinal, intervalar ou de razão, não havendo a exigência que estes tenham distribuição normal.

O princípio básico é comparar as freqüências acumuladas das duas amostras.

PROCEDIMENTOS 

1. Ordenamos as duas amostras2. Construímos as distribuições de freqüências acumuladas nos intervalos de classe de cada

amostra

3. Calculamos as diferenças entre as freqüências acumuladas de cada amostra em cada um dos

intervalos de classe. Este capítulo está estruturado sempre considerando as diferenças entre

a primeira e a segunda amostra (A-B)

4. Escolhemos a maior diferença [Dmax] que será comparada com Dcrítico 

Se D ≥ Dcrítico rejeitamos a hipótese de igualdade das amostras.

DETERMINANDO D 

a) Quando n1 = n2 ≤ 40

 Neste caso o procedimento é simples. Uma vez estabelecidos os intervalos de classe,

d t i f üê i l d d d t A i l l dif

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 62/133

 b) Quando n1 ou n2 > 40 ou n1 ≠ n2

 Neste caso, deve-se determinar a proporção que cada amostra apresenta nos intervalos de classe.A seguir, calculamos as diferenças entre as proporções de cada amostra nestes intervalos de

classe.

Lembre-se que a proporção de casos dentro de uma determinada classe é igual à freqüência

observada na classe dividida pelo número de casos da amostra. Seja f i  a freqüência em uma

classe i e n o número de casos da amostra, a proporção pi na classe i será:

nf i pi =  

O valor de Dmax será o valor absoluto de uma das diferenças e será escolhido considerando o

teste de hipóteses estabelecido:

A diferença com maior valor absoluto |D| para os testes bilaterais, ou o valor absoluto da

diferença com menor valor negativo ou com o maior valor positivo nos testes unilaterais.

TESTE DE HIPÓTESES 

1. TESTES BILATERAIS 

 H0 : as amostras têm a mesma distribuição H1 : as amostras têm distribuições diferentes

 Nos teste bilaterais seleciona-se a diferença com maior valor absoluto, que será chamada de

Dmax para comparação com Dcrítico .

Se |Dmax| ≥ Dcrítico,α rejeitamos H0, concluindo que as populações têm distribuições diferentes.

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 63/133

Se D

+

 ≥ Dcrítico,α  rejeitamos H0, concluindo que a população A tem valores maiores que a população B.

 b) A POPULAÇÃO A É MENOR QUE A B

 H0 : a população A tem distribuição diferente sendo seus valores iguais ou maiores que a população B

 H1 : a população A tem distribuição diferente sendo seus valores menores que a população B

 Neste caso seleciona-se a diferença com o menor valor negativo, cujo valor absoluto será

simbolicamente chamado de D- .

Se D- ≥ Dcrítico,α  rejeitamos H0, concluindo que a população A tem valores menores que a

 população B.

O VALOR DE DCRITICO 

A) QUANDO AS AMOSTRAS SÃO PEQUENAS E DE MESMO TAMANHO ( N1 = N2 ≤ 40 )

 Neste caso o valor de Dcrítico é obtido na tabela de distribuição de D para pequenas amostras.

B) GRANDES AMOSTRAS EM TESTES BILATERAIS 

Se n1 ou n2 são maiores que 40, seja n1 = n2 ou n1 ≠ n2, obtém-se o valor de Dcrítico através

das fórmulas:

Para α=0,05 ⇒ nnnnD

21

21

critico1,36

×

+×=  

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

C) GRANDES AMOSTRAS EM TESTES UNILATERAIS

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 64/133

C) GRANDES AMOSTRAS EM TESTES UNILATERAIS 

Se n1 ou n2 são maiores que 40, seja n1 = n2 ou n1 ≠ n2, utiliza-se um teste de  χ 2 obtido a

 partir da fórmula abaixo, com dois graus de liberdade:

nnnnDχ 

21

212

max

24

+

×××=  

Se o  χ 2 calculado for maior ou igual ao  χ 

2crítico pode-se rejeitar H0.

Os valores críticos de  χ 2 com 2 graus de liberdade são:

 Nível de significânciaα   χ 2crítico 

0,05 5,99

0,01 9,21

0,001 13,82

Observação: Esta fórmula pode ser usada na comparação de amostras pequenas que tenham

diferentes número de casos (n1 ≠ n2 < 40). Neste caso a prova é muito segura. Se H0 é rejeitada,

 pode-se ficar “estatisticamente” tranqüilos.

Exemplo para n1=n2<40 – Foram sorteadas 10 meninos e 10 meninas de uma classe de terceira

série do ensino fundamental. Deseja-se saber se há diferença entre as idades dos dois grupos. A

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

Como o número de meninos (n1) é igual ao de meninas (n2) e menores que 40 o valor de D íti

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 65/133

Como o número de meninos (n1) é igual ao de meninas (n2) e menores que 40, o valor de Dcrítico 

é obtido na tabela de D.

Para um teste bilateral com N=10 e α=0,05, temos Dcrítico = 7

a) ordenamos os valores das amostras

 b) Usando intervalos de classe de 6 meses, montamos a tabela abaixo

Classe de

idadeMeninos Meninas

f acum 

Meninos

f acum 

Meninas

Diferença

das f acum |D| 

7,0 |– 7,5 1 3 1 3 -2 2

7,5 |– 8,0 4 2 5 5 0 0

8,0 |– 8,5 2 3 7 8 -1 1

8,5 |– 9,0 1 2 8 10 -2 2

9,0 |– 9,5 2 0 10 10 0 0

Como o teste é bilateral tomamos a diferença entre as freqüências acumuladas com maior valor

absoluto | D | = | -2 | = 2 ,  portanto, Dmax = 2.

Como o Dmax é menor que o Dcrítico,α  ( 2 < 7 ) não podemos rejeitar H0, concluindo que os

dois grupos têm semelhantes distribuições de idade.

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 66/133

Exemplo para n1≠n2>40 – Sortearam-se ao acaso dois conjuntos com 45 elementos com a

expectativa que tivesssem média 100 e desvio padrão 15. Como este sorteio foi realizado

utilizando um software, deseja-se verificar se há diferença entre as duas amostras.

Grupo 1 Grupo 2

92 110 103 113 95 83

106 100 81 77 105 81

125 113 92 98 121 73

101 123 106 104 79 89

111 96 97 106 121 92

80 75 104 121 118 102

84 91 108 83 65 111

85 112 64 108 76 116

97 93 96 103 106 93

104 77 95 101 107 83

81 93 122 123 109 111

129 104 102 98 89 114

121 85 104 93 97 78

89 116 92 78 108 110

81 97 106 105 131 98

Procedimentos:

a) Estabelecemos os intervalos de classe

 b) Determinamos as freqüências dentro de cada intervalo de classe

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

Grupo 1 Grupo 2 p1-p2

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 67/133

Grupo 1 Grupo 2 p1-p2

f f acumulada  p1 f f acumulada  p2

60 --| 65 1 1 0,022 1 1 0,022 0

65 --| 70 0 1 0,022 0 1 0,022 0

70 --| 75 1 2 0,044 1 2 0,044 0

75 --| 80 2 4 0,089 5 7 0,156 -0,067

80 --| 85 5 9 0,200 4 11 0,244 -0,044

85 --| 90 2 11 0,244 2 13 0,289 -0,045

90 --| 95 7 18 0,400 4 17 0,378 0,022

95 --| 100 6 24 0,533 4 21 0,467 0,066

100 --| 105 7 31 0,689 6 27 0,600 0,089

105 --| 110 5 36 0,800 7 34 0,756 0,044

110 --| 115 3 39 0,867 4 38 0,844 0,023

115 --| 120 1 40 0,889 2 40 0,889 0

120 --| 125 4 44 0,978 4 44 0,978 0

125 --| 130 1 45 1,000 0 44 0,978 0,022

130 --| 135 0 45 1,000 1 45 1,000 0

Total 45 45

A diferença entre as proporções das freqüências acumuladas com maior valor absoluto ocorreu

na classe [100 -- | 105], portanto, o nosso Dmax = | 0,089 | = + 0,089.

Considerando um teste bilateral com α = 0,05 temos:

0,28670,210818.1,3645.454545 .1,36

n2.n1n2n1 .1,36D 05crítico;0.   ==+=+=  

Como o valor do Dmax calculado é menor que o Dcrítico não podemos rejeitar H0.

Se por outro lado nosso teste de hipóteses fosse unilateral teríamos que calcular o χ2 e

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 68/133

Tabela de Dcrítico do teste de Kolmogorov-Smirnov para duas amostras pequenas e

independentes (n1 = n2 ≤ 40).

Testes Unilaterais Teste Bilaterais N

α=0,05 α=0,01 α=0,05 α=0,01

3 3 - - -4 4 - 4 -5 4 5 5 56 5 6 5 67 5 6 6 68 5 6 6 79 6 7 6 710 6 7 7 8

11 6 8 7 812 6 8 7 813 7 8 7 914 7 8 8 915 7 9 8 916 7 9 8 1017 8 9 8 1018 8 10 9 1019 8 10 9 1020 8 10 9 1121 8 10 9 1122 9 11 9 1123 9 11 10 1124 9 11 10 1225 9 11 10 1226 9 11 10 1227 9 12 10 1228 10 12 11 1329 10 12 11 1330 10 12 11 1335 11 13 12 -40 11 14 13 -

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 69/133

BIBLIOGRAFIA

1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de

Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São

Paulo, 1979.

4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 70/133

TESTE DE K RUSKAL-WALLIS 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 71/133

André M. Morcillo1 

Este teste foi proposto para avaliar se três ou mais amostras são iguais (procedentes de uma mesma

 população) ou diferentes. É o substituto da Análise de Variância quando esta não pode ser utilizada, já

que não exige a homogeneidade das variâncias, que as amostras tenham sido tomadas ao acaso e que

tenham distribuição normal. As amostras devem ser independentes e medidas nas escalas ordinal,

intervalar ou de razão.

COMO FAZER  

Dado um conjunto de N observações pertencentes a k amostras independentes:

1. Ordena-se em ordem crescente o conjunto das N observações (todas as amostras)

2. Atribui-se os postos ou ranks a cada observação. Quando houver empates cada elemento deverá

receber a média aritmética dos respectivos postos.

3. Soma-se os postos de cada amostra (R  j)

4. Calcula-se (R  j)2/n j 

5. Calcula-se a estatística H

6. Toma-se a decisão quanto a rejeição de H0

TESTE DE HIPÓTESES 

H0 : todas as amostras são iguais H1 : pelo menos uma amostra é diferente

CALCULANDO H

( )  ( )∑

=

+−+

=k 

1 j  j

2 j

1 N3..1 N N

12H

n

R  

 

C Ã Ê

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 72/133

CORREÇÃO EM DECORRÊNCIA DE EMPATES

Quando ocorrerem empates entre observações, torna-se necessário realizar uma correção no H calculado,

dividindo-se H por um fator de correção C.

( )( )1.1.1

−+−=

 N  N  N 

T C   

e

∑= T iT   

 f  f iiT    −=3

 

e

 f i é o número de valores em cada grupo de empateaplicando-se a correção temos,

C

HH =  

Exemplo: em um determinado estudo referente a notas de 30 alunos do ensino fundamental, observou-se

que vários alunos tiveram a mesma nota.Paulo, José e Maria tiveram nota 7,5 ; Joana, André, Juca e Pedro tiveram nota 8,5 ; Lara e Romeu

tiveram nota 8,9.

Três alunos receberam a nota 7,5 portanto  f i = 3 ⇒  Ti = 33 - 3 = 24

Quatro alunos receberam a nota 8,5 portanto  f i

= 4 ⇒  Ti = 43 - 4 = 60 

Dois alunos receberam a nota 8,9 portanto  f i = 2 ⇒  Ti = 23 - 2 = 6 

T ΣT 24 60 6 90

 

TOMADA DE DECISÃO

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 73/133

TOMADA DE DECISÃO 

a) QUANDO SÃO TRÊS AMOSTRAS COM PEQUENO NÚMERO DE CASOS (k=3 e n j 5)

 Neste caso utiliza-se a tabela que fornece a probabilidade de H para três amostras de diferentes tamanhos.

Se a probabilidade de H for menor que α rejeita-se H0.

b) QUANDO SÃO MAIS QUE TRÊS AMOSTRAS OU ELAS TÊM GRANDE NÚMERO DE CASOS (k>3 ou n j>5)

 Neste caso H tem distribuição de  χ 2 com k-1 graus de liberdade. Uma vez estabelecido α procura-se na

tabela de distribuição de  χ 2 o valor crítico de  χ 2 para α e k-1 graus de liberdade.

Se H ≥  χ 2α,k-1  rejeita-se H0.

Exemplo com k = 3 e n<6 – Desejando saber se havia diferença entre as idades de crianças de três classesdiferentes, foram selecionadas aleatoriamente três grupos com cinco crianças

H0 : as três classes têm idades iguaisH1 : pelo menos uma das classes tem idade diferente

 Nível de significância = 5% (α = 0,05)

Classe A Classe B Classe C8.5 8.1 9.1

8.9 8.2 8.6

7.3 8.4 9.3

 

Calculando Rj ; (Rj)2 e (Rj)2/n de cada classe

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 74/133

Calculando Rj ; (Rj) e  (Rj) /n j de cada classe

Classe A Classe B Classe C

Idade Ranks Idade Ranks Idade Ranks

8.5 8 8.1 4 9.1 128.9 10 8.2 5 8.6 97.3 2 8.4 7 9.3 14

6.9 1 8.3 6 10.0 157.7 3 9.0 11 9.2 13Rj 24 33 63

(Rj)2  576 1089 3969

n j  5 5 5

(Rj)2/nj 115,2 217,8 793,8

Calculando H

Σ(Rj)2/nj = 115,2 + 217,8 + 793,8 = 1126,8

( )8,341)3.(15-.1126,8

11515.

12H   =+

+=  

Decidindo sobre H0

Consultando na tabela o valor de H para três amostras com 5 elementos, encontra-se que a probabilidade

fica entre 0,007 e 0,009. Desta forma H0 deve ser rejeitada concluindo-se que as classes não têm a

mesma idade.

 

Exemplo com k > 3 ou n > 6 – Foram tomadas ao acaso as alturas de algumas crianças do sexo masculino

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 75/133

Exemplo com k > 3 ou n > 6  Foram tomadas ao acaso as alturas de algumas crianças do sexo masculino

de quatro classes diferentes. Deseja-se saber se há diferença nas alturas dos quatro grupos.

H0 : as quatro amostras têm alturas iguais

H1 : pelo menos uma das quatro amostras tem alturas diferentes

 Nível de significância: 5%

Guimarey Zanolli Marmo Morcillo

118,4 130,6 123,8 117,1

101,5 118,3 113 127,5

116,6 114,7 104,7 120,3

107,2 125,8 115,4 116,5

118,9 117,9 120,8 119,2

115,4 117,3 122,4 120,5

108 116,2 115,5 111,1

118,9 125,1 117,5 120,2

114,3 120 121,5 122,3

115 116,8 124

120

Ordena-se e atribui-se os postos ou ranks às observações

Calcula-se R  j (soma dos postos de cada amostras), (R  j)2  (o quadrado da soma dos postos de cada

amostra) e (R  j)2/n j (quadrado da soma dos postos de cada amostra dividido pelo respectivo número de

 

Guimarey Zanollli Marmo Morcillo

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 76/133

Guimarey Zanollli Marmo Morcillo

Altura Rank Altura Rank Altura Rank Altura Rank

118,4 22 130,6 40 123,8 35 117,1 17

101,5 1 118,3 21 113,0 6 127,5 39

116,6 15 114,7 8 104,7 2 120,3 29

107,2 3 125,8 38 115,4 10,5 116,5 14

118,9 23,5 117,9 20 120,8 31 119,2 25

115,4 10,5 117,3 18 122,4 34 120,5 30

108,0 4 116,2 13 115,5 12 111,1 5

118,9 23,5 125,1 37 117,5 19 120,2 28

114,3 7 120,0 26,5 121,5 32 122,3 33

115,0 9 116,8 16 124,0 36

120,0 26,5

R  j  118,5 221,5 197,5 282,5

(R  j)2  14042,25 49062,25 39006,25 79806,25

n j  10 9 10 11

(R  j)2/n j  1404,225 5451,361 3900,625 7255,114

Calcula-se a soma de todos os (R  j)2/n j

∑=

=4

1

2

32475,18011 j  j

 j

n R

 

Como ocorreram empates há a necessidade de se calcular o fator de correção C

Tratamento dos empates

 

Calculando o fator de correção C

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 77/133

Calculando o fator de correção C

( )( )   ( )( )999718,0

140.140.40

181

1.1.1   =

+−−=

+−−=

 N  N  N 

T C   

Calculando o valor de H

79018,841332475,180114140

12=×−×

×= H   

Calculando o H corrigido pelos empates

79266,8999718,0

79018,8== H   

Verificando o χ2 crítico

Como são quatro amostras, H deve ser comparado com o χ2 , considerando α=0,05 e 3 graus

de liberdade (número de amostras menos um). Neste caso χ20,05;3 = 7,82

Tomada de decisão

Como H é maior que χ20,05;3 rejeita-se H0.

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 78/133

Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥ h P0(H ≥ h) = p]

n1 n2 n3 h p n1 n2 n3 h p n1 n2 n3 h p

1 1 4 3.571 .200 1 4 5 4.860 .056 2 3 3 3.778 .2001 1 5 3.857 .143 4.986 .044 4.556 .1001 2 2 3.600 .200 6.840 .011 5.139 .061

1 2 3 3.524 .200 6.954 .008 5.556 .0254.286 .100 7.364 .005 6.250 .0111 2 4 3.161 .190 1 5 5 2.946 .227 2 3 4 3.311 .203

4.018 .114 3.236 .188 3.444 .1974.821 .057 4.036 .105 4.444 .102

1 2 5 3.333 .190 4.109 .086 4.511 .0984.200 .095 4.909 .053 5.400 .0515.000 .048 5.127 .046 5.444 .0465.250 .036 6.836 .011 6.300 .011

1 3 3 3.286 .157 7.309 .009 6.444 .0084.200 .095 7.746 .005 7.000 .0055.000 .048 8.182 .002 2 3 5 3.386 .2015.250 .036 2 2 2 3.714 .200 3.414 .193

1 3 3 3.286 .157 4.571 .067 4.494 .1014.571 .100 2 2 3 3.750 .219 4.651 .0915.143 .043 3.929 .181 5.106 .052

1 3 4 3.208 .200 4.464 .105 5.251 .0494.056 .093 4.500 .067 6.822 .0105.208 .050 4.714 .048 6.909 .0095.833 .021 5.357 .029 6.949 .006

1 3 5 3.218 .190 2 2 4 3.458 .210 7.182 .0044.018 .095 3.667 .190 2 3 6 5.227 .0524.871 .052 4.458 .100 5.348 .0464.960 .048 5.125 .052 6.061 .0266.400 .012 5.500 .024 6.136 .023

1 4 4 3.000 .222 6.000 .014 6.727 .011

3.267 .178 2 2 5 3.333 .206 6.970 .0094.067 .102 3.360 .196 2 4 4 3.354 .2104.867 .054 4.293 .122 3.464 .1924.967 .048 4.373 .090 4.446 .1036.667 .010 5.040 .056 4.554 .098

1 4 5 3.000 .208 6.133 .013 5.236 .0523.087 .194 6.533 .008 5.454 .0463.960 .102 2 2 6 5.018 .050 6.546 .0203.987 .098 5.345 .038 6.873 .011

5.527 .036 7.036 .0065.745 .021 7.854 .0026.545 .011 2 4 5 3.364 .2006.654 .008 4.518 .101

4.541 .0985.268 .051

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 79/133

Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥ h P0(H ≥ h) = p] 

n1 n2 n3 h p n1 n2 n3 h p n1 n2 n3 h p

2 4 5 5.273 .049 3 3 4 6.746 .010 3 4 5 7.641 .0076.504 .020 7.000 .006 7.906 .0057.118 .010 7.318 .004 8.446 .0027.500 .007 7.436 .002 8.503 .0017.573 .005 8.018 .001 9.118 .0018.114 .001 3 3 5 3.394 .209 3 4 6 5.604 .050

2 4 6 5.263 .050 3.442 .196 5.610 .0495.340 .049 4.412 .109 6.500 .0256.109 .025 4.533 .097 6.538 .0256.186 .024 5.515 .051 7.467 .0107.212 .011 5.648 .049 7.500 .0107.340 .010 6.303 .026 3 5 5 3.306 .202

2 5 5 3.369 .203 6.376 .020 3.429 .1953.392 .198 6.982 .011 3.798 .1524.508 .100 7.079 .009 4.545 .1005.246 .051 7.467 .008 4.993 .0755.338 .047 7.515 .005 5.626 .0516.346 .025 8.048 .002 5.706 .0466.446 .020 8.242 .001 6.488 .0257.269 .010 8.727 .001 6.752 .0217.762 .007 3 3 6 5.551 .051 6.866 .0198.131 .005 5.615 .050 7.543 .0108.685 .001 6.385 .025 7.894 .007

2 5 6 5.319 .050 6.436 .022 8.237 .0055.338 .047 7.192 .010 8.334 .0056.189 .026 7.410 .008 8.950 .0026.196 .025 3 4 4 3.394 .201 9.055 .0017.299 .010 3.417 .195 9.398 .0017.376 .010 3.848 .150 3 5 6 5.554 .052

2 6 6 5.352 .051 4.477 .102 5.600 .0505.410 .050 4.546 .099 6.621 .0266.171 .026 5.576 .051 6.667 .0246.210 .024 5.598 .049 7.560 .0107.410 .010 6.394 .025 7.590 .0107.467 .010 6.659 .020 3 6 6 5.600 .052

3 3 3 3.467 .196 7.144 .010 5.625 .0504.622 .100 7.636 .004 6.683 .0255.600 .050 8.227 .002 6.725 .0255.956 .025 8.909 .001 7.683 .0106.489 .011 3 4 5 3.312 .204 7.725 .0107.200 .004 3.318 .199 4 4 4 3.231 .212

3 3 4 3.391 .196 3.831 .150 3.500 .1973.836 .150 4.523 .103 3.846 .1514.700 .101 4.549 .099 3.962 .1454.709 .092 4.939 .075 4.500 .1045.727 .050 5.631 .050 4.654 .0976.154 .025 6.410 .025

6.676 .0207 445 010

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 80/133

Limites de probabilidade da distribuição de H no teste de Kruskal-Wallis(k=3), com n1≤ n2 ≤ n3≤ 6. [ p é a probabilidade de H ≥h P0(H ≥ h) = p] 

n1 n2 n3  h p n1 n2 n3 h p n1 n2 n3 h p

4 4 4 5.115 .074 4 5 5 3.311 .200 5 5 5 5.040 .0755.654 .055 3.846 .151 5.660 .0515.692 .049 3.883 .148 5.780 .0496.577 .026 4.520 .101 6.740 .0256.615 .024 4.523 .099 7.020 .0206.731 .021 5.023 .075 7.980 .0116.962 .019 5.643 .050 8.000 .0097.538 .011 6.671 .025 8.060 .0097.731 .007 6.760 .025 8.420 .0078.000 .005 6.943 .020 8.720 .005

8.346 .002 7.766 .010 8.820 .0058.654 .001 7.860 .010 9.420 .0029.269 .001 8.226 .007 9.620 .002

4 4 5 3.330 .200 8.371 .005 9.680 .0013.828 .151 8.543 .005 10.220 .0014.619 .100 9.163 .002 5 5 6 5.698 .0505.014 .076 9.323 .001 5.729 .0505.024 .074 9.926 .001 6.781 .0255.618 .050 4 5 6 5.656 .051 6.788 .0256.597 .026 5.661 .050 8.012 .0106.676 .024 6.736 .025 8.028 .010

6.943 .020 6.750 .025 5 6 6 5.752 .0507.744 .011 7.896 .010 5.765 .0507.760 .009 7.936 .010 6.838 .0257.810 .009 4 6 6 5.721 .050 6.848 .0258.140 .005 5.724 .050 8.119 .0108.189 .005 6.783 .025 8.124 .0108.782 .002 6.812 .024 6 6 6 5.719 .0508.997 .001 7.989 .010 5.801 .0499.590 .001 8.000 .010 6.877 .026

4 4 6 5.667 .050 5 5 5 3.380 .201 6.889 .0255.681 .049 3.420 .190 8.187 .0106.595 .026 3.860 .150 8.222 .010

6.667 .025 4.560 .1007.724 .0107.795 .010

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 81/133

Teste de Kruskal-Wallis para três amostras e n < 6

Rejeita-se H0

Se p <= 0,05

 Não se rejeita H0

Se p > 0,05

Encontrar a probabilidade de H na tabela

levando em cota n1, n2, n3

Calcular H

Se houver empates aplicar o fator de correção C

Somar os ranks de cada amostras (Rj)

Elevar Rj ao quadrado (Rj)2

Dividir (Rj)2 pelo n de cada amostra

Atribuir os ranks às observações

Reunir as N observações em um único grupo

e ordená-las

Estabelecer as hipóteses de trabalho e

o nível de significância

Verificar se as amostras são independentes

Verificar se as medidas foram medidas nas escalas

ordinal, intervalar ou de razão

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 82/133

Teste de Kruskal-Wallis para três ou mais amostras ou n > 6

Se H >= qui-quadrado crítico Se H < qui-quadrado crítico

Verificar o valor de Qui-quadrado para k-1 graus de liberdade

Calcular H

Se houver empates aplicar o fator de correção C

Somar os ranks de cada amostras (Rj)

Elevar Rj ao quadrado (Rj)2

Dividir (Rj)2 pelo n de cada amostra

Atribuir os ranks às observações

Reunir as N observações em um único grupo

e ordená-las

Estabelecer as hipóteses de trabalho e

o nível de significância

Verificar se as amostras são independentes

Verificar se as medidas foram medidas nas escalas

ordinal, intervalar ou de razão

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 83/133

BIBLIOGRAFIA

1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de

Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São

Paulo, 1979.

4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 84/133

TESTE DE WILCOXON 

 André M. Morcillo1 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 85/133

O teste de Wilcoxon pode ser usado na comparação de dados pareados, medidos nas escalas

ordinal, intervalar ou de razão. Não há a exigência de que as amostras tenham distribuição

normal. Tem 95% do poder do teste t pareado e, sua indicação, restringe-se às situações em que

este último não pode ser utilizado.O princípio do teste consiste em avaliar se ocorreram modificações significativas nos dois

conjuntos de dados. Quando as modificações ou diferenças são muito pequenas, elas podem ser

devidas ao acaso, porém, quando são expressivas, é pouco provável que se devam ao acaso,

sendo fruto de um fator causal.

COMO FAZER  

1. Calcula-se para cada elemento do grupo de estudo a diferença (d) entre a suas duas medidas,

seja a primeira menos a segunda ou vice-versa. Neste capítulo será sempre considerada a

 primeira menos a segunda (A-B).

2. Ordena-se e atribui-se ranks aos valores absolutos das diferenças que sejam diferentes de

zero ( d ≠ 0 )

3. Soma-se os ranks das diferenças positivas (T+)

4. Soma-se os ranks das diferenças negativas (T-)

5. Seleciona-se entre T+ e T- o de menor valor, que será chamado de T

6. Verifica-se o valor de Tcrítico,α na tabela7. Compara-se T com Tcrítico e toma-se a decisão quanto a rejeição de H0

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

TESTE DE HIPÓTESES 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 86/133

a) Bilateral H0 : não há diferença entre as notas obtidas no início e no final do curso

 H1 : há diferença entre as notas obtidas no início e no final do curso

b) Unilateral

 H0 : As notas obtidas no início são menores ou iguais às do final do curso

 H1 : As notas obtidas no início são maiores que as do final do curso

ou

 H0 : As notas obtidas no início são maiores ou iguais às do final do curso

 H1 : As notas obtidas no início são menores que as do final do curso

TOMADA DE DECISÃO 

Teste bilateral

Seleciona-se entre T+ e T- aquele que tiver o menor valor, que passará a ser chamado de T e

que será comparado com o Tcrítico (Tα,n).

Se T for menor ou igual ao Tcrítico, rejeita-se H0.

Teste unilateral

Considerando que no nosso caso d = primeira medida menos a segunda:

a) H1 : as segundas medidas são menores que as primeiras [ A > B ]

Se isto for verdadeiro T+ é maior que T-, sendo que T- passa a ser o valor de T.Se T ≤ Tα,n ⇒  rejeita-se H0

 b) H1 : as segundas medidas são maiores que as primeiras [ A < B ]

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

Exemplo - Um grupo de 10 alunos foi avaliado no início e no final do curso. Natabela abaixo são apresentadas as notas obtidas nas provas.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 87/133

 Nomes Prova inicial Prova final

André 7,3 7,6

Paulo 7,9 7,5

Manoel 8,1 8,6

Joaquim 9,6 9,5Pedro 8,0 8,5

Luís 8,5 8,3

Miguel 7,9 7,9

Ângelo 6,9 6,9

Cláudio 7,2 7,8

Aurélio 8,8 7,5

♦ Calculando as diferenças (d = nota inicial – nota final)

Prova inicial Prova final Diferença (Inicial-Final)

André 7,3 7,6 -0,3

Paulo 7,9 7,5 +0,4

Manoel 8,1 8,6 -0,5

Joaquim 9,6 9,5 +0,1

Pedro 8,0 8,5 -0,5Luís 8,5 8,3 +0,2

Miguel 7,9 7,9 0

Â

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

♦ Atribuindo ranks às diferenças

Ordena-se as diferenças (d) que são diferentes de zero, pois só interessa estudar os casos em que

h difi ã id d l b l ib i k

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 88/133

houve modificação na nota, considerando o seu valor absoluto e atribui-se os postos ou ranks ao

valor absoluto das diferenças

| d | 0,1 0,2 0,3 0,4 0,5 0,5 0,6 1,3

Ranks 1 2 3 4 5,5 5,5 7 8

 Nota inicial Nota finalDiferença

d=(Inicial - final)| d | Ranks Ranks - Ranks +

André 7,3 7,6 -0,3 0,3 3 3

Paulo 7,9 7,5 +0,4 0,4 4 4

Manoel 8,1 8,6 -0,5 0,5 5,5 5,5

Joaquim 9,6 9,5 +0,1 0,1 1 1

Pedro 8,0 8,5 -0,5 0,5 5,5 5,5

Luís 8,5 8,3 +0,2 0,2 2 2

Miguel 7,9 7,9 0

Ângelo 6,9 6,9 0

Cláudio 7,2 7,8 -0,6 0,6 7 7

Aurélio 8,8 7,5 +1,3 1,3 8 8

Total T- = 21 T+ = 15

♦ Calculando T

1 Soma-se os ranks das diferenças negativas que será chamado de T-

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 89/133

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

Calculando o desvio padrão de T

( )( )121 ++= nnnσ

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 90/133

( )( )24 121 ++= nnnT σ   

Quando ocorrer empates entre diferenças diferentes de zero (d ≠ 0), será necessário fazer uma

correção no cálculo de σT.

Correção decorrente de empates

Esse fator de correção chamado de ΣT será calculado a partir do número observações

empatadas.

( )( )

242

T1n21nn

T

∑σ

−++=  

∑ ∑=

=k 

i

TiT 1

 

onde

 f  f T  iii−=

onde  f i é o número de elementos que estão empatados dentro do grupo i  

Exemplo de correção dos empates: imagine que em uma determinada amostra de alturas haja

quatro casos com valor 145, seis com valor 154, três com altura 156 e dois casos com altura

185cm. Há, portanto, quatro grupos com empates.

Primeiro grupo: 145 ; 145 ; 145 ; 145 Neste caso fi = 4 e Ti = 43 – 4 = 60

Segundo grupo: 154 ; 154 ; 154 ; 154 ; 154 ; 154

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

Calculando o valor de z

µ−

= TT

z

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 91/133

σµ=

T

Tz  

TOMADA DE DECISÃO 

1. Teste bilateral

 H0 : não há diferença entre as notas obtidas no início e no final do curso H1 : há diferença entre as notas obtidas no início e no final do curso

Calcula-se z a partir do menor valor dos T (T+ e T-)

Estabelece-se α e toma-se os dois valores de zcríticoα,(2) (o da cauda inferior e o da cauda

superior)

Se o z calculado for igual ou maior que zcrítico, α(2) da cauda superior ou menor ou igual ao

zcrítico, α(2) da cauda inferior rejeita-se H0

Se o z calculado for menor que o zcrítico,α,(2) da cauda superior e maior que o zcrítico,α,(2) da

cauda inferior não se pode rejeitar H0

Observação: para testes bilaterais com α  = 0,05 os valores críticos de z são –1,960 e +1,960.

2. Teste unilateral do tipo: os valores iniciais são maiores que os finais (A>B)

 H0 : As notas obtidas no início são menores ou iguais às do final do curso

 H1 : As notas obtidas no início são maiores que a do final do curso

Calcula-se z a partir de T (o menor valor entre T+ e T-)

Estabelece-se α e toma-se o valor de z íti (1)

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

3. Teste unilateral do tipo: os valores iniciais são menores que os finais (B>A)

H0 : As notas obtidas no início são maiores ou iguais às do final do curso

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 92/133

 H0 : As notas obtidas no início são maiores ou iguais às do final do curso H1 : As notas obtidas no início são menores que a do final do curso

Calcula-se z a partir de T (o menor valor entre T+ e T-)

Estabelece-se α e toma-se o valor de zcrítico,α(1) 

Se o z calculado for igual ou menor que zcrítico,α(1) e T- > T+ rejeita-se H0 (lembre-se que

nosso d = inicial – final)

Se o z calculado for maior que o zcrítico,α(1) ou se T- ≤ T+ não se pode rejeitar H0

Observação: se d = B - A há a necessidade de rever com cuidado o raciocínio exposto

acima.

Retomando o exemplo anterior:

1. T+ = 21 e T- = 15 , portanto T = 15

2. Calculando a média de T ⇒ 

( )

184

188

=

=µ T   

3. Calculando o desvio padrão de T ⇒ ( )( )

14,724

182188=

+×+=σ T 

 

4. Calculando do valor de z ⇒  42,014,7

1815−=

−= z   

Consultando a tabela de probabilidades de z, verifica-se que a probabilidade de z < -0,42 é

0 3372 (33 72%) t t ã d j it H0

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 93/133

Distribuição dos valores críticos de T (o menor valor entre T+ e T-) do teste de Wilcoxon 2 

Teste Bilateral 0,10 0,05 0,02 0,01

Teste Unilateral 0,05 0,025 0,01 0,005

n5  0

6 2 0

7 3 2 0

8 5 3 1 0

9 8 5 3 1

10 10 8 5 3

11 13 10 7 5

12 17 13 9 7

13 21 17 12 914 25 21 15 12

15 30 25 19 15

16 35 29 23 19

17 41 34 27 23

18 47 40 32 27

19 53 46 37 32

20 60 52 43 37

21 67 58 49 42

22 75 65 55 4823 83 73 62 54

24 91 81 69 61

25 100 89 76 68

Se T ≤ Tcrítico,α então p ≤ α. Rejeita-se H0 

Teste de Mann-Whitney - André M. Morcillo

 ___________________________________________________________________________________________________

BIBLIOGRAFIA

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 94/133

BIBLIOGRAFIA

1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de

Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São

Paulo, 1979.

4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

Teste de Wilcoxon para pequenas amostras (n<25)

Estabelecer 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 95/133

Comparar T com Tcritico

Atribuir a menor das duas somas a T

Somar os ranks com sinal +

Somar os ranks com sinal -

Atribuir o sinal da diferença aos ranks

Atribuir ranks às diferenças

Ordenar as diferenças

sem considerar seu sinal

Excluem-se os casos com d = 0

Calcular a diferença (d) para

todos os casos

H0, H1

 Nível de Significância

 

Teste de Wilcoxon para grandes amostras (n>25)

Estabelecer H0, H1

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 96/133

Calcular a média e o desvio padrão de T

Atribuir a menor das duas somas a T

Somar os ranks com sinal +Somar os ranks com sinal -

Atribuir o sinal da diferença aos ranks

Atribuir ranks às diferenças

Ordenar as diferenças

sem considerar seu sinal

Excluem-se os casos com d = 0

Calcular a diferença (d) para

todos os casos

,

 Nível de Significância

TESTE NÃO-PARAMÉTRICOS André M. Morcillo1 

Os testes não-paramétricos (TNPs) são menos poderosos que seus equivalentes paramétricos (TPs).

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 97/133

p ( ) p q q p ( )

Devem ser utilizados nas situações em que os TPs não podem ser usados.

Enquanto nos TPs são comparados os parâmetros da população (média e variância), nos TNPs

comparam-se os postos ou “ranks” que cada observação recebe após sua ordenação.

O primeiro passo para realizar um TNP é atribuir postos ou “ranks” aos valores obtidos nas amostras.

ATRIBUINDO POSTOS 

1. Inicialmente ordena-se os dados preferencialmente em ordem crescente

2. Atribui-se os postos (“ranks” ou notas) aos valores ordenados, o que significa que os valores medidos

são classificados de acordo com uma nova escala.

Exemplo 1 - Dada a distribuição de notas de 10 alunos de uma classe de 8ª série:

João: 8,0 Maria: 8,1

Pedro: 7,5 Marta: 8,5

Paulo: 8,2 Larissa: 8,7

Manoel: 8,8 Rita: 7,8

Marcos: 7,9

Joaquim: 7,7

Os passos a seguir são:

1. Ordenar todas as notas (em ordem crescente): 7,5; 7,7; 7,8; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8

2. Atribuir os postos:

Atribuir ao primeiro elemento (o de valor mais baixo) o rank [1], ao segundo o posto [2], ao terceiro o

 posto [3] e assim, sucessivamente, até o último.Como pode ser observado no exemplo acima o menor valor observado (7,5) recebeu o posto [1]; o

segundo (7,7) o posto [2] e a maior nota (8,8) o posto [10].

 

3. Reorganiza-se os dados, apresentando as notas, os nomes dos alunos e os postos. 

O d d l t li t N t N P t R k

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 98/133

Ordem do elemento na lista Notas Nomes Postos ou Rank

1º 7,5 Pedro 1

2º 7,7 Joaquim 2

3º 7,8 Rita 3

4º 7,9 Marcos 4

5º 8,0 João 5

6º 8,1 Maria 6

7º 8,2 Paulo 7

8º 8,5 Marta 8

9º 8,7 Larissa 9

10º 8,8 Manoel 10

Total 29 26

Soma dos postos das mulheres: 3 + 6 + 8 + 9 = 26

Soma dos postos do homens : 1 +2 + 4 + 5 + 7 + 10 = 29

Média dos postos das mulheres: 26 / 4 = 6,5

Média dos postos dos homens: 29 / 6 = 4,8

ATRIBUINDO POSTOS QUANDO HÁ VÁRIAS OBSERVAÇÕES COM O MESMO VALOR  

Um situação especial ocorre quando há observações com valores repetidos. Fazendo-se uma pequena

modificação no exemplo anterior, atribui-se ao Pedro, ao Joaquim e à Rita a mesma nota 7,5. Os novos

dados já ordenados são apresentados abaixo:

7,5; 7,5; 7,5; 7,9; 8,0; 8,1; 8,2; 8,5; 8,7; 8,8

 

Ordem 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º

 Notas 7,5 7,5 7,5 7,9 8,0 8,1 8,2 8,5 8,7 8,8

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 99/133

Rank 2 2 2 4 5 6 7 8 9 10

Observe que os três alunos que tinham as notas mais baixas receberam o mesmo posto.

Um outro exemplo: num conjunto de 4.500 observações de alturas temos empatados os elementos 278º,279º, 280º e 281º com o valor 145cm; os elementos 376º, 377º, 378º com 147,5cm.

Os ranks das altura iguais a 145cm seria: (278+279+280+281)/4=279,5

Os ranks das altura iguais a 147,5cm seria: (376+377+378)/3=377 

Ordem ... 278º 279º 280º 281º ... 376º 377º 378º ...

Valor ...  145,0 145,0 145,0 145,0 ... 147,5 147,5 147,5 ...

Rank ...  279,5 279,5 279,5 279,5 ... 377 377 377 ...

 

COMPARAÇÃO DE DUAS AMOSTRAS INDEPENDENTES 

TESTE DE MANN-WHITNEY 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 100/133

Esta prova requer que as duas amostras sejam independentes, que os dados sejam contínuos e mensurados

nas escalas ordinal, intervalar ou de razão. Não deve ser aplicada quando os dados foram medidos na

escala nominal.

Para a realização do teste as observações originais das duas amostras são reunidas em um único grupo,

sendo o conjunto ordenado e transformado em ranks, que serão utilizados para calcular a estatística U.

Considerando:

n1 = número de casos da menor amostran2 = número de casos da maior amostra

 N  = total de casos das duas amostras 

R 1 = soma dos ranks da amostra de tamanho n1

R 2 = soma dos ranks da amostra de tamanho n2 

Calcula-se U e U’ a partir de R 1 e de R 2 pelas fórmulas abaixo e toma-se o menor deles: 

( )R 12

1n1.n1n2.n1U   −

++=  

( )R 22

1n2.n2n2.n1U'   −

++=  

TESTE DE HIPÓTESES 

 

Se U > Uα(2),n2,n1  não se rejeita H0

Se U ≤ Uα(2),n2,n1  rejeita-se H0

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 101/133

 b) Teste unilateral

H0 : as duas amostras apresentam a mesma distribuição

H1 : as duas amostras têm distribuições diferentes, sendo que a amostra 1 tem valores maiores que aamostra 2

ou

H1 : as duas amostras têm distribuições diferentes, sendo que a amostra 1 tem valores menores que a

amostra 2

Uma vez selecionado o menor dos dois valores de U calculados, recorre-se à tabela unilateral de U para α  previamente selecionado, procurando localizar o valor crítico de Uα(1),n2,n1 .

Se U > Uα(1),n2,n1  não rejeitamos H0

Se U ≤ Uα(1),n2,n1  rejeitamos H0

Retomando o exemplo anterior, deseja-se saber se as notas dos alunos do sexo masculino são diferentes

das notas do feminino.

Exemplo 1 - Dada a distribuição de notas de 10 alunos de uma classe de 8ª série:

Ordem do elemento na lista Notas Nomes Postos ou Ranks

1º 7,5 Pedro 1

2º 7,7 Joaquim 2

3º 7,8 Rita 3

4º 7,9 Marcos 4

5º 8,0 João 5

 

U = 4 x 6 + [(4 x 5)/2] - 26 = 8

 b) CALCULANDO U’ A PARTIR DE R2

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 102/133

U’ = 4 x 6 + [(6 x 7)/2] - 29 = 16

Toma-se o valor de U = 8 para α = 0,05 e n1=4 e n2 = 6. Nestas circunstâncias o valor de U0,05(2);4; 6 = 2.

Como U > U0,05(2);4; 6 não se pode rejeitar H0

UMA SITUAÇÃO ESPECIAL 

 A tabela de U abrange até n1=20 e n2=40. Quando as amostras são maiores, U tem distribuição que

tende para curva normal, sendo que neste caso, U deve ser transformado em  z  e sua probabilidade de

ocorrência verificada na tabela de z.

Determinando a significância de U quando n1>20 ou n2>40

Quando n1>20 ou n2>40 não é mais possível a utilização da tabela de U, porém sabe-se que U tende a ter

distribuição normal. A partir do valor da média de U e de seu desvio padrão, calcula-se o valor de z e, a partir da tabela de distribuição de z, a sua probabilidade. Do ponto de vista prático, rejeita-se H0 para

α=0,05, se z ≥ 1,960 nos testes bilaterais ou se z ≥ 1,645 no unilaterais.

σU

µUUzU

−=  

1) Obtendo a média de U (µU)

2n2n1µU

×=  

 

N = n1 + n2

K é o número de grupos onde ocorreram empatesf i é o número de elementos empatados dentro de um grupo.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 103/133

Exemplo: se dentro de um conjunto de dados houvesse empates como é apresentado a seguir:

... 100, 100, 100, ... , 120, 120, ... , 150, 150, 150, 150, 150, ...

O primeiro grupo com empates tem três elementos [100, 100, 100] portanto fi=3

Ti = 33

 - 3 = 27 - 3 = 24O segundo grupo com empates tem dois elementos [120,120] portanto fi=2

Ti = 23 - 2 = 8 - 2 = 6

O terceiro grupo com empates tem cinco elementos [150,150,150,150,150] portanto fi=5

Ti = 53 - 5 = 125 - 5 = 120

Somando-se os valores de Ti:T = Ti = 24 + 6 + 120 = 150

Exemplo 2 - Comparando-se dados de altura de duas amostras em relação ao sexo encontramos empates

que proporcionam T = ΣTi = 150

Considerando n1=120 o número de meninos e n2=150 o número de meninas, U = 9538 e α = 0,05 tem-se:

n1 = 120 n2 = 150 N = 270 U = 9538

µU = (120 . 150)/2 = 9000

637,57

12

150-70.269.2712

269.270

150120σU   =

 

 

 

 ××

=  

como

 

BIBLIOGRAFIA

1. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

2 CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações 1ª ed Porto Alegre: Artmed

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 104/133

2. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1 ed. Porto Alegre: Artmed,

2003.

3. CAMPOS H – Estatística experimental não-paramétrica. 3ª ed. Piracicaba. Departamento de

Matemática e Estatística da Escola Superior de Agricultura “Luiz de Queiroz” da Universiade de São

Paulo, 1979.

4. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.

5. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

6. SIEGEL S – Estatística não-paramétrica. Rio de Janeiro: Editora McGraw-Hill, 1975.

7. VIEIRA S – Bioestatística: tópicos avançados. Rio de Janeiro: Editora Campus, 2003.

8. ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

 

Distribuição de U do teste de Mann-Whitney (Unilateral ao nível de 2,5% ; Bilateral ao nível de 5%)  N1

N2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 202 - -3 - - -

4 - - - 05 - - 0 1 26 - - 1 2 3 5

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 105/133

6 1 2 3 57 - - 1 3 5 6 88 - 0 2 4 6 8 10 139 - 0 2 4 7 10 12 15 1710 - 0 3 5 8 11 14 17 20 2311 - 0 3 6 9 13 16 19 23 26 3012 - 1 4 7 11 14 18 22 26 29 33 3713 - 1 4 8 12 16 20 24 28 33 37 41 4514 - 1 5 9 13 17 22 26 31 36 40 45 50 5515 - 1 5 10 14 19 24 29 34 39 44 49 54 59 6416 - 1 6 11 15 21 26 31 37 42 47 53 59 64 70 7517 - 2 6 11 17 22 28 34 39 45 51 57 63 69 75 81 8718 - 2 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 9919 - 2 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 11320 - 2 8 14 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 12721 - 3 8 15 22 29 36 43 50 58 65 73 80 88 96 103 111 119 126 13422 - 3 9 16 23 30 38 45 53 61 69 77 85 93 101 109 117 125 133 14123 - 3 9 17 24 32 40 48 56 64 73 81 89 98 106 115 123 132 140 14924 - 3 10 17 25 33 42 50 59 67 76 85 94 102 111 120 129 138 147 156

25 - 3 10 18 27 35 44 53 62 71 80 89 98 107 117 126 135 145 154 16326 - 4 11 19 28 37 46 55 64 74 83 93 102 112 122 132 141 151 161 17127 - 4 11 20 29 38 48 57 67 77 87 97 107 117 127 137 147 158 168 17828 - 4 12 21 30 40 50 60 70 80 90 101 111 122 132 143 154 164 175 18629 - 4 13 22 32 42 52 62 73 83 94 105 116 127 138 149 160 171 182 19330 - 5 13 23 33 43 54 65 76 87 98 109 120 131 143 154 166 177 189 20031 - 5 14 24 34 45 56 67 78 90 101 113 125 136 148 160 172 184 196 20832 - 5 14 24 35 46 58 69 81 93 105 117 129 141 153 166 178 190 203 21533 - 5 15 25 37 48 60 72 84 96 108 121 133 146 159 171 184 197 210 22234 - 5 15 26 38 50 62 74 87 99 112 125 138 151 164 177 190 203 217 23035 - 6 16 27 39 51 64 77 89 103 116 129 142 156 169 183 196 210 224 237

36 - 6 16 28 40 53 66 79 92 106 119 133 147 161 174 188 202 216 231 24537 - 6 17 29 41 55 68 81 95 109 123 137 151 165 180 194 209 223 238 25238 - 6 17 30 43 56 70 84 98 112 127 141 156 170 185 200 215 230 245 25939 0 7 18 31 44 58 72 86 101 115 130 145 160 175 190 206 321 236 252 26740 0 7 18 31 45 59 74 89 103 119 134 149 165 180 196 211 227 243 258 274

  9

 

Teste de Mann-Whitney para n1 até 20 e n2 até 40

Verificar se as amostras são independentes

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 106/133

U calculado é menor ou

igual ao U da tabela

U calculado é maior que

o U da tabela

Encontrar o valor crítico de U na tabela

levando em conta n1, n2 e alfa

 Assumir o U de menor valor como a estatística U

Calcular os dois valores de U

Somar os ranks de cada amostra

 Atribuir ranks às observações

Reunir as observações das duas amostras

em um único grupo e ordená-las

Estabelecer as hipóteses de trabalho

e o nível de significância alfa

p

Verificar se foram medidas nas escalas ordinal,

intervalar ou de razão

 

Teste de Mann-Whitney para n1 maior que 20 e n2 maior que 40

Verificar se as amostras são independentes

Verificar se foram medidas nas escalas ordinal,

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 107/133

Se a probabilidade de se ter 

um valor de z maior ou igual ao

calculado for menor ou igual a 5%

Se a probabilidade de se ter 

um valor de z maior ou igual ao

calculado for maior que 5%

Calcular a média de U

Calcular o desvio padrão de U

Calcular o z de U

 Assumir o U de menor valor como a estatística U

Calcular os dois valores de U

Somar os ranks de cada amostra

 Atribuir ranks às observações

Reunir as observações das duas amostras

em um único grupo e ordená-las

Estabelecer as hipóteses de trabalho

e o nível de significância alfa

intervalar ou de razão

 

TESTE DO QUI-QUADRADO ( 2)

André Moreno Morcillo1

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 108/133

O teste do χ2 é muito eficiente para avaliar a associação existente entre variáveis qualitativas

(dados do tipo categórico). O princípio básico deste método não paramétrico é comparar as

divergências entre as freqüências observadas e as esperadas.

De uma maneira geral, pode-se dizer que dois grupos se comportam de forma semelhante se as

diferenças entre as freqüências observadas e as esperadas em cada categoria forem muito

 pequenas, próximas a zero.

O χ2 é calculado pela fórmula:

( )∑

  −=

 E 

 E O2

2 χ    (1)

onde:

O = freqüência observada E  = freqüência esperada

Observe que ( O-E ) é a diferença entre a freqüência observada e a esperada, que deverá ser

calculada para cada célula da tabela. Quando as freqüências observadas são muito próximas às

esperadas, o valor ( O-E ) é pequeno; no entanto, quando as discrepâncias são grandes, ( O-E )

 passa a ser grande e, consequentemente, o χ2 assume valores altos.

O pesquisador estará sempre trabalhando com duas hipóteses:

 Na prática, a freqüência esperada em uma determinada célula é calculada pela multiplicação dototal de sua coluna (Tc), pelo total de sua linha (Tl), dividindo-se o produto pelo total geral da

tabela (N). 

E = ( Tc x Tl ) / N

Tc : total da coluna

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 109/133

Tl : total da linha

Uma vez calculado o χ2, procura-se na tabela de distribuição de χ2  o valor do χ2  críticoconsiderando o nível de significância adotado e os graus de liberdade.

Os graus de liberdade da tabela são obtidos por:gl = (número de linhas –1 x número de colunas – 1)

Se o χ2 obtido for igual ou maior que o χ2 crítico, H0 deverá ser rejeitada.

Exemplo: Um pesquisador deseja verificar se há associação entre três cursos deuma universidade e dependência de drogas. Entrevistou 120 alunos, sendo 25 da

Medicina, 35 de Farmácia e 60 de Biologia, perguntando sobre o uso de drogas,admitindo somente duas respostas: sim ou não. Após o processamento dos dadosficou com a seguinte tabela de distribuição de freqüências:

Medicina Farmácia Biologia Total

Usa droga 10 20 30 60

 Não usa droga 15 15 30 60

Total 25 35 60 120

Como pode ser observado, entre os 120 alunos incluídos no estudo, há um número igual deusuários e não usuários de drogas, entretanto, a distribuição dentro dos vários cursos não ocorreda mesma forma.

Veja as dificuldades na interpretação dos dados. Há um número diferente de alunosentrevistados, assim como há uma proporção diferente de usuários e não usuários de drogas em

 

1. Calcular as freqüências esperadas

A  freqüência esperada de cada célula é calculada por (Tc x Tl) / N. Na célula que representaMEDICINA X USUÁRIO é (25 x 60) / 120 = 12.5. A  freqüência esperada na célula que representaBIOLOGIA X NÃO USUÁRIO é (60 x 60) / 120 = 30 E assim com todas as células da tabela

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 110/133

BIOLOGIA X NÃO USUÁRIO é (60 x 60) / 120 = 30. E assim com todas as células da tabela.

E = ( Tc x Tl ) / N

2. As freqüências esperadas deverão ser anotadas nas correspondentes células.

Medicina Farmácia Biologia Total

O 10 20 30 60Usa droga

 E 12,5 17,5 30,0

O 15 15 30 60 Não usa

Droga  E 12,5 17,5 30,0

Total 25 35 60 120

3. A seguir aplica-se a fórmula [1].

χ2 = [10 - 12,5]2 / 12,5 + [20 - 17,5] 2 /17,5 + [30 – 30] 2 / 30 +[15 – 12,5] 2 / 12,5 +

[15 – 17,5] 2 / 17,5 + [30 – 30] 2 /30 = 1,7

χ2 = 1,7

4. Determina-se os graus de liberdade (gl) da tabela:

Os graus de liberdade da tabela são calculados multiplicando-se o número de linhas da tabelamenos um pelo número colunas da tabela menos um.

O χ2 = 1.7 é menor que o χ22gl;α=0.05  que é 5.99. Assim sendo, a hipótese  H0  não pode ser

rejeitada, concluindo-se que no grupo estudado, não há associação entre as variáveis. A proporção de usuários e não usuários de drogas entre os alunos dos cursos de Medicina,

Biologia e Farmácia é igual.Observação: caso 20% ou mais das células tenham freqüências esperadas menores

5 h j i f üê i d l i l 1

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 111/133

que 5, ou haja uma ou mais freqüências esperadas com valores menores ou igual a 1,não se deve usar o teste do χ2. Uma boa alternativa para estes casos é oagrupamento de linhas e colunas, desde que tenha algum sentido lógico. 

Como pode ser observado, o teste é facilmente realizado porém, com grande trabalho manual.Este trabalho manual pode ser minimizado em algumas situações especiais: as tabelas 2 x 2, n x2 e m x n. 

1) TABELAS 2 x 2 

Quando os dados estão tabulados em tabelas de duas linhas por duas colunas  podem serutilizar fórmulas que necessitam somente das freqüências observadas, não requerendo o cálculodas freqüências esperadas.

1. Quando o número de casos é maior que 40 (N > 40) deve-se empregar a fórmula:

( )4T1.T2.T3.T

.N b.ca.d 22   −= χ    (2)

2) Quando o número de casos estudados é maior ou igual a 20 e menor ou igual a 40 (20 ≤ N ≤ 40) deve-se empregar a fórmula:

4T1.T2.T3.T

.N2

 N b.ca.d

2

2  

   −−

= χ    (3)

onde:

Exemplo: um pesquisador quer saber se a proporção de crianças acometidas poruma determinada doença é a mesma entre dois grupos de estudo (A e B). Estudouuma amostra com 28 casos, obtendo a seguinte distribuição de freqüências:

H0: A proporção de crianças acometidas entre os dois grupos é igual .H1: A proporção de crianças acometidas entre os dois grupos é diferente .

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 112/133

GRUPO A GRUPO B Total

SADIOS 6 7 13

ACOMETIDOS 6 9 15

Total 12 16 28

a = 6 b = 7 c = 6 d = 9

T1 = 13 T2 = 15 T3 = 12 T4 = 16

 N = 28

Como N = 28 deve-se usar a fórmula [3]:

003,0613.15.12.1

.28

2

28.766.9

2

2 =

−−

=

 

 

 

 

 χ   

Observe que nas tabelas 2x2 há somente 1 grau de liberdade, pois ( 2 - 1 ) x ( 2 – 1 )=1

Para 1 g.l. e α=0,05 o  χ 2 crítico é 3,84.

Como o χ2

= 0,003 é menor que 3,84, não se pode rejeitar  H0, podendo-se afirmar que naamostra estudada a proporção de crianças acometidas é igual nos grupos A e B.

2) TABELAS DE m LINHAS POR DUAS COLUNAS (mx2) 

Quando as tabelas têm m linhas por duas colunas, pode-se utilizar a fórmula [4] que requer as

freqüências observadas de uma das colunas, cuja escolha fica a critério do pesquisador. A

fórmula [4] está escrita para uso da coluna 1.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 113/133

[ ] p

( )

q. p

 N1O

n

O2

 j

1i i

2

1i

2

∑−

 

 

 

 

=

∑=

 χ    (4)

onde:

O1i = freqüência observada na coluna 1 da linha ini  = total da linha i∑ 01= total da coluna 1

 pq

 N Oi p

−=

∑=

Observe que se trabalha com as freqüências observadas de uma única coluna, o que facilita os

cálculos.

 Neste caso os graus de liberdade ( g.l.) são determinados por: número de linhas –1.

Exemplo:

Um pesquisador investigando o uso de drogas entre universitários desejava saber se haviadiferença quando se considerava diferentes cursos. Aplicou um questionário entre alunos dediferentes cursos, obtendo os resultados apresentados na tabela abaixo:

CURSO USA DROGA NÃO USA DROGA TOTAL

As hipóteses de trabalho são:

 HO: os grupos se comportam como se fossem de uma mesma população e, portanto, as freqüências de

usuários de drogas são iguais entre os cursos.  H1: os grupos se comportam como se fossem de populações diferentes e, portanto, as freqüências deusuários de drogas são diferentes entre os cursos. 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 114/133

Como se trata de uma variável que pode assumir somente duas situações (usa droga ou não usa

droga), pode-se construir uma tabela tipo m linhas x 2 colunas e, consequentemente, aplicar o

teste do χ2 usando-se a fórmula [4].

Para maior clareza e facilidade nos cálculos, deve-se refazer a tabela contendo somente uma das

duas colunas ( a critério do pesquisador) e os totais. Neste exemplo foi escolhida a coluna 1 (usa

drogas). Observe que foram acrescentadas mais duas colunas na tabela para permitir a anotação

dos cálculos intermediários:

CURSO USA DROGA(O1i )

TOTAL(ni )

(O1i)2 / ni

Medicina 40 100 402 / 100

Física 50 120 502 / 120

Química 80 130 802

 / 130

Farmácia 100 220 1002 / 220 ∑(O1i)2 / ni = 131,519

TOTAL ∑(O1 ) = 270  N = 570 2702 / 570 ∑(Oi)2 / N = 127,895

O próximo passo será o cálculo das probabilidades p e q: 

p = 270 / 570 = 0,4737

Como a tabela tem 4 linhas são 3 graus de liberdade.

Considerando-se α = 0,05 e 3 graus de liberdade, o χ2

crítico é igual a 7,81.

Como o χ2 (14 5362) é maior que o χ2 crítico (7 81) rejeita se H0 e aceita se H1 concluindo se

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 115/133

Como o χ  (14,5362) é maior que o χ crítico (7,81), rejeita-se H0 e aceita-se H1, concluindo-se

que, a partir dos dados observados, o hábito de usar drogas é diferente entre os alunos dos

quatro cursos incluídos na amostra.

3) CÁLCULO DO 2 EM TABELAS DE GRANDES DIMENSÕES (mxn)

Há uma forma de se obter o χ2 em tabelas de grandes dimensões sem haver a necessidade do

conhecimento das freqüências esperadas. Esta técnica foi desenvolvida pelo  Professor Aquiles

 E. Piedrabuena  utilizando sua fórmula para proporções, considerando os totais das colunas

(comunicação pessoal).

Calcula-se individualmente o valor do χ2  de cada linha da tabela, usando-se a fórmula [5] e,

 posteriormente, soma-se os valores obtidos em cada linha conforme a fórmula [6], que será o

valor do χ2.

Considerando-se uma linha i qualquer de uma tabela:

T T T 

O

O

O

Oli

licr 

ir 

c

i

c

i

c

ii

 N −

 

  

 ++++= ....

2

3

23

2

22

1

212

 χ    (5)

e

 χ  χ  χ  χ  χ 22

322

21

2 ...r 

++++=   (6)

 

COLUNA 1 COLUNA 2 COLUNA 3 ... COLUNA r

TOTAL

(LINHAS)

LINHA 1 Tl1

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 116/133

LINHA 2 Tl2

LINHA 3 Tl3

... ...

LINHA i Oi1 Oi2 Oi3 ... Oir Tli

... ...

LINHA n Tln

TOTAL

(COLUNAS)Tc1 Tc2 Tc3 ... Tcr N

Oi1: freqüência observada na coluna 1 linha iOi2: freqüência observada na coluna 2 linha iOi3: freqüência observada na coluna 3 linhaiOir: freqüência observada na coluna r linha iTli: total da lina iTc1: total da coluna 1Tc2: total da coluna 2Tc3: total da coluna 3Tcr: total da coluna r N: total de casos na tabela

Retornando ao primeiro exemplo:

Medicina Farmácia Biologia Total

Usa droga 10 20 30 60

 

Primeiro será calculado o valor do χ2 da linha 1 (grupo que usa drogas):

χ2 linha 1 =[ ( 102 )/ 25 + ( 202 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) – 60 = 0,8571

Passa-se agora a trabalhar com a linha 2 (grupo que não usa drogas)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 117/133

χ2linha 2 =[ ( 152 )/ 25 + ( 152 )/ 35 + ( 302 )/ 60 ] x ( 120/ 60 ) – 60 = 0,8571

Finalmente,

χ2 = χ2

linha 1 + χ2

linha 2 

χ2 = 0,8571 + 0,8571 = 1,714 com 2 g.l.

Considerando-se que o χ2 crítico para 2 graus de liberdade e α=0,05 é 5,99 , H0 não pode serrejeitada.

BIBLIOGRAFIA

1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall,1991.

2. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação dePesquisas Científica de Ribeirão Preto, 2002.

3. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

4. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford UniversityPress, 1995.

5. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.6. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.7. C ALLEGARI-J ACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre:

 Artmed, 2003.8. D ANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed.,

New York: John Wiley & Sons, Inc., 1995.9. GUIMARÃES RC, C ABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.

10. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil,1987.

11. M ARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.12. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

 

Distribuição de valores de χ2 para α de 5%, 1% e 0,1%

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 118/133

GL = 5% = 1% = 0,1%

1 3,84 6,64 10,832 5,99 9,21 13,823 7,82 11,34 16,274 9,49 13,28 18,465 11,07 15,09 20,526 12,59 16,81 22,467 14,07 18,48 24,328 15,51 20,09 26,129 16,92 21,67 27,8810 18,31 23,21 29,5911 19,68 24,72 31,2612 21,03 26,22 32,9113 22,36 27,69 34,5314 23,68 29,14 36,1215 25,00 30,58 37,7016 26,30 32,00 39,2917 27,59 33,41 40,7518 28,87 34,80 42,3119 30,14 36,19 43,8220 31,41 37,57 45,3221 32,67 38,93 46,8022 33,92 40,29 48,2723 35,17 41,64 49,7324 36,42 42,98 51,1825 37,65 44,34 52,5226 38,88 45,64 54,0527 40,11 46,96 55,4828 41,34 48,28 56,8929 42,56 49,59 58,3030 43,77 50,89 59,70

Comparação de duas populações - André Moreno Morcillo 

COMPARAÇÃO DE DUAS POPULAÇÕES INDEPENDENTES 

 André M. Morcillo1

 

COMPARAÇÃO DE VARIÁVEIS NUMÉRICAS CONTÍNUAS MEDIDAS NA ESCALA INTERVALAR OU DE

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 119/133

Ç

RAZÃO 

Considera-se que duas amostras ou populações são independentes quando elas não têm elementos

comuns.

Os dois principais parâmetros (do ponto de vista estatístico) de um população são a média e a variância.

Desta forma, quando desejamos saber se duas amostras são iguais ou diferentes, temos que comparar as

suas médias e dispersões. Do ponto de vista prático, comparamos as médias e as variâncias.

Duas populações podem ser consideradas semelhantes quando têm médias e variâncias iguais.

É recomendável que inicialmente comparemos as variâncias e, posteriormente, as médias das duas

amostras.

COMPARAÇÃO DAS VARIÂNCIAS – R AZÃO DAS VARIÂNCIAS 

A comparação de variâncias de duas amostras tomadas ao acaso de uma população com distribuição

normal é realizada pela fórmula:

 s s F  2

2

2

1=  

 No numerador colocamos a maior e no denominador a menor das variâncias encontradas nas amostras.

O valor de F calculado será comparado ao valor de Fcrítico obtido em uma tabela de distribuição de F,

considerando o nível de significância adotado, os graus de liberdade do numerador (n1-1) e o graus de

Comparação de duas populações - André Moreno Morcillo 

Construindo o teste de hipóteses

A hipótese nula afirma que as variâncias das amostras são iguais; enquanto a hipótese alternativa, que elas

são diferentes. Assim:

s

 s22

2

2

2

1

:H1

 :0H

ss≠

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 120/133

 s21 :H1 s ≠

Calculamos o valor de F e procuramos o valor crítico de F na sua tabela. Se o valor de F é menor que o

encontrado na tabela, não podemos rejeitar a hipótese H0 (significa que a probabilidade de F é maior que

o nível de significância adotado), concluindo que as amostras têm variâncias iguais. Quando o valor de Ffor maior ou igual ao valor da sua tabela rejeitamos H0, concluindo que as variâncias comparadas são

diferentes.

Exemplo I.1 - Um grupo de crianças com idades entre 7 e 7,5 anos foi submetido a um exame antropométrico e oresultados encontrados são apresentados abaixo:

n Média Variância

Sexo masculino 174 123,9 34,81

Sexo feminino 239 123,3 31,36

Desejando saber se a diferença observada entre as variâncias das amostras é significativa e considerando

o nível de significância de 5% (α=0,05), calculamos o valor de F:

F = 34,81 / 31,36 = 1,11

A seguir calculamos os graus de liberdade do numerador e do denominador:

Graus de liberdade do numerador = 174 – 1 = 173

Graus de liberdade do denominador = 239 – 1 = 238

P t b l d F f t 0 05 l íti d F 173 238 d lib d d

Comparação de duas populações - André Moreno Morcillo 

COMPARAÇÃO DAS MÉDIAS – TESTE T DE STUDENT 

Quando temos duas amostras com variâncias iguais e que foram tomadas ao acaso de um população comdistribuição normal, a comparação de suas médias pode ser realizada usando o Teste t de Student.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 121/133

( ) EP  x x

 x x

21

21

−=  

Onde o numerador é a diferença entre as médias das duas amostras e ( EP   x x 21−   )  é o Erro Padrão ou

Erro Standard da diferença entre as médias.

Uma maneira bastante adequada para calcular o Erro Padrão das Diferenças entre as médias é:

n

S2

n

S2

2

 p

1

 p

)x2x( 1+=

− EP   

e

( ) ( )2nn

.1n.1n

21

2

222

112

 p

sss −+

−+−=  

Considera-se a melhor estimativa da variância da população (σ s p

22).

O valor de t obtido deve ser comparado ao valor de tcrítico obtido na tabela de distribuição de t de Student,

considerando (n1+n2-2) graus de liberdade e o tipo de teste de hipótese (unilateral ou bilateral).

Construindo o teste de hipóteses

A hipótese nula inclui a igualdade das médias das amostras, enquanto a hipótese alternativa, que elassejam diferentes, ou ainda que m1>m2 ou m1<m2.

Assim:

Comparação de duas populações - André Moreno Morcillo 

 Nos testes unilaterais do tipo m1>m2, se o valor de t é menor que o encontrado na tabela, não rejeitamos

a hipótese H0 (significa que a probabilidade de t é maior que o nível de significância adotado). Quando t

for maior ou igual ao valor da tabela rejeitamos H0 (Figura 2).

 Nos testes unilaterais do tipo m1<m2, se o valor de t é maior que o encontrado na tabela, não rejeitamos a

hipótese H0 (significa que a probabilidade de t é maior que o nível de significância adotado). Quando t

f i l l d t b l j it H0 (Fi 3)

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 122/133

for menor ou igual ao valor da tabela rejeitamos H0 (Figura 3).

Figura 1 – Áreas de rejeição de H0 no teste t de Student bilateral. H1: m1#m2 

Área de não rejeição de H0

- t

Área de rejeição de H0 

+t 

-t 

Área de rejeição de H0

Comparação de duas populações - André Moreno Morcillo 

Área de rejeição de H0

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 123/133

Figura 2 – Área de rejeição de H0 no teste t de Student unilateral. H1: m1>m2 

Área de rejeição de H0 

+ t 

Exemplo I.2 - Um grupo de crianças com idades entre 8 e 8,5 anos foi submetido a um exameantropométrico e os resultados encontrados são apresentados abaixo. O pesquisador deseja saber se as

diferenças observadas entre as médias das amostras são estatisticamente significantes.

n Média Variâncias

Sexo masculino 111 126,0 33,64

Sexo feminino 137 125,2 32,49

Desejando saber se a diferença observada entre as variâncias das amostras é significativa, considerando o

nível de significância de 5% (α=0,05), calculamos o valor de F:

F = 33,64 / 32,49 = 1,035

A seguir calculamos os graus de liberdade do numerador e do denominador:

Graus de liberdade do numerador = 111 – 1 = 110

Comparação de duas populações - André Moreno Morcillo 

A seguir, considerando que as amostras foram tomadas ao acaso de uma população com distribuição

normal e que têm variâncias iguais, aplicamos o Teste t de Student.

a) calculando o( ) ( )   ( ) ( )

2137111

49,32.113764,33.1111

2

.1.12

22

2

112

+

−+−=

+

−+−=

nn sn sn

 s p = 33,004

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 124/133

2137111221

−+−+nnp

 b) calculando o137

004,33

111

004,33

2

2

1

2

21

+=+=−

n

 s

n

 s EP 

 p p

 x x = 0,7336

c) calculando o

( ) 7336,0

2,125126

21

21   −=

−=

− EP  x x

 x x

t   = 1,090

d) calculando os graus de liberdade = 111 + 137 –2 = 246

f) analisando as hipóteses. Como o teste de hipóteses é bilateral temos:

H0 : m1 = m2

H1 : m1 ≠ m2

Procuramos o valor crítico de t para testes bilaterais t0,05,246 = 1,960. Comparamos o t calculado com os

tcríticos +1,960 e –1,960. Como o valor do t calculado cai na área de não rejeição de H0 concluímos que m1

= m2 ou que as amostras são procedentes de uma mesma população.

Por outro lado, se H1= m1>m2 (teste unilateral) o t0,05,246 = 1,644; o t calculado também cairia na área de

não rejeição de H0 e, portanto, rejeitaríamos H1.

♦ Teste t de Student quando as variâncias são diferentes

Um situação especial é aquela em que temos duas amostras com variâncias diferentes tomadas ao acaso

de uma população com distribuição normal Esta situação é conhecida como problema de Behrens-Fisher

Comparação de duas populações - André Moreno Morcillo 

11 2

2

2

2

2

1

1

2

1

2

2

22

1

21

2

−+

=

  

  

  

  

 

  

 

+

n

n

n

n

n

n

 gl 

 s s

 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 125/133

Tomamos sempre o menor inteiro obtido pela fórmula acima.

Exemplo I.3: realizar o teste t comparando as médias de duas amostras A e B com as seguintes

características:

Amostra A: n=10 média= 10 variância= 2,0

Amostra B: n=10 média= 12 variância= 2,0

Desejamos saber se a média de A é estatisticamente menor que a de B, portanto, temos um teste unilateral

com:

H0: m1 > m2

H1: m1 < m2

a) calculamos o erro padrão da diferença: 0,6324

 b) calculamos o valor de t = (10-12) / 0, 6324= -3,162c) verificamos que o t crítico para α = 0,05; 18 graus de liberdade e teste unilateral é 1,734

d) atribuimos o sinal negativo ao t crítico = -1,734

Como o t calculado é menor que o tcrítico rejeitamos H0 e aceitamos H1.

Uma maneira matematicamente mais elegante de calcular o t nestes casos seria trabalharmos com omódulo da diferença entre m1 e m2 e compararmos o valor do t obtido diretamente com o t da tabela.

Comparação de duas populações - André Moreno Morcillo 

 b) quando a hipótese alternativa é m1<m2 o valor de t é negativo (menor que 0). Como pode ser

observado, os valores na tabela de distribuição de t são todos maiores que 0. Na verdade os valores

negativos não foram colocados na tabela para economizar espaço. Como a distribuição de t é simétrica,

 basta achar o valor positivo de t considerando o nível de significância desejado e os graus de liberdade e

atribuir-lhe o sinal negativo.

Quando o t calculado é menor que o valor de t crítico, rejeitamos H0 e aceitamos H1.

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 126/133

VIOLAÇÃO DAS CONDIÇÕES IDEAIS PARA APLICAÇÃO DO TESTE T DE STUDENT 

Do ponto de vista teórico é necessário que as duas amostras que estão sendo comparadas tenham sido

tiradas ao acaso de uma população que tenha distribuição normal e que as duas amostras tenham

variâncias iguais. Estas condições dificilmente são conseguidas em pesquisas na área da Biologia.

Vários estudos têm demonstrado que o Teste t é pouco alterado quando as condições acima descritas não

são obtidas, especialmente quando as amostras têm o mesmo tamanho ou são aproximadamente iguais em

testes bilaterais; por outro lado, o Teste t torna-se mais resistente quanto maior for o tamanho das

amostras, especialmente quando elas têm o mesmo tamanho (n1 = n2). Deveremos ser muitos prudentesem teste unilaterais quando há assimetria evidente.

Pode-se dizer que o Teste t bilateral é muito pouco afetado pela assimetria em amostras que foram

tomadas ao acaso, porém o mesmo não ocorre se usarmos o teste unilateral.

Com relação à curtose, o poder do teste é menor nas distribuições platicúrticas e maior na leptocúrticas,

especialmente quando as amostras são pequenas.

Comparação de duas populações - André Moreno Morcillo 

COMPARAÇÃO DE DUAS POPULAÇÕES CORRELATAS 

TESTE T DE STUDENT PAREADO 

Considera-se duas amostras correlatas quando os elementos do grupo de estudo são comuns a ambas.

 Na prática esta situação ocorre quando um conjunto de pacientes é submetido a um procedimento em dois

t dif t l d d i t di b t b

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 127/133

momentos diferentes, como por exemplo, quando um grupo de pacientes com diabetes recebe uma

determinada modificação na dieta e o médico deseja avaliar o seu efeito sobre o estado nutricional.

Assim, realiza-se um exame antropométrico inicial que é repetido após três meses. Em outro caso, um

grupo de crianças com asma atópica é avaliada ao chegar ao serviço, passando a usar corticoesteróidesconforme um protocolo pré-estabelecido que prevê uma avaliação da estatura no início e após seis meses

de tratamento.

 Nestes dois casos há somente um grupo de estudo, porém cada elemento tem duas medidas, ou seja cada

criança foi avaliada duas vezes, portanto, há dois conjuntos de medidas.

O teste t de Student para grupos independentes compara as médias das duas amostras. Se tratarmos cada

conjunto de informações (a inicial e a final) como amostras diferentes e realizarmos o teste t para

amostras não pareadas, perderíamos a oportunidade de estudar uma informação muito importante: a

variação ou modificação observada em cada indivíduo que pertence ao estudo.

O objetivo fundamental no teste t para amostras pareadas é avaliar o comportamento das diferenças

observadas em cada elemento.

 Neste caso a única exigência é que a variável tenha distribuição normal e que cada elemento tenha sido

avaliado no início e no final do estudo.

A hipótese inicial ou de trabalho em geral afirma que não ocorreu diferença entre a primeira e a segunda

avaliação. A hipótese alternativa contesta a inicial: ocorreu diferença estatisticamente significante.

O principio básico do teste é calcular a diferença observada entre as medidas de cada elemento do estudo

(D = Medidafinal – Medidainicial). A seguir, calcular a média ( D ) e o erro padrão da média das diferenças 

( EP  D ).

Comparação de duas populações - André Moreno Morcillo 

• CONSTRUINDO O TESTE DE HIPÓTESES 

Quando não há diferença importante entre as medidas inicial e final de cada elemento a média das

diferenças e o valor de t tendem a zero. Nos casos em que o procedimento aplicado tem forte impacto as

diferenças individuais passam a ser mais expressivas, com média e valor de t se afastando de zero.

Há três possibilidades para H1:

a) só interessa ao pesquisador saber se há diferença entre o início e o final do estudo

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 128/133

0D :1H

0 :0H

= D 

Trata-se de um teste bilateral com dois valores críticos de t ( -tα e +tα ) que são obtidos na tabela de t de

Student considerando-se o nível de significância adotado (α) e o número de graus de liberdade (n-1).

Se o valor de t < -tα  ou t > +tα, t está na zona de rejeição de H0 , portanto, aceita-se H1. Quando o t <

+tα e t > -tα , está na zona de não rejeição de H0 (Figura 1).

 b) Se interessa ao pesquisador saber se os valores no final do estudo são maiores que no início.Calculando D = Medidafinal – Medidainicial:

0D :1H

0 :0H

>

≤ D 

Trata-se de um teste unilateral, sendo que o valor crítico de t ( +t  ) é obtido na tabela de t de Student

considerando o nível de significância adotado (α) e o número de graus de liberdade. Se o t < t crítico nãose rejeita H0, caso contrário rejeita-se H0 (Figura 2).

c) Se interessa ao pesquisador saber se os valores no final do estudo são menores que no início.

Calculando D = Medidafinal – Medidainicial:

0D :1H

0 :0H

<

≥ D

 

Trata-se de um teste unilateral, sendo que o valor crítico de t ( -t 

) é obtido na tabela de t de Student

Comparação de duas populações - André Moreno Morcillo 

Exemplo I.4 - Um grupo de 10 crianças com asma grave, do sexo masculino e 4 anos de idade, que receberamtratamento com prednisona durante 6 meses. Com o objetivo de avaliar o impacto do tratamento no escore z da altura,os pacientes foram medidos no início e no final do período de estudo.

escore z da altura Diferenças

CriançaInicial Final Final - Inicial

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 129/133

n. 1 -0,807 -0,799 0,008

n. 2 0,302 0,305 0,003

n. 3 0,001 -0,023 -0,024

n. 4 1,234 1,089 -0,145

n. 5 -1,111 -1,099 0,012

n. 6 2,010 2,005 -0,005

n. 7 0,222 0,219 -0,003

n. 8 0,123 0,144 0,021

n. 9 -0,199 -0,05 0,149

n. 10 -0,155 -0,087 0,068

Média das diferenças ⇒  0,008 

Desvio padrão das diferenças ⇒  0,073343 

As 10 crianças apresentaram diferenças cuja média é igual a 0,008 e desvio padrão 0,073343. A seguir

calcula-se o Erro Padrão da Média.

023,010

073343,0== EP  D  

A partir da média e de seu erro padrão calcula-se o valor de t

Comparação de duas populações - André Moreno Morcillo 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 130/133

Comparação de duas populações - André Moreno Morcillo 

BIBLIOGRAFIA

1. ALTMAN DG – Practical statistics for medical research. 1ª ed. London: Chapman & Hall, 1991.2. A NDERSON DR, SWEENEY DJ, WILLIAMS TA – Estatística aplicada à administração e economia.

2ª ed. São Paulo: Pioneira, 2002.

3. BEIGUELMAN B – Curso prático de bioestatística. 5ª ed. Ribeirão Preto: Fundação de Pesquisas

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 131/133

Científica de Ribeirão Preto, 2002.

4. BERQUÓ ES, SOUZA JMP, GOTLIEB SLD – Bioestatística. 1ª ed. São Paulo: EPU, 1981.

5. BLAND M – An introduction to medical statistics. 2ª ed. New York: Oxford University Press, 1995.6. BUNCHAFT G – Estatística sem mistérios. 4ª ed. Petrópolis, RJ: Vozes, 1997.

7. BUSSAB WO, MORETTIN PA – Estatística básica. 5ª ed. São Paulo: Saraiva, 2003.

8. CALLEGARI-JACQUES SM – Bioestatística: princípios e aplicações. 1ª ed. Porto Alegre: Artmed,

2003.

9. DANIEL WW – Biostatistics – A foundation for analysis in the health sciences. 6ª ed., New York:

John Wiley & Sons, Inc., 1995.10. GUIMARÃES RC, CABRAL JAS – Estatística. Lisboa: McGraw-Hill, 1997.

11. LEVIN J – Estatística aplicada às Ciências Humanas. São Paulo: Harper & Row do Brasil, 1987.

12. MARTINS GA – Estatística geral e aplicada. São Paulo: Atlas, 2001.

13. SPIEGEL MR – Estatística. 3ª ed. São Paulo: Makron Books, 1993.

14. TRIOLA MF – Introdução à estatística. 7ª ed., Rio de Janeiro: LTC – Livros Técnicos e Científicos

Editora Ltda, 1999.

15. VIEIRA S – Introdução à bioestatística. 3ª ed., Rio de Janeiro: Editora Campus, 1980.

ZAR J – Biostatistical analysis. 2ª ed. Englewood Cliffs: Prentice-Hall Inc., 1984.

Comparação de duas populações - André Moreno Morcillo 

♦ Tabela de distribuição de t  

Unilateral  40%  25%  10%  5%  2,5%  1%  0,5%  0.05% 

Bilateral 80% 50% 20% 10% 5% 2% 1% 0,1%

1 0.324920  1.000000  3.077684  6.313752  12.70620  31.82052  63.65674  636.6192 2 0 288675 0 816497 1 885618 2 919986 4 30265 6 96456 9 92484 31 5991

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 132/133

2 0.288675  0.816497  1.885618  2.919986  4.30265  6.96456  9.92484  31.5991 3 0.276671  0.764892  1.637744  2.353363  3.18245  4.54070  5.84091  12.9240 4 0.270722  0.740697  1.533206  2.131847  2.77645  3.74695  4.60409  8.6103 5 0.267181  0.726687  1.475884  2.015048  2.57058  3.36493  4.03214  6.8688 

6 0.264835  0.717558  1.439756  1.943180  2.44691  3.14267  3.70743  5.9588 7 0.263167  0.711142  1.414924  1.894579  2.36462  2.99795  3.49948  5.4079 8 0.261921  0.706387  1.396815  1.859548  2.30600  2.89646  3.35539  5.0413 9 0.260955  0.702722  1.383029  1.833113  2.26216  2.82144  3.24984  4.7809 10 0.260185  0.699812  1.372184  1.812461  2.22814  2.76377  3.16927  4.5869 11 0.259556  0.697445  1.363430  1.795885  2.20099  2.71808  3.10581  4.4370 12 0.259033  0.695483  1.356217  1.782288  2.17881  2.68100  3.05454  4.3178 13 0.258591  0.693829  1.350171  1.770933  2.16037  2.65031  3.01228  4.2208 14 0.258213  0.692417  1.345030  1.761310  2.14479  2.62449  2.97684  4.1405 

15 0.257885  0.691197  1.340606  1.753050  2.13145  2.60248  2.94671  4.0728 16 0.257599  0.690132  1.336757  1.745884  2.11991  2.58349  2.92078  4.0150 17 0.257347  0.689195  1.333379  1.739607  2.10982  2.56693  2.89823  3.9651 18 0.257123  0.688364  1.330391  1.734064  2.10092  2.55238  2.87844  3.9216 19 0.256923  0.687621  1.327728  1.729133  2.09302  2.53948  2.86093  3.8834 20 0.256743  0.686954  1.325341  1.724718  2.08596  2.52798  2.84534  3.8495 21 0.256580  0.686352  1.323188  1.720743  2.07961  2.51765  2.83136  3.8193 22 0.256432  0.685805  1.321237  1.717144  2.07387  2.50832  2.81876  3.7921 23 0.256297  0.685306  1.319460  1.713872  2.06866  2.49987  2.80734  3.7676 24 0.256173  0.684850  1.317836  1.710882  2.06390  2.49216  2.79694  3.7454 25 0.256060  0.684430  1.316345  1.708141  2.05954  2.48511  2.78744  3.7251 26 0.255955  0.684043  1.314972  1.705618  2.05553  2.47863  2.77871  3.7066 27 0.255858  0.683685  1.313703  1.703288  2.05183  2.47266  2.77068  3.6896 28 0.255768  0.683353  1.312527  1.701131  2.04841  2.46714  2.76326  3.6739 29 0.255684  0.683044  1.311434  1.699127  2.04523  2.46202  2.75639  3.6594 30 0.255605  0.682756  1.310415  1.697261  2.04227  2.45726  2.75000  3.6460 

∞  0.253347  0.674490  1.281552  1.644854 1.95996 2.32635  2.57583  3.2905 

8/19/2019 Morcillo - Estatisticas

http://slidepdf.com/reader/full/morcillo-estatisticas 133/133