R aplicado a Epidemiologia Suzi Alves Camey Luciana Neves Nunes Departamento Estatística - UFRGS.
Transcript of R aplicado a Epidemiologia Suzi Alves Camey Luciana Neves Nunes Departamento Estatística - UFRGS.
R aplicado a Epidemiologia
Suzi Alves CameyLuciana Neves Nunes
Departamento Estatística - UFRGS
R aplicado a Epidemiologia
R
• Página do R:– http://www.r-project.org/
• Página com excelente tutorial do R:– http://leg.ufpr.br/~paulojus/
• Página com material do curso:– http://euler.mat.ufrgs.br/~camey/
R aplicado a Epidemiologia
R: Links para download
> CRAN > http://cran.br.r-project.org/
> Windows> base
> R-2.7.2-win32.exe
Para instalação execute o arquivo
R aplicado a Epidemiologia
Pacotes Epidemiológicos
• Epi• epibasix• epicalc• epiR• epitools
• rmeta (Meta-analysis)• survey (Complex survey analysis)
R aplicado a Epidemiologia
Instalar e carregar pacotes
• Instalar:> Pacotes
> Instalar pacote(s)> Brazil(PR)
> OK> <escolher pacote>
> OK
R aplicado a Epidemiologia
Instalar e carregar pacotes
• Carregar:
> Pacotes
> Carregar pacote
> <escolher pacote>
> OK
R aplicado a Epidemiologia
Epi• Título: A package for statistical analysis in epidemiology.
• Autores:– Bendix Carstensen, Martyn Plummer, Esa Laara, Michael Hills et. al.
• Conteúdo:– Funções para análise demográficas e epidemiológicas no Diagrama de
Lexis, isto é, registro e acompanhamento de dados de coorte, incluindo intervalos com dados censurados e representação de multiestados de dados. Também apresenta algumas funções úteis para tabulação e gráficos. Contém alguns bancos de dados epidemiológicos.
• Endereço: http://www.pubhealth.ku.dk/~bxc/Epi/
R aplicado a Epidemiologia
Epi
• ROC:
data(births)
help(births)
attach(births)
ROC(gestwks,(1-lowbw),plot="ROC“,MI=FALSE)
R aplicado a Epidemiologia
epibasix• Título: Elementary Epidemiological Functions for a Graduate
Epidemiology Course
• Autor: Michael A Rotondi <[email protected]>
• Conteúdo: Esse pacote contém ferramentas elementares para análise de problemas epidemiológicos comuns, tais como cálculo de tamanho de amostra, análise de tabelas 2x2 e medidas de concordância (kappa, sensibilidade/especificidade). Saídas e resumos apropriados são produzidos de maneira a facilitar a interpretação sempre que possível. Esse pacote está em desenvolvimento, portanto comentários e sugestões são bem vindos. O código é comentado para facilitar modificações.
R aplicado a Epidemiologia
epibasix
• Tamanho da amostra para ensaio clínico randomizado:– Suponha que uma nova droga promete
reduzir o risco da doença de 0.10 para 0.03.
n4props(0.03, 0.10, AR=1, alpha=0.05, power=0.80)
R aplicado a Epidemiologia
epicalc• Título: Epidemiological calculator
• Autor: Virasakdi Chongsuvivatwong [email protected]
• Conteúdo: Funções para fazer o R fácil para cálculos epidemiológicos.
• Endereço: http://CRAN.R-project.org/
• Dica: Curso On Line - Próxima turma Jan/09
R aplicado a Epidemiologia
epicalc
• Medidas de efeito
table1 <- make2x2(25,70,22,7)
cc(outcome=NULL, exposure=NULL, cctable=table1)
cs(outcome=NULL, exposure=NULL, cctable=table1)
table1 <- make2x2(70,7,22,25)
cc(outcome=NULL, exposure=NULL, cctable=table1)
cs(outcome=NULL, exposure=NULL, cctable=table1)
R aplicado a Epidemiologia
epiR
• Título: Functions for analysing epidemiological data• Autores:
– Mark Stevenson <[email protected]> with contributions from Telmo Nunes, Javier Sanchez, and Ron Thornton.
• Conteúdo: Um pacote para analisar dados epidemiológicos. Contém funções para ajustar, direta ou indiretamente, medidas de freqüências das doenças.
• Endereço: http://epicentre.massey.ac.nz
R aplicado a Epidemiologia
epiR
• Estimação de prevalência:Uma amostra aleatória simples de 150 mulheres é selecionada de uma população de 2560.Cada mulher é avaliada por um instrumento rastreador de depressão. – Sensibilidade = 96%– Especificidade = 89%– Casos positivos = 23
epi.prev(23, 150, 2560, se = 0.96, sp = 0.89, conf.level = 0.05)
R aplicado a Epidemiologia
epitools
• Título: Epidemiology Tools
• Autor: Tomas Aragon <[email protected]>
• Conteúdo: Pacote R para dados e gráficos epidemiológicos.
• Endereço: http://www.epitools.net
R aplicado a Epidemiologia
epitools
• Risco relativo pessoa/ano– Exemplo: Rothman 1998, p. 238
bc <- c(Unexposed = 15, Exposed = 41)
pyears <- c(Unexposed = 19017, Exposed = 28010)
rateratio.wald(bc,pyears)
R aplicado a Epidemiologia
Rcmdr
• Instalação como os demais pacotes
• Carregar:– Na primeira vez vai solicitar a instalação de
pacotes auxiliares
R aplicado a Epidemiologia
Rcmdr: banco de dados
R aplicado a Epidemiologia
Rcmdr: banco de dados - texto
R aplicado a Epidemiologia
Rcmdr: banco de dados - SPSS
R aplicado a Epidemiologia
Rcmdr: banco de dados - Excel
R aplicado a Epidemiologia
Rcmdr: banco de dados - Excel
R aplicado a Epidemiologia
Rcmdr: Descritivas
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
O R representa os números com notação científica.
7.764e-09 = 0.000000007764
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
O Rcmdr só permite análises compatíveis com o tipo de variável
que há no banco de dados
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
•A função summary não exibe a estimativa do O.R.
•Usar função logistic.display do pacote epicalc para obter O.R.
R aplicado a Epidemiologia
Rcmdr: Regressão logística
• Para usar a função o pacote deve estar carregado
• Digitar o comando e clicar em submeter
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
• Comando para regressão logística condicional (caso-controle pareado).
• Precisa do pacote survival
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Precisamos dos pacotes carregados nessa ordem:– epicalc– Rcmdr– lmtest– sandwich
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
Clicar 2x em “poisson” para mudar a função link
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• O erro padrão da estimativa apresentada nessa saída não é robusta para resposta binária.
• Nesse caso devemos usar um estimador robusto.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Antes de estimar o erro padrão robusto temos que tratar os valores faltantes adequadamente.
• Caso contrário não conseguimos fazer a estimativa robusta.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Comandos para comparar modelos e estimar o erro padrão robusto.
O erro padrão cai de 0.2474 para 0.22185.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
Comando para calcular a exponencial do parâmetro e o
respectivo IC.
Estimativa e IC95%
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste tPrimeiro testar se as variâncias são
iguais!
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
p>0,05 variâncias iguais
p0,05 variâncias diferentes
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: Anova
Primeiro categorizar variável women em três grupos com
igual amplitude.
R aplicado a Epidemiologia
Rcmdr: Anova
R aplicado a Epidemiologia
Rcmdr: Anova
Para escolher mais do que um fator
pressionar Ctrl
R aplicado a Epidemiologia
Rcmdr: Anova
• Essa tabela de Anova não é a que usamos tradicionalmente.
• Teremos que construir a tabela tradicional.
R aplicado a Epidemiologia
Rcmdr: Anova
R aplicado a Epidemiologia
Rcmdr: Anova
Este é o comando
Tabela Anova
R aplicado a Epidemiologia
Rcmdr: Anova
• Comando para teste de Tukey para comparações múltiplas.
• Novo modelo deve ser construído para as comparações múltiplas do fator principal a ser testado.
R aplicado a Epidemiologia
Rcmdr: Anova
Médias e IC para a interação dos dois
fatores.
• Comando para calcular médias e IC para a interação dos dois fatores.
• É necessário o pacote effects
R aplicado a Epidemiologia
Rcmdr: Anova
• Comando para gráficos das médias e IC para a interação dos dois fatores.
R aplicado a Epidemiologia
Rcmdr: AnovaPlot of Means
Prestige$type
me
an
of P
rest
ige
$in
com
e
20
00
40
00
60
00
80
00
10
00
01
20
00
14
00
0
bc prof wc
Prestige$women_cat
(-0.0975,32.5](32.5,65](65,97.6]
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
20 40 60 80
05
000
100
001
5000
200
002
5000
prestige
inc
om
e
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
2000 6000 10000 14000
-500
050
0015
000
Fitted values
Res
idua
ls
Residuals vs Fitted
GENERAL.MANAGERS
PHY SICIANS
OSTEOPATHS.CHIROPRACTORS
-2 -1 0 1 2
-20
24
6
Theoretical Quantiles
Sta
ndar
dize
d re
sidu
als
Normal Q-Q
GENERAL.MANAGERS
PHY SICIANS
OSTEOPATHS.CHIROPRACTORS
2000 6000 10000 14000
0.0
0.5
1.0
1.5
2.0
Fitted values
Sta
ndar
dize
d re
sidu
als
Scale-LocationGENERAL.MANAGERS
PHY SICIANS
OSTEOPATHS.CHIROPRACTORS
0.00 0.02 0.04 0.06
-20
24
6
Leverage
Sta
ndar
dize
d re
sidu
als
Cook's distance
0.5
1
Residuals vs Leverage
PHY SICIANS
GENERAL.MANAGERS
LAWYERS
lm(income ~ prestige)
R aplicado a Epidemiologia
Rcmdr: Salvar – resultados
R aplicado a Epidemiologia
Rcmdr: Salvar – dados
R aplicado a Epidemiologia
Rcmdr: Salvar – sintaxe
R aplicado a Epidemiologia
Rcmdr: Exportar dados
R aplicado a Epidemiologia
Rcmdr: Exportar dados
BOM CONGRESSO!