Introducción a la Bioestadística - FFIS - Inicio · Descriptiva uni y bivariante, análisis...
Transcript of Introducción a la Bioestadística - FFIS - Inicio · Descriptiva uni y bivariante, análisis...
1
Curso teórico práctico de demostración
Introducción a la Bioestadística con el Programa de Análisis Estadísticos G-Stat 2.0
MadridFechas: 21 y 22 de Noviembre 2006
Biometría GSKTres Cantos, Madrid
2
6D1_90
Clasificación práctica de técnicas estadísticas
6D1_90
Estima
ESTIMACIÓN
Poblaciones
Decide
C.HIPÓTESIS
Conocimiento
Muestras
ProcesaResume
DESCRIPTIVA
3
63 enfermos tomaron parte en un estudio cruzado para determinar la eficacia de 2 tratamientos: A y B.Al término del estudio señalaron su preferencia por uno de ellos.
31 prefieren A
15 prefieren B
17 no muestran preferencia
Ejemplo
Resultados
Clasificación de la Estadística
4
Población
El verdadero valor de la diferencia A-B en la población
estará comprendido en el IC
[ 9.2% A-B 41.2% ]
Estimación
Diferentes tipos de técnicas estadísticas (I)
49.2 %
23.8%
26.9%
A-B = 25.4 %
Muestra
A
B
A B
Descriptiva
5
Explicación / Predicción
Si el sujeto es mujer y la gravedad es moderada la
preferencia de A sobre B es solo un 12%
Modelización
Diferentes tipos de técnicas estadísticas (y II)
Existe evidencia de que A es más preferido que B
(McNemar; p=0.0183)
ConocimientoC. Hipótesis
Q&A
6
Contenido del curso
I- Manejo de G-Stat/Datos� Características, Instalación� Menús� Importar datos� Manejo de variables
II- Descriptiva� Tipos de variables� Descriptiva uni y bivariante� Gráficos � Ajuste a la normal� Epidemiología, Diagnóstico
IV- Pruebas estadísticas� t-Student, Mann-Whitney (Wilcoxon)� ANOVA, Kruskal-Wallis� Chi Cuadrado� Fisher
V- Correlación y Regresión simple� Diagrama de dispersión� Coeficientes de la recta de regresión� Correlación de Pearson y Spearman� Análisis de los residuos� Modelos transformados
VI- Técnicas multivariantes� Regresión lineal múltiple� Regresión logística� Análisis de supervivencia
III- Estimación� Concepto de estimación� Error estandar� Intervalos de confianza
7
Módulo I : Manejo de G-Stat / Datos
G-Stat 2.0� Características� Instalación y contenido del CD-ROM� Pantalla de trabajo (BdD) y Menús
Manejo de datos� Importar datos� Fichero de ejemplo� Transformación de variables� Recodificación y filtrado de variables
8
Características
I SW Libre distribuciónI Enfocado en Bio-CienciasI Actualizable
I Menús con ordenI Multi S.O.I No programaciónI Usuarios no profesionales de la estadísticaI Desarrollado por Biometría-GSK
G-Stat 2.0
9
Instalación:1. Leer las condiciones de licencia2. Doble clic en install3. Doble clic en la opción del sistema operativo en la ventana que aparece4. Seguir instrucciones de instalación5. Observar que hay una versión PDF del manual
G-Stat 2.0
Instalación y contenido del CD
10
G-Stat 2.0
Pantalla de trabajo y Menús
Fichero integrado
11
Manejo de datos
Fichero integrado
Importar
Iconos
Variables
Casos
12
Bases de Datos EXCEL ASCII SW ESTADÍSTICO
Texto delimitado por tabulaciones
Manejo de datos
Importar datos
Abrir Manejo de datos1.txt
13
Variables del fichero Manejo de datos1.txt
EDAD: (edad en años del paciente)
SEXO: 1_Hombre, 2_Mujer
PESO: en Kg.
TALLA: en cm.
TAS: en mmHg.
TAD: en mmHg.
DIABETES: No, Tipo 1, Tipo 2
Manejo de datos
Abrir Archivo
Fichero: Manejo de datos1.txt Transformacion, recodificacion y filtro
14
Ejemplos:
DT=TAS-TADLog_peso=ln(Peso)IMC=Peso/altura^2
Manejo de datos
Transformación de variables
Transformación
Manejo de datos1.txt
15
Recodificar BdD Recodificada
Manejo de datos
Recodificación
Fichero: Manejo de datos1.txt
16
Filtrar BdD Filtrada
Manejo de datos
Filtrado
Fichero: Manejo de datos1.txt
17
Manejo de datos Cómo realizar un análisis estadístico en menos de 1’
No programación
No hay sesiones
Sí hay que guardar resultados
Sí hay que guardar datos
fin
18
Contenido del curso
I- G-Stat/Datos� Características, Instalación� Menús� Importar datos� Manejo de variables
II- Descriptiva� Tipos de variables� Descriptiva uni y bivariante� Gráficos � Ajuste a la normal� Epidemiología, Diagnóstico
IV- Pruebas estadísticas� t-Student, Mann-Whitney (Wilcoxon)� ANOVA, Kruskal-Wallis� Chi Cuadrado� Fisher
V- Correlación y Regresión simple� Diagrama de dispersión� Coeficientes de la recta de regresión� Correlación de Pearson y Spearman� Análisis de los residuos� Modelos transformados
VI- Técnicas multivariantes� Regresión lineal múltiple� Regresión logística� Análisis de supervivencia
III- Estimación� Concepto de estimación� Error estandar� Intervalos de confianza
19
� Definición y Bases de Datos
� Tipos de variables
� Descriptiva uni y bivariante, análisis estratificado
� Gráficos
� Ajuste a la normal
� Medidas de efecto en Epidemiología y Diagnóstico
� Validación de los datos
Módulo II Descriptiva
definiciones
20
Algunas definiciones básicas
� Población� Muestra� Muestra representativa o aleatoria� Caso, sujeto, unidad� Característica � Variable
factoresrespuesta explicativademográficasgestiónficticiasprincipal, secundarias
Base de datos
definición
21
índices, medidas, estadísticos
Resumir, describir, sintetizar … la muestra
Descriptiva
Objetivo de la Estadística Descriptiva
obtenidos a partir de la muestra
publicación
22
Descriptiva Ejemplo de publicacion
estudio migraña
23
Descriptiva
Estudio de Migraña
Se desea hacer un análisis descriptivo de una muestra de 259 migrañosos.
Se han recogido datos relacionados con su enfermedad
Definicion variables
24
Variables
Centro Centro1, Centro2…
Sexo: Mujer, Hombre
Edad Años
Intensidad: 1 Leve, 2 Moderada, 3 Severa
Duración: 1 (4-12h), 2 (12-24h), 3 (24-48h), 4 (>48h)
Localización: 1 Hemicraneal, 2 Holocraneal
Productividad: Pérdida de horas /año
FBG: Fibrinógeno sérico
Leucocitos: Recuento
Descriptiva
Estudio Migraña
BD
25
Descriptiva
Datos Estudio MigrañaCENT SEXO EDAD INTENSIDAD DURACION LOCALIZACION ANALGESCOPRODUCTIVDAD1 Mujer 30 Moderada 4-12 Hemicraneal Si 2.291 Mujer 35 Moderada 4-12 Hemicraneal Si 4.291 Mujer 25 Moderada 4-12 Hemicraneal Si 2.571 Mujer 28 Moderada 4-12 Holocraneal Si 2.291 Mujer 32 Moderada 4-12 Holocraneal Si 4.571 Mujer 27 Moderada 4-12 No 9.142 Mujer Severa >48 Hemicraneal Si 8.572 Mujer 38 Severa 4-12 Hemicraneal No 5.143 Mujer 42 Moderada 12-24 Hemicraneal Si 8.003 Mujer 63 Moderada 12-24 Holocraneal Si 9.573 Hombre 36 Moderada 4-12 Holocraneal Si 18.293 Mujer 40 Moderada 4-12 Holocraneal Si 12.573 Hombre 38 Moderada 12-24 Hemicraneal No 10.863 Mujer 42 Moderada 4-12 Hemicraneal Si 5.433 Hombre 48 Moderada 4-12 Hemicraneal Si 7.713 Mujer 52 Moderada Hemicraneal Si 9.143 Hombre 46 Moderada 4-12 Holocraneal Si 6.864 Mujer 36 Severa 4-12 Hemicraneal Si 15.714 Hombre Severa >48 Hemicraneal No 12.144 Hombre 49 Severa 24-48 Hemicraneal No 51.434 Mujer 43 Severa 12-24 Hemicraneal Si 100.004 Hombre 52 Moderada 4-12 Hemicraneal No 25.005 Mujer 36 Severa 24-48 Hemicraneal Si 13.715 Mujer 53 Leve 4-12 Hemicraneal Si 3.435 Mujer 50 Moderada 24-48 Holocraneal No 28.57. . . . . . . .
Los estadísticos dependen …
26
¡ Los Estadísticos Descriptivos que se emplean
dependen
del tipo de variable !
Descriptiva
Alto !
27
Ordinales
Cualitativas (a,b,c)
Cuantitativas (x,y,z)
Centro, Tratamiento
Temperatura, Edad, Col.
Dicotómicas o Binarias Sexo, Curación
¡ Las pruebas Estadísticas dependen del tipo de variable !
Descriptiva
Clasificación de Variables
Descriptiva
Análisis
Mejoría, Gravedad
28
¡ Las pruebas Estadísticas dependen del tipo de variable !
xls
29
Núm. Var.
Var. Respuesta
Var. Explicativa
Datos en la Muestra
Tipo de Técnica Técnica Menú
1 C Indep. Param. t-Student para una muestra Análisis / Cuantitativa (y) / t-Student1 C Indep. Param. Chi-2 para una desviación típica Análisis / Cuantitativa (y) / Chi-2 para una desviación típica1 C Indep. Param. Chi-2 bondad de ajuste Análisis / Cuantitativa (y) / Ajuste1 C Indep. Param. Kolmogorov Análisis / Cuantitativa (y) / Ajuste1 C Indep. Param. Kolmogorov-Lilliefors Análisis / Cuantitativa (y) / Ajuste1 C Indep. Param. Shapiro-Wilk Análisis / Cuantitativa (y) / Ajuste1 D Indep. No Par. z para una muestra Análisis / Cualitativa (a) / Una Proporción1 O Indep. No Par. Signos para una muestra Análisis / Cuantitativa (y) / Signos1 O Indep. No Par. Wilcoxon para una muestra Análisis / Cuantitativa (y) / Rangos Signados1 Cens. Indep. No Par. Kaplan-Meier Multivariante / Regresión de Cox (xz|y cens)2 C C Indep. Param. Regresión lineal simple Análisis / x|y / Regresión Lineal Simple2 C C Indep. Param. Regresión lineal simple con transformaciones Análisis / x|y / Modelos Transformados2 C C Indep. Param. Regresión polinómica Análisis / x|y / Regresión Polinómica2 C D Indep. Param. t-Student para dos muestras independientes Análisis / Dos grupos (b|y) / t-Student2 C D Indep. Param. F-Snedecor para dos desviaciones típicas Análisis / Dos grupos (b|y) / F-Snedecor2 C D Paread. Param. t-Student para dos muestras pareadas Análisis / Dos grupos (b|y) / t-Student. Pareados2 C N Indep. Param. ANOVA 1 factor Anova / Un Factor (a|y)2 C N Paread. Param. ANOVA 1 factor con bloques Anova / Un Factor con Bloques (a bloque|y)2 C N Paread. No Par. Friedman Anova / Friedman (a bloque|y)2 D C Indep. No Par. Regresión logística simple Multivariante / Regresión Logística (xz|b)2 D D Indep. No Par. ROC Análisis / Diagnóstico (b|b) / ROC (y|b)2 D D Indep. No Par. Chi-2 Análisis / Tablas (a,b) / Chi-Cuadrado2 D D Indep. No Par. z Análisis / Tablas (a,b) / Dos proporciones. Datos agrupados2 D D Indep. No Par. Fisher Análisis / Tablas (a,b) / Fisher2 D D Indep. No Par. OR, RR Análisis / Epidemiología (b|b) / Tablas2 D D Indep. No Par. Diagnóstico Análisis / Diagnóstico (b|b) / Tablas2 D D Paread. No Par. McNemar Análisis / Tablas (a,b) / McNemar2 D N Indep. No Par. Metha-Patel No disponible2 D O Indep. No Par. Chi-2 de tendencia lineal Análisis / Tablas (a,b) / Chi-Cuadrado tendencia lineal (y|b)2 N C Indep. Param. Análisis discriminante No disponible2 N D Indep. No Par. z / Chi-2 Análisis / Tablas (a,b) / Chi-Cuadrado2 O D Indep. No Par. Mann-Whitney / Wilcoxon para dos muestras independientes Análisis / Dos grupos (b|y) / Mann-Whitney (Wilcoxon)2 O D Paread. No Par. Signos para dos muestras pareadas Análisis / Dos grupos (b|y) / Signos. Pareados2 O D Paread. No Par. Wilcoxon para dos muestras pareadas Análisis / Dos grupos (b|y) / Wilcoxon. Pareados2 O N Indep. No Par. Kruskal-Wallis Anova / Kruskal-Wallis (a|y)2 O O Indep. No Par. Jonckheere-Tersptra No disponible2 Cens. C Indep. No Par. Regresión de Cox simple Multivariante / Regresión de Cox (xz|y cens)2 Cens. D Indep. No Par. Log-Rank Análisis / Dos grupos (b|y cens) / Log-Rank3 C C,D Indep. Param. ANACOVA Anova / Anacova (ax|y)3 C N,N Indep. Param. ANOVA dos factores Anova / Anova Dos Factores (ab|y)≥3 C C,D Indep. Param. Regresión lineal múltiple Multivariante / Regresión Múltiple (xz|y)≥3 D C,D Indep. No Par. Regresión logística múltiple Multivariante / Regresión Logística (xz|b)≥3 D N,D Indep. No Par. Mantel-Haenszel Análisis / Epidemiología (b|b) / Mantel-Haenszel≥3 N C,D Indep. Param. Análisis discriminante múltiple No disponible≥3 O C,D Indep. No Par. Regresión "Odds proportional" múltiple No disponible≥3 Cens. C,D Indep. No Par. Regresión de Cox múltiple Multivariante / Regresión de Cox (xz|y cens)≥3 C,C N Indep. Param. MANOVA No disponible≥4 C,C N,C Indep. Param. MANACOVA No disponible2 C,C Indep. Param. r de Pearson Análisis / x|y / Regresión Lineal Simple2 C,C Indep. No Par. Rho de Spearman Análisis / x|y / Regresión Lineal Simple
Resumen de utilización de las 50 principales técnic as estadísticas
¡ Las pruebas Estadísticas dependen del tipo de variable !
QA
30
CENT SEXO EDAD INTENSIDAD DURACION LOCALIZACION ANALGESCOPRODUCTIVDAD1 Mujer 30 Moderada 4-12 Hemicraneal Si 2.291 Mujer 35 Moderada 4-12 Hemicraneal Si 4.291 Mujer 25 Moderada 4-12 Hemicraneal Si 2.571 Mujer 28 Moderada 4-12 Holocraneal Si 2.291 Mujer 32 Moderada 4-12 Holocraneal Si 4.571 Mujer 27 Moderada 4-12 No 9.142 Mujer Severa >48 Hemicraneal Si 8.572 Mujer 38 Severa 4-12 Hemicraneal No 5.143 Mujer 42 Moderada 12-24 Hemicraneal Si 8.003 Mujer 63 Moderada 12-24 Holocraneal Si 9.573 Hombre 36 Moderada 4-12 Holocraneal Si 18.293 Mujer 40 Moderada 4-12 Holocraneal Si 12.573 Hombre 38 Moderada 12-24 Hemicraneal No 10.863 Mujer 42 Moderada 4-12 Hemicraneal Si 5.433 Hombre 48 Moderada 4-12 Hemicraneal Si 7.713 Mujer 52 Moderada Hemicraneal Si 9.143 Hombre 46 Moderada 4-12 Holocraneal Si 6.864 Mujer 36 Severa 4-12 Hemicraneal Si 15.714 Hombre Severa >48 Hemicraneal No 12.144 Hombre 49 Severa 24-48 Hemicraneal No 51.434 Mujer 43 Severa 12-24 Hemicraneal Si 100.004 Hombre 52 Moderada 4-12 Hemicraneal No 25.005 Mujer 36 Severa 24-48 Hemicraneal Si 13.715 Mujer 53 Leve 4-12 Hemicraneal Si 3.435 Mujer 50 Moderada 24-48 Holocraneal No 28.57. . . . . . . .
Estudio Migraña
¿De qué tipo son las variables del estudio?
Fichero: Migranna1.txt
Q&A
31
Descriptiva univariante variables Cualitativas (a)
Frecuencias y Barras
Frecuencias==============================================Número de Casos: 259
INTENSIDAD Frecuencias Porcentajes -------------------------------------------
Leve 22 8.49 Moderada 149 57.53 Severa 88 33.98
-------------------------------------------Total 259 100.00
SEXO Frecuencias Porcentajes --------------------------------------
Hombre 81 31.52 Mujer 176 68.48
--------------------------------------Total 257 100.00
Moda: nivel observado más frecuente
Fichero: Migranna1.txt Descriptiva / Cualitativas (a)(b) Bivariantes , cruces
32
Descriptiva bivariante
Cruces o Tablas de dos variables cualitativas (a|b)
¿Hay diferencias de Intensidad de la migraña en relación a los Sexos?
Fichero: Migranna1.txt
( SEXO | INTENSIDAD )
¡Hablar de los modelos !
Descriptiva / Tablas (a|b) / Tablas
33
Descriptiva bivariante
Cruces o Tablas de frecuencias (a|b)
¿ En qué sexo se produce una mayor frecuencia de migrañas Leves?
Tabla de Frecuencias de SEXO (filas) por INTENSIDAD (columnas)=================================================== =============================
Número de Casos: 257
INTENSIDAD | Leve | Moderada | Se vera | Total SEXO | | | | Fila
--------------------------------------------------- ----------------------| 11 | 54 | 16 | 81
Hombre | 4.28 | 21.01 | 6. 23 | 31.52 --------------------------------------------------- ----------------------
| 11 | 94 | 71 | 17 6 Mujer | 4.28 | 36.58 | 27 .63 | 68.48
--------------------------------------------------- ----------------------Total | 22 | 148 | 87 | 257 Columna | 8.56 | 57.59 | 33 .85 | 100.00
Los porcentajes de cada celda se refieren al total de la tabla
Q&A
34
Descriptiva bivariante¿En qué sexo se produce una mayor frecuencia de migrañas Leves?
Tabla de Frecuencias de SEXO (filas) por INTENSIDAD (columnas)=================================================== =============================
Número de Casos: 257
INTENSIDAD | Leve | Moderada | S evera | Total SEXO | | | | Fila
--------------------------------------------------- -----------------------| 11 | 54 | 16 | 81
Hombre | 13.58 | 66.67 | 1 9.75 | 31.52 --------------------------------------------------- -----------------------
| 11 | 94 | 71 | 17 6 Mujer | 6.25 | 53.41 | 4 0.34 | 68.48
--------------------------------------------------- -----------------------Total | 22 | 148 | 8 7 | 257 Columna | 8.56 | 57.59 | 3 3.85 | 100.00
Los porcentajes de cada celda se refieren al total d e cada fila
Fichero: Migranna1.txt Cuanti
35
Descriptiva Estudio MigrañaCuantitativa (y): descriptiva univariante
Fichero: Migranna1.txt
CENT SEXO EDAD INTENSIDAD DURACION LOCALIZACION ANALGESCOPRODUCTIVDAD1 Mujer 30 Moderada 4-12 Hemicraneal Si 2.291 Mujer 35 Moderada 4-12 Hemicraneal Si 4.291 Mujer 25 Moderada 4-12 Hemicraneal Si 2.571 Mujer 28 Moderada 4-12 Holocraneal Si 2.291 Mujer 32 Moderada 4-12 Holocraneal Si 4.571 Mujer 27 Moderada 4-12 No 9.142 Mujer Severa >48 Hemicraneal Si 8.572 Mujer 38 Severa 4-12 Hemicraneal No 5.143 Mujer 42 Moderada 12-24 Hemicraneal Si 8.003 Mujer 63 Moderada 12-24 Holocraneal Si 9.573 Hombre 36 Moderada 4-12 Holocraneal Si 18.293 Mujer 40 Moderada 4-12 Holocraneal Si 12.573 Hombre 38 Moderada 12-24 Hemicraneal No 10.863 Mujer 42 Moderada 4-12 Hemicraneal Si 5.433 Hombre 48 Moderada 4-12 Hemicraneal Si 7.713 Mujer 52 Moderada Hemicraneal Si 9.143 Hombre 46 Moderada 4-12 Holocraneal Si 6.864 Mujer 36 Severa 4-12 Hemicraneal Si 15.714 Hombre Severa >48 Hemicraneal No 12.144 Hombre 49 Severa 24-48 Hemicraneal No 51.434 Mujer 43 Severa 12-24 Hemicraneal Si 100.004 Hombre 52 Moderada 4-12 Hemicraneal No 25.005 Mujer 36 Severa 24-48 Hemicraneal Si 13.715 Mujer 53 Leve 4-12 Hemicraneal Si 3.435 Mujer 50 Moderada 24-48 Holocraneal No 28.57. . . . . . . .
36
0,0 2,9 4,9 6,4 8,6 . . . 33,40,0 2,9 5,0 6,4 8,6 . . . 34,30,0 3,1 5,0 6,6 8,6 . . . 34,30,0 3,4 5,1 6,9 8,6 . . . 34,30,0 3,4 5,1 6,9 8,6 . . . 35,70,0 3,4 5,1 6,9 8,6 . . . 35,70,3 3,4 5,1 6,9 8,6 . . . 37,10,3 3,4 5,1 6,9 8,6 . . . 37,70,4 3,6 5,1 6,9 8,7 . . . 37,91,1 3,6 5,4 7,1 9,1 . . . 40,01,4 4,0 5,4 7,1 9,1 . . . 41,11,4 4,1 5,7 7,1 9,1 . . . 41,71,7 4,3 5,7 7,1 9,1 . . . 42,92,0 4,3 5,7 7,1 9,1 . 18,57 . 42,92,1 4,3 5,7 7,1 9,3 . . . 48,62,3 4,3 5,7 7,1 9,6 . . . 48,62,3 4,3 5,7 7,1 9,7 . . . 50,02,3 4,3 6,0 7,4 10,0 . . . 51,42,3 4,6 6,0 7,7 10,3 . . . 52,02,3 4,6 6,0 7,9 10,3 . . . 54,02,3 4,6 6,0 8,0 10,3 . . . 65,72,6 4,6 6,3 8,0 10,3 . . . 65,72,6 4,6 6,3 8,0 10,3 . . . 68,62,6 4,7 6,3 8,0 10,8 . . . 89,52,6 4,7 6,3 8,6 10,8 . . . 100,0
Descriptiva Variable Productividad ordenada
N=253
37
Descriptiva Variables Cuantitativas (y)Medidas de Centralización y Posición: Cajas (Box-Plot)
Percentil 50%MedianaQ2: 10,8
Percentil 25%Cuartil inferior
Q1: 5,7
Percentil 75% Cuartil superior
Q3: 18,57
Mínimo: 0,0 Máximo: 100
Rango intercuartílico: 12,8
Amplitud
14.8n
xxmedia === ∑ i
dt
38
Descriptiva: Medidas de dispersión
La medida reina: Desviación Típica
VAR-1: 0 0 0 0 0 0 9 9 9 9 9 9 VAR-2: 0 0 3 3 3 4 5 6 6 6 9 9
1
)( 2
1 −−Σ
=− n
xxS i
n
Desviación Típica 4.7001Varianza 22.0909
Desviación Típica 2.9388Varianza 8.6364
Estadístico VAR-1 ------------------------------
N 12 Media 4.5000 Mediana 4.5000
Estadístico VAR-2 ------------------------------
N 12 Media 4.5000Mediana 4.5000
chevichevv
39
Descriptiva: Medidas de dispersión
Una aplicación de la Desviación Típica
practica
40
Descriptiva Variables CuantitativasMedidas de Centralización y Posicionamiento: Cajas
----------------------------------------Estadístico PRODUCTIVIDAD
----------------------------------------N 253 Media 14.8853 Mediana 10.8600 Moda 14.2900 Varianza 212.8639 Desviación Típica 14.5899 Mínimo 0.0000 Máximo 100.0000 Rango 100.0000 Cuartil Inferior 5.7100 Cuartil Superior 18.5700 Rango Intercuartílico 12.8600 Asimetría 2.5740 Curtosis 9.5348
----------------------------------------
Fichero: Migranna1.txt Descriptiva / Cuantitativa(y)
41
Descriptiva Variables Cuantitativas (y)
Histogramas, Discretizar una variable Cuantitativa
Fichero: Migranna1.txt normal
42
Histograma
Ventaja
N( m=-0.17, dt=2.1)Distribución Normal
Si la variable sigue una distribución Normal toda la información de la muestra queda recogida con la Media y Desviación Estándar
4,50
3,50
2,50
1,50
,50
-,50
-1,50
-2,50
-3,50
-4,50
-5,50
30
20
10
0
4,50
3,50
2,50
1,50
,50
-,50
-1,50
-2,50
-3,50
-4,50
-5,50
30
20
10
0
4,50
3,50
2,50
1,50
,50
-,50
-1,50
-2,50
-3,50
-4,50
-5,50
30
20
10
0
-> =
Comprobación del ajuste
Descriptiva
Histograma y Ajuste a la Normalidad
Para contrastar si variable sigue una distribución normal se aplicará la prueba de Kolmogorov con la correción de Lilliefords (KL) o la de Shapiro-WilK(SW)
43
Descriptiva
Gauss
C.F. Gauss (1777-1855)
44
Descriptiva
Las gausianas se dan en la naturaleza
45
Comprobar si la variable PRODUCTIVIDAD sigue una distribución normal
Descriptiva
Diagnóstico de Normalidad (I)
Análisis /Cuantitativa(y) /AjusteFichero: Migranna1.txt
D+ de Kolmogorov: 0.1726D- de Kolmogorov: -0.1538DN: 0.1726p-valor: 0.0006E-3
p-valor Lilliefors corregido: 0.0003E-16
W Shapiro-Wilk: 0.7620p-valor Shapiro-Wilk: 0.0008E-15
46
Comprobar si la variable LEUCOS sigue una distribución normal
Descriptiva
Diagnóstico de Normalidad (II)
Análisis /Cuantitativa(y) /AjusteFichero: Migranna1.txt Grupos
D+ de Kolmogorov: 0.0350D- de Kolmogorov: -0.0443DN: 0.0443p-valor: 0.8753
p-valor Lilliefors corregido: >0.1
W Shapiro-Wilk: 0.9898p-valor Shapiro-Wilk : 0.2308
47
Descriptiva bivariante
Grupos(a|y)
¿La Intensidad de la migraña influye en la Productividad?
¿Puede una variable discreta (a) explicar una continua (y)?
Grupos de Cuantitativa (a|y):
48
Descriptiva bivariante
Cuantitativa (a|y): Grupos
Descriptiva de la variable PRODUCTIVIDAD por INTENS IDAD
Descriptiva / Grupos (a|y)
Estadísticos para PRODUCTIVIDAD por INTENSIDAD--------------------------------------------------- ---
Grupos Leve Moderada Severa --------------------------------------------------- ---
N 21 147 85 Media 6.7281 12.6822 20.7107 Mediana 4.5700 10.8600 14.2900 Desviación Típica 7.1552 9.1926 20.4953 Mínimo 0.0000 0.0000 0.0000 Máximo 34.2900 50.0000 100.0000Cuartil Inferior 3.4300 6.2900 5.7100 Cuartil Superior 8.0000 17.7100 27.4300
--------------------------------------------------- ---
Fichero: Migranna1.txt
Q&A
los dos
49
Descriptiva bivariante
Los dos estadísticos descriptivos más importantes del mundo
Diferencia de proporciones p2-p1 Diferencia de medias m2-m1
Diferencia de Productividad entre Sexos
Variable Respuesta: PRODUCTIVIDADVariable Explicativa: SEXO
Grupo 1 2 ----------------------------------------------
Tamaños Muestrales 172 80 Medias: 16.5422 11.4199Desviaciones Típicas: 15.7179 11.1961E. E. de las Medias: 1.1985 1.2518
----------------------------------------------
Diferencia de Medias 5.1223
Diferencia de Eficacia entre Analgésicos
Tabla de Frecuencias de EFICACI por ANALGESIC===========================================
ANALGESICO | A | B EFICACIA | | |
---------------------------------------------| 116 | 63 |
SI | 66.2% | 77.7% | --------------------------------------------
| 59 | 18 | NO | 33.7% | 22.2% |
--------------------------------------------Total | 175 | 81 |
Diferencia de proporciones: 11.5 %
Epi y diag
50
Descriptiva
Mas allá de la descriptiva clásica (b|b)
• Epidemiología (b|b)Odds Ratio Riesgo Relativo Diferencia de Riesgos
• Diagnóstico (b|b)SensibilidadEspecificidadVP-; VP+; LR
Medidas de Efecto en:
51
Datos de un estudio prospectivo de salud dental en 76 niños.
Se estudia la relación entre la aparición de caries y una dieta pobre en vegetales y fibra
Descriptiva en Epidemiología
Estudio prospectivo de salud dental
Dieta Pobre FibraFactor (Causa)
CariesRespuesta(Efecto)
a|b
52
Datos
Estudio prospectivo
Datos experimentales
N=76
DPF | Si Exp + | No Exp - | Total Caries | | | Fila
--------------------------------------------------- --Si | 21 | 16 | 37 Res+ | 72.4% | 34.0% |
--------------------------------------------------- --No | 8 | 31 | 39 Res- | 27.5% | 65.9% |
--------------------------------------------------- --Total | 29 | 47 | 76
¿Cómo se puede medir la asociación entre DPF y Caries ?
Factor Exposición
Res
pues
ta/ E
vent
o
53
� Medidas de riesgo basadas en el cociente
� Riesgo relativo: ratio de las proporciones de eventos entre sujetos con factory sin factor de riesgo.
� Odds ratio: cociente entre los odds del grupo con el factor y sin el factor
Descriptiva
Medidas de Efecto en Epidemiología
� Medidas de riesgo basadas en la diferencia� Diferencia absoluta de riesgo: diferencia entre la proporción de
eventos en expuestos y no expuestos� Diferencia relativa de riesgo� Reducción absoluta de riesgo� Reducción relativa de riesgo
� Número necesario a tratar (NNT) : inverso de la diferencia de riesgo
54
60.21
trataranecesarioNúmero
38,0riesgo de absoluta Diferencia
08.58·16
31·21RatioOdds
12.234.0
72.0
)/(
)/( RelativoRiesgo
48.076
37aPrevalenci
=−
=
=−=
===
==++=
==+++
+=
RnFRF
RnFRF
bc
ad
dbb
caadcba
ba
Descriptiva
Medidas de Efecto en Epidemiología: Ejemplo
Evento
No evento
Total
a = 21 b = 16 a+b=37
c = 8 d = 31 c+d=39
a+c=29 b+d=47 76
Presenciafactor
Ausenciafactor
Total
55
Descriptiva
Medidas de Efecto : Resultados
Medidas de Asociación en Estudios Epidemiológicos=================================================== ======================Número de Casos : 76
Localización RR EE[LnRR] IC95.0 0% inf IC95.00% sup--------------------------------------------------- -----------------------
(+,+) en la celda 1 2.1272 0.2332 1.3469 3.3594
Asumiendo Explicativa en Columnas y Respuesta en Fi las con:
Localización OR EE[LnOR] IC95.0 0% inf IC95.00% sup--------------------------------------------------- -----------------------
(+,+) en la celda 1 5.0859 0.5171 1.8460 14.0125
Análisis /Epidemiología b|b / Tablas. Datos Agrupados / Ejemplo por defecto
56
Se estudia la fiabilidad de un nuevo diagnóstico para la candidiasis infectiva (CI)
Índices de Fiabilidad en Diagnóstico
Ejemplo
Entre los métodos paraclínicos disponibles para el diagnóstico de CI el hemocultivo tiene una baja sensibilidad (10-43%) comparado con la necropsia. Lo anterior ha motivado del desarrollo de métodos alternativos basados en la determinación de anticuerpos en suero mediante ELISA, inmunodifusión, etc.
57
Estudio de Diagnóstico
Datos experimentales
Número de Casos: 90
| Test + | Test - | Total | | | Fila
--------------------------------------------------- ----| 30 | 10 | 40
EN + | 33.33 | 11.11 | 44.44 --------------------------------------------------- ----
| 5 | 45 | 50 EN - | 5.56 | 50.00 | 55.56
--------------------------------------------------- ----Total | 35 | 55 | 90Columna | 38.89 | 61.11 | 100.0 0
Los porcentajes de cada celda se refieren al total de la tabla
Como se puede medir la relación entre los resultados Test+/- y el EN +/-
58
Permiten evaluar la fiabilidad de un dispositivo o test
Descriptiva
Índices de Fiabilidad en Diagnóstico
� Sensibilidad: porcentaje de Test + en Enfermos
� Especificidad: porcentaje de Test - en Sanos
� Valor Predictivo Positivo: porcentaje de Enfermos en Test +
� Valor Predictivo Negativo: porcentaje de Sanos en Test -
Asociados a tablas de frecuencia 2x2
b|b
59
Enfermo
Sano
Total
a = 30 b = 10 a+b=40
c = 5 d = 45 c+d=50
a+c=35 b+d=55 90
Test + Test -
Total
90.050
45
75.040
30S
==+
=
==+
=
dc
ddadEspecifici
ba
adensibilida
Descriptiva
Índices de Fiabilidad en Diagnóstico: ejemplo
811.055
45
857.035
30
==+
=
==+
=
db
dNegVP
ca
aPosVP
Q&A
60
Descriptiva
Índices de Fiabilidad en Diagnóstico
Análisis/ Diagnostico (b|b) /Tablas. Datos Agrupados/ Ejemplo por defecto
Índices Diagnósticos=================================================== =============================
Variable Estado de la Naturaleza: ENVariable Test: Test
Prevalencia = 0.4444
Sensibilidad = 0.7500 con I.C. al 95.00% [0.5880,0.8731]Especificidad = 0.9000 con I.C. al 95.00% [0.7819,0.9667]
Prob(EN+ | Test+) = 0.8571 si Prev = 0.4444 con I.C. al 95.00% [0.7412,0.9731]Prob(EN+ | Test-) = 0.1818 si Prev = 0.4444 con I.C. al 95.00% [0.0410,0.3226]
fin
61
Contenido del curso
I- Manejo de G-Stat/Datos� Características, Instalación� Menús� Importar datos� Manejo de variables
II- Descriptiva� Tipos de variables� Descriptiva uni y bivariante� Gráficos � Ajuste a la normal� Epidemiología, Diagnóstico
IV- Pruebas estadísticas básicas� t-Student, Mann-Whitney (Wilcoxon)� ANOVA, Kruskal-Wallis� Chi Cuadrado� Fisher
V- Correlación y Regresión simple� Diagrama de dispersión� Coeficientes de la recta de regresión� Correlación de Pearson y Spearman� Análisis de los residuos� Modelos transformados
VI- Técnicas multivariantes� Regresión lineal múltiple� Regresión logística� Análisis de supervivencia
III- Estimación� Concepto de estimación� Error estandar� Intervalos de confianza
62
� Concepto de Estimación de Parámetros
� Error Estandar
� Intervalos de Confianza
Módulo III
Técnicas de Estimación de parámetros poblacionales
Una ojeada al universo
ejemplos
63
Prevalencia de EPOC (%)
Duración media del efecto analgésico (media)
Tiempo mínimo hasta pico de cc. máxima (mínimo)
Porcentaje de éxitos quirúrgicos (%)
Diferencia de eficacia entre dos fármacos (dif. medias)
Mediana del incremento de IgE tras inmunoterapia (mediana)
Dispersión de la glucemia en ayunas (varianza)
Relación cloración del agua e infecciones (RR)
El 50% de datos centrales (Rango IQ)
Estimación
Ejemplos de parámetros poblacionales
altman
64
65
De letras latinas a griegasDe estadísticos a parámetros
Información de la muestra
Características de la población
Parámetros
µ σ πµ σ πµ σ πµ σ π
Estimación
Concepto de Estimación de parámetros poblacionales
Estimación
Estadísticos
x s p
muestra población
goodnews
66
Estimación
¡Buenas Noticias!
La media muestral es un buen estimador de la media poblacional
µ=)(xE
La cuasivarianza muestral es un buen estimador de la varianza poblacional
σ=−=− )(1)( 1 sEnnsE n
La prevalencia muestral es un buen estimador de la prevalencia poblacional
π=)( pE
Que significa ser un buen parámetro poblacional ?
67
Ser un estimador adecuado no significa ..., significa ...
... manejo de la incertidumbrey de la imprecisión
Estimación
Concepto de estimación de parámetros
Concepto de IC
68
Estimación
Intervalo de Confianza (IC) de un parámetro
Muestra (estadístico p) p=22%
Población (parámetro π) 19% 25%IC 95%
Imprecisión± 3%
Confianza95%
Dos propiedades de los IC
Concepto de confianza
69
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
muestra
media poblacional lím.sup. lím.inf media muestral
Estimación
Concepto de Confianza
Como se calculan los ic
70
−⋅+≤≤−⋅−=n
ppzp
n
ppzpIC
)1()1(%95 2/2/ αα π
Estimación
Intervalo de confianza para una proporción
Parámetro: Prevalencia Poblacional
Límites de confianza
Nivel de confianza
Error Estándar
[ ]322322%95 +≤≤−= πIC
[ ]%25%19%95 ≤≤= πIC
Ejemplo
n y la imprecisión
71
Estimación
El tamaño muestral condiciona la imprecisión
0
0,02
0,04
0,06
0,08
0,1
0,12
0 200 400 600 800 1000 1200 1400
Tamaño Muestral
Impr
ecis
ión
IC = 0,95 p = 10%
medias
72
+≤≤−= −
−−
−n
stx
n
stxIC n
nn
n1
11
1%95 µ
Estimación
Intervalo de confianza para la media poblacional
Parámetro: Media Poblacional
Límites de confianza
Nivel deconfianza
Estimo
Error Estándar
Ejemplo [ ]3032030320%95 +≤≤−= µIC
[ ]350290%95 ≤≤= µIC
Factor relacionadocon la confianza
Factor de confianza
73
0.200.25
0.300.38
0.400.52
0.500.67
0.600.84
0.701.03
0.801.28
0.901.64
0.951.96
0.972.24
0.982.32
0.992.58
0.9952.8
0.9993.29
Nivel de confianzaK
Estimación
Factores relacionados con el nivel de confianza
74
[ ]
[ ]81.409 51.379
69.7·96.166.39469.7·96.166.394
⇔=
+⇔−
Intervalo de confianza al 95%
Análisis / Cuantitativa (y)/ t-Student
Estimación
Intervalo de confianza: ejemplo FBG
Variable: FBG: Fibrinógeno sérico
Estadísticos para la variable FBG
----------------------------------Estadístico FBG
----------------------------------N 257 Media 394.66Desviación Típica 123.31E.E. de la Media (*) 7.6919
----------------------------------
(*) Usar con propósito de estimación para el I.C. de la media
Migranna1.txt los 2 importantes
75
DescriptivaRecordatorio: Los dos estadísticos descriptivos más importantes del mundo
Diferencia de proporciones p2-p1 Diferencia de medias m2-m1
Diferencia de Productividad entre Sexos
Variable Respuesta: PRODUCTIVIDADVariable Explicativa: SEXO
Grupo 1 2 ----------------------------------------------
Tamaños Muestrales 172 80 Medias: 16.5422 11.4199Desviaciones Típicas: 15.7179 11.1961E. E. de las Medias: 1.1985 1.2518
----------------------------------------------
E. E. de la Diferencia de Medias: 1.9545Diferencia de Medias: 5.1223
Diferencia de Eficacia entre Analgésicos
Toda “medida” debe tener su IC
Tabla de Frecuencias de EFICACI por ANALGESIC===========================================
ANALGESICO | A | B EFICACIA | | |
---------------------------------------------| 116 | 63 |
SI | 66.2% | 77.7% | --------------------------------------------
| 59 | 18 | NO | 33.7% | 22.2% |
--------------------------------------------Total | 175 | 81 |
Diferencia de proporciones: 11.5 %
76
Estimación de la Diferencia Poblacional deDos Proporciones
===============================================
Grupo Trat B Trat A-----------------------------------------------
Tamaños Muestrales: 81 175 Proporciones: 0.7770 0.6620E. E. de las proporciones: 0.0463 0.0358
-----------------------------------------------
EE de la diferencia de proporciones: 0.0585
Estimación----------I.C. al 95.00% para la diferencia : 0.1150 +/- 0.1146 [0.0004, 0.2296]
Recordatorio: Los dos estadísticos descriptivos más importantes del mundo
Intervalos de confianza
Variable Respuesta: PRODUCTIVIDADVariable Explicativa: SEXO
Grupo 1 2 ----------------------------------------------
Tamaños Muestrales 172 80 Medias: 16.5422 11.4199Desviaciones Típicas: 15.7179 11.1961E. E. de las Medias: 1.1985 1.2518
----------------------------------------------
E. E. de la Diferencia de Medias: 1.9545Diferencia de Medias: 5.1223
Estimación----------I.C. al 95.00% para la diferencia de medias: 5.1223 +/- 3.8495 [1.2728, 8.9718]
Analisis / Dos Grupos(b|y )/ t-Student
Fichero: Migranna1.txt
fin
Analisis / Tablas (a|b) / Dos Prop. Datos Agrupados