Curso Taller Bioestadistica

59
Foro Estatal de Investigación en Salud 2009 UNIVERSIDAD QUETZALCÓATL Taller de Bioestadística Ing. Norma Dena Luévanos

Transcript of Curso Taller Bioestadistica

Diapositiva 1

Foro Estatal de Investigacin en Salud 2009

UNIVERSIDAD QUETZALCATL

Taller de Bioestadstica

Ing. Norma Dena Luvanos

QU ES LA ESTADSTICA? Mentiras

Aprender a interpretar y utilizar correctamente

En mi rea no es necesaria

Las Ciencias de la Salud no son deterministas

El medicamento se administra a razn de 5 mg: Cada cundo?

Lo nico seguro es la incertidumbre

La diabetes mata: A todo el mundo? Influye el medio ambiente? Es hereditaria? Influye la raza, el gnero, la edad?PARA QU SIRVE LA ESTADSTICALa ciencia se ocupa de fenmenos observables.

La ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes.

Los modelos que crea la ciencia son de tipo determinista o aleatorio.

La estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de la naturaleza.

La Bioestadstica ensea y ayuda a investigar en todas las reas de las ciencias de la vida, donde la variabilidad no es la excepcin sino la regla. Da credibilidad a la informacin que se genera y descarta que la informacin sea producida por el azar.

APLICACIONESDiseo de Programas de SaludMortalidad: Causas, grupos de edadRecursos: Humanos, materiales y financieros

Lneas de InvestigacinTabaquismoVirus del Papiloma HumanoObesidadDiabetes

Investigaciones EspecficasEnsayos ClnicosFactores Asociados

DEFINICINMediante mtodos sistematizados recopila, organiza y presenta datos referentes a un fenmeno que presenta variabilidad o incertidumbre, con la finalidad de

Deducir (analizar e interpretar) las leyes que rigen a dichos fenmenos

Y poder as hacer previsiones sobre los mismos, obtener conclusiones y tomar decisiones.

DescriptivaProbabilidadInferencial

Estadstica es la ciencia que:

PASOS DE UN ESTUDIO ESTADSTICOPlantear hiptesis sobre una poblacin. Enunciados o afirmaciones que se quieren probar acerca de un conjunto de entidades (individuos, animales, plantas, clulas, mquinas)

Decidir qu datos recoger (diseo del estudio)Muestra(s). Qu individuos participarn en el estudio?. Cohorte (qu pasar?), casos y controles (qu pas?), transversal (qu est pasando?), experimental (manipulacin y medicin del efecto).Variable(s): Qu caracterstica o atributo sobre los individuos se va a estudiar? Procedimientos de medicin. Definicin operacional (cmo se van a medir las variables)

Recoger los datos Tipo de captacin. Censo, muestreo (simple, estratificado, sistemtico)Mtodo de captacin. Indirecta (anuarios, censos de poblacin y vivienda) y directa (observacin, cuestionario, entrevista).

Describir los datos obtenidos. Tablas, grficas y software

Realizar una inferencia sobre la poblacin. Anlisis e interpretacin de los resultados

Cuantificar la confianza de la inferencia. Niveles de confianza, significacin del contraste (valor p)

POBLACIN Conjunto de entidades sobre el cual se est interesado en obtener conclusiones (hacer inferencias).

Total de elementos en un grupo definido y delimitado.

Requiere de una definicin conceptual y una delimitacin temporal.

Generalmente es demasiado grande para poder abarcarla.

MUESTRASubconjunto de la poblacin al que se tiene acceso y sobre el que realmente se hacen las observaciones (mediciones).

Se conforma con miembros seleccionados de la poblacin.

Debera ser representativa.

NOTA

Inferencia. Extrapolacin que se hace de los resultados de una muestra a la totalidad de elementos de la poblacin de donde se obtuvo dicha muestra. Decir algo de la poblacin a partir de la muestra.VARIABLEEs una caracterstica o atributo observable (cualidad o cantidad) que vara entre los diferentes individuos de una poblacin. Informacin disponible acerca de cada individuo o entidad.

Cualitativa. Sus valores no se asocian con nmeros (no se hacen operaciones algebraicas).

Cuantitativa. Sus valores son numricos (se hacen operaciones algebraicas).

MEDICINAsignacin de nmeros a objetos o eventos de acuerdo con un conjunto de reglas.

VARIABLES Y ESCALAS DE MEDICINCualitativaCuantitativaNominal(sin orden)Ordinal(con orden)Dicotmica: Gnero (hombre-mujer)Politmica: Grupo sanguneo (O, A, B, AB)Severidad de un padecimiento:Ligero, moderado, severo, graveDiscreta(valores enteros)Continua(valores intermedios posibles)Nmero de hijos: 0, 1, 2, 3,., >Nmero de pacientes: 0, 1, 2, 3,., >Nmero de cigarros: 0, 1, 2, 3,., >Peso (kg)Estatura (cm)Dosis de medicamento (mg)Edad (aos, meses)Numrica

EJERCICIODeterminar el tipo de variable, la escala de medicin y naturaleza, correspondiente a cada variable enumerada a continuacin:VariableTipoEscalaNaturaleza1. Edad 2. Peso corporal 3. Gnero 4. Nivel escolar 5. Temperatura en C 6. Diagnstico mdico 7. Raza 8. Estado civil 9. Dolor 10. Presin intraocular 11. Nmero de hijos 12. Nmero de pacientes CualitativaCuantitativaNominalOrdinalNumrica *) Continua**) DiscretaRESPUESTASVariableTipoEscalaNaturaleza1. Edad (b, iii, *)2. Peso corporal (b, iii, *)3. Gnero (a, i)4. Nivel escolar (a, ii) 5. Temperatura en F (b, iii, *) 6. Diagnstico mdico (a, i)7. Raza (a, i)8. Estado civil (a, i) 9. Dolor (a, ii)10. Presin intraocular (b, iii, *)11. Nmero de hijos (b, iii, **)12. Nmero de pacientes (b, iii, **) CualitativaCuantitativaNominalOrdinalNumrica *) Continua**) DiscretaVARIABLESSin olvidar el tipo y naturaleza de las variables, es recomendable:

Codificar. Manejo de las variables mediante la asignacin de un nmero.

Etiquetar. Asignacin de etiquetas a los valores de las variables.

Codificacin de respuestas especiales. Datos perdidos (missing data). 0=No sabe; 99=No contestaEJEMPLOS1) Gnero (Cualitativa, nominal)a) Codificacin: 1=Hombre2=Mujerb) Etiqueta: Sexo del encuestado

2) Estado civil (Cualitativa, nominal)a) Codificacin: 5= Soltero10= Casado15= Divorciado20= Viudob) Etiqueta: Estado civil del encuestado

EJERCICIO3) Felicidad ( ) a) Codificacin:

b) Etiqueta:

4) Nmero de hijos ( )a) Codificacin:

b) Etiqueta:

RESPUESTAS3) Felicidad (Cualitativa, ordinal) a) Codificacin: 0= No sabe1=Muy feliz2=Bastante feliz3=No demasiado feliz99=No contestb) Etiqueta: Nivel de felicidad

2) Hijos (Cuantitativa, numrica, discreta) a) Codificacin: 0, 1, 2, 3, 4, 5, 6, 7, 8 ms b) Etiqueta: Nmero de hijos

CATEGORAS DE UNA VARIABLESon los posibles valores que puede tomar una variable.

Pueden agruparse en clases o intervalos de clase.Edad: 20 aosPacientes: 10 pacientes Deben ser mutuamente excluyentes y totalmente exhaustivas.Edad: 18 aosOcio: Le gusta el deporte: Si, No

PRESENTACIN DE DATOSListado ordenado de datos, generalmente de menor a mayor.

Tablas o Distribuciones y Grficas de Frecuencias. Formas equivalentes de presentar la informacin (variable) recopilada de una muestra. TABLAS Y GRFICASGnero

Frecuencia

Hombre4Mujer6Total36

TABLAS O DISTRIBUCIONES DE FRECUENCIADistribucin de Frecuencias: Es un mtodo descriptivo numrico que proporciona informacin sobre todos los posibles valores que una variable puede tomar y las veces que esos valores ocurren dentro de una categora o clase de observaciones.

DISTRIBUCIN DE FRECUENCIASFrecuencia absoluta. Nmero de observaciones dentro de cada categora, clase o intervalo.

Frecuencia relativa. Nmero de observaciones dentro de cada categora, clase o intervalo dividido entre el total de frecuencias.

Frecuencia acumulada. Nmero de observaciones que en una serie ordenada de menor a mayor son iguales o menores que un valor en particular. Variables ordinales y numricas.

Gnero FrecuenciafPorcentaje Porcentaje VlidoVlidos Hombre Mujer Total243562805243/805= 30.2562/805= 69.8 100.0 30.2 69.8100.0Nivel de felicidad FrecuenciafPorcentaje Porcentaje VlidoPorcentaje acumuladoVlidos Muy feliz Bastante feliz No demasiado feliz TotalPerdidos No contestaTotal232441 87760 8768232/768= 30.2441/768= 57.4 87/768= 11.3760/768= 99.0 8/768 = 1.0 100.0232/760= 30.5441/760= 58.087/760= 11.5 760/760= 100.030.588.5100.0Nmero de hijos FrecuenciafPorcentaje Porcentaje VlidoPorcentaje acumuladoVlidos 0 1 2 3 4 5 6 7 8 ms TotalPerdidos No contestaTotal210135198102 67 29 12 13 11777 578226.817.325.313.0 8.6 3.7 1.5 1.7 1.4 99.4 0.6100.0 27.017.425.513.1 8.6 3.7 1.6 1.7 1.4100.0 27.044.469.983.091.695.396.998.6100.0EJEMPLONmero de hijosFrecuenciaPorcentaje vlidoPorcentaje acumulado012345678 msTotal210135198102 67 29 12 13 1177727.017.425.513.1 8.6 3.7 1.6 1.7 1.4100.027.044.469.9 83.091.695.396.998.6100.0 Cuntos encuestados tienen menos de 2 hijos? R: f(0 hijos) + f(1 hijo)= 210 +135 = 345 encuestados

Qu porcentaje de encuestados tienen 6 hijos o menos? R: fa= el 96.9% de los encuestados> 50%Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? R: X= 2 hijos

Qu porcentaje de encuestados tienen exactamente 4 hijos? R: fr= el 8.6% de los encuestados

EJERCICIONmero de horas de sueo de 45 pacientes de un hospital como consecuencia de la administracin de cierto anestsico:Horas de sueoFrecuenciaPorcentaje vlidoPorcentaje acumulado0-23-56-89-1112-1415-17Total 51613 5 4 24511.135.628.911.1 8.9 4.4100.011.146.775.686.795.6100Qu porcentaje de pacientes presenta entre 9 y 11 horas de sueo?

Cuntos pacientes presentan menos de 6 horas de sueo?

Qu porcentaje de los pacientes presentan ms de 11 horas de sueo?

Qu cantidad de horas de sueo es tal que al menos el 40% de la poblacin tiene una cantidad inferior o igual?

RESPUESTASHoras de sueoFrecuenciaPorcentaje vlidoPorcentaje acumulado0-23-56-89-1112-1415-17Total 51613 5 4 24511.135.628.911.1 8.9 4.4100.011.146.775.686.795.6100Qu porcentaje de pacientes presenta entre 9 y 11 horas de sueo?R: fr= el 11.1% de los pacientes

Cuntos pacientes presentan menos de 6 horas de sueo? R: f(0-2)+f(3-5)=5+16=21 pacientes

Qu porcentaje de los pacientes presentan menos de 15 horas de sueo? R: fa=95.6% de los pacientes

Qu cantidad de horas de sueo es tal que al menos el 40% de la poblacin tiene una cantidad inferior o igual? R: X=3-5 horas de sueo> 40%GRFICAS PARA VARIABLES CUALITATIVAS

Diagrama de Barras

Tambin se usa en variables discretas

Altura proporcional a las frecuencias (relativa o absoluta)Diagrama de Sectores (circulares)

No se usa para variables ordinales

El rea de cada sector es proporcional a la frecuencia (relativa o absoluta)GRFICAS PARA VARIABLES CUANTITATIVAS

Diagrama de Barras

Variables discretas

Frecuencias absolutas o relativas Histograma

Variables continuas

Frecuencias absolutas o relativas PARMETROS Y ESTADSTICOSParmetro. Cantidad numrica calculada sobre una poblacin (informacin obtenida directamente de la poblacin).Ejemplos: , , , ,

Estadstico. Cantidad numrica calculada sobre una muestra (informacin obtenida directamente de la muestra).Por ejemplo: x, s, p, n

Si el estadstico se usa para aproximar un parmetro se le denomina estimador.ESTADSTICOS

ESTADSTICOS

Posicin. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos (cuantiles, percentiles, cuartiles, deciles).

Centralizacin. Indican valores con respecto a los que las observaciones (datos) parecen agruparse (media aritmtica, mediana, moda).

Dispersin. Representan la menor o mayor concentracin de observaciones (datos) con respecto a las medidas de centralizacin (rango, varianza, desviacin tpica o estndar, coeficiente de variacin).

Forma. Depende de la distribucin de las observaciones (datos): asimetra y apuntamiento o curtosis.

ESTADSTICOS DE POSICINCuantil. Valor de la variable por debajo del cual se encuentra una frecuencia acumulada. Casos particulares: Percentil, cuartil, decil, quintil.

ESTADSTICOS DE POSICINPercentil de orden k=cuantil de orden k/100

La mediana es el percentil 50El percentil de orden 15 deja por debajo al 15% de las observaciones (datos); por encima queda el 85%.

Cuartil. Divide a la muestra en 4 grupos con frecuencias similares:

Primer cuartil=Percentil 25=Cuantil 0.25Segundo cuartil=Percentil 50=Cuantil 0.50=MedianaTercer cuartil=Percentil 75=Cuantil 0.75

ESTADSTICOS DE POSICINEjemplos:

El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado bajo?Percentil 5 o cuantil 0.05

Qu peso es superado slo por el 25% de los individuos?Percentil 75

El colesterol se distribuye simtricamente en la poblacin. Se consideran patolgicos los valores extremos. El 90% de los individuos son normales. Entre qu valores se encuentran los individuos normales?Entre el percentil 5 y el percentil 95

Entre qu valores se encuentra la mitad de los individuos ms normales de una poblacin?Entre el cuartil 1 y 3ESTADSTICOS DE POSICIN

EstadsticosPercentiles 25 50 7560.0070.0080.00peso608070Qu peso no llega a alcanzar el 25% de los individuos?Primer cuartil=percentil 25=60 Kg

Qu peso es superado por el 25% de los individuos?Tercer cuartil=percentil 75= 80Kg

Entre qu valores se encuentra el 50% de los individuos con un peso ms normal?Entre el primer y tercer cuartil= entre 60 y 80 Kg

Diagrama de caja. Sintetiza toda esta informacin

mediana5090ESTADSTICOS DE CENTRALIZACINSon medidas que buscan posiciones (valores) con respecto a los que los datos presentan una tendencia de agrupacin:

Media aritmtica. Promedio de los valores de una variable. Suma de los valores dividida por el tamao de la muestra.Es conveniente cuando los datos se concentran simtricamente con respecto a ese valor. Muy sensible a valores extremos.Centro de gravedad de los datos.

Mediana. Valor que divide a las observaciones en dos grupos con el mismo nmero de datos (percentil 50). Si el nmero de datos es par, la mediana es la media de los dos valores centrales.Es conveniente cuando los datos son asimtricos. No es sensible a valores extremos.

Moda. Es el/los valor/es donde la distribucin de frecuencias alcanza un mximo.

FRMULASDatos sin Ordenar

Media:

Datos Ordenados

Media:

Mediana:

Moda:

EJEMPLO: DATOS SIN ORDENARNo. de PacienteNo. De Caries123456789101112131415Total35100386450131078890Media:

cariesNo. de PacienteNo. De Caries410158297136141531211Total00334556788810101390Mediana= 6 cariesNo. de PacienteNo. De Caries41015829713614153121116Total0033455678881010131390

Mediana= 6.5 cariesModa= 8 cariesEJEMPLO: DATOS ORDENADOSPeso (Kg)fMCfa40-5050-6060-7070-8080-9090-100100-11051021115334555657585951055153647525558Total58

Media = 68.8 Kg

Mediana = 66.7 KgModa = 65.2 Kg

EJERCICIOEn un estudio de sobrepeso, realizado por un grupo de nutriologos, entre el personal de una empresa, se obtuvieron los siguientes I.M.C. de una muestra de la poblacin :

Calculen:MediaMediana ModaRESPUESTASMedia = 27.17Mediana = 27.30Moda = 25.60 y 27.80

Por la media, SE DIRA QUE LA MUESTRA EST CON SOBREPESO.

Por la mediana, SE DIRA QUE LA MUESTRA EST CON SOBREPESO.

Por la moda, SE DIRA QUE LA MUESTRA SE ENCUENTRA CON SOBREPESO.

OTRO.Se realiza una investigacin sobre desarrollo de habilidades psicomotoras a un grupo de nios de entre 1 y 5 aos de edad.

A este grupo se le aplic una prueba, donde la mxima puntuacin es de 100 puntos y corresponde al grado mximo de desarrollo, y la puntuacin mnima es de cero puntos e indica que no hay desarrollo.

Los resultados se muestran en la siguiente tabla :

CALCULAR:MediaMedianaModa

A qu conclusiones se podra llegar?

RESPUESTASMedia = 69.34Mediana = 70Moda = 69

Se puede concluir que: Como la media, la mediana y la moda son similares, la mayora de los nios tienen una calificacin que ronda los 70 puntos..ESTADSTICOS DE VARIABILIDAD O DISPERSINMiden el grado de variabilidad (dispersin) de los datos, independientemente de su causa.

Informan acerca de la homogeneidad o heterogeneidad de un conjunto de datos, es decir, si ste consta de valores muy similares o muy diferentes.

ESTADSTICOS DE VARIABILIDAD O DISPERSINRango o Amplitud. Diferencia entre las observaciones extremas (valor mayor menos valor menor).

Es muy sensible a valores extremosR = Xn X1Xn = Valor mximoX1 = Valor mnimo

Rango intercuartlico. Distancia entre el primer y tercer cuartil.

No es tan sensible a valores extremos porque se eliminan las observaciones ms extremas inferiores y superiores.RI=P75 P25

ESTADSTICOS DE VARIABILIDAD O DISPERSINVarianza (S2). Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.

Es sensible a valores extremosSus unidades son el cuadrado de las de la variable (Kg2)

ESTADSTICOS DE VARIABILIDAD O DISPERSINDesviacin Estndar o Tpica. Es la raz cuadrada de la varianza.

Tiene las mismas unidades dimensionales que la variable (Kg).La distribucin normal o gaussiana se determina por la media aritmtica y la desviacin estndar.A una distancia de una desviacin estndar de la media se tiene el 68% de observaciones; a dos desviaciones estndar de la media, el 95% de las observaciones; a tres deviaciones, el 99% de las observaciones.

ESTADSTICOS DE VARIABILIDAD O DISPERSINCoeficiente de Variacin. Es la razn entre la desviacin estndar o tpica y la media aritmtica.

Es adimensional, se expresa por lo general, en porcentaje.Permite comparar la variabilidad de variables iguales en grupos distintos o variables diferentes dentro o entre grupos (peso con un CV=30% y altura con un CV=20%, indica que los individuos presentan mayor variabilidad en peso que en altura).

ASIMETRA O SESGOUna distribucin es simtrica, si la mitad izquierda es idntica a la mitad derecha.

En una distribucin simtrica, la media, la mediana y la moda (si slo hay una) coinciden y se ubican en el centro de la distribucin.

La asimetra es positiva o negativa en funcin de a qu lado se encuentra la cola de la distribucin.

La media tiende a desplazarse hacia los valores extremos (colas).

Las diferencias entre las medidas de centralizacin (media, mediana y moda) son seal de asimetra.

50%50%Media=mediana=moda

50%50%50%50%50%Asimetra positiva (+)Asimetra negativa (-)Media=mediana=modaModa=mediana=mediaESTADSTICOS PARA DETECTAR ASIMETRAExisten diferentes estadsticos que permiten detectar asimetra:

Tendencia central (diferencia)

Diferencia entre el 1 y 2 cuartiles y entre el 2 y 3

Desviaciones con signo respecto a la media

Coeficiente de Asimetra de Pearson:

En funcin del signo del estadstico se determina si sta es (+) (-)

Una distribucin simtrica tiene asimetra nula

La asimetra es adimensional

APUNTAMIENTO O CURTOSISEl apuntamiento o curtosis mide el grado de apuntamiento (achatamiento) de una distribucin con respecto a la distribucin normal. Es adimensional. Leptocrtica (curtosis>0). Si la distribucin presenta colas elevadas (grficamente se suele ver como una zona central muy apuntada) le corresponde una curtosis de valor positivo.

Mesocrtica (curtosis=0). Los valores de curtosis compatibles con la normalidad son los cercanos a cero.

Platicrtica (curtosis