Presentación del curso de Bioestadística

50
Bioestadística Lupita Valdez Zazueta

Transcript of Presentación del curso de Bioestadística

Page 1: Presentación del curso de Bioestadística

BioestadísticaLupita Valdez Zazueta

Page 2: Presentación del curso de Bioestadística

Temas de discusión

Estadística descriptivaProbabilidadEstimaciónPrueba de hipótesisDiseño de ExperimentosEstadística en la computadora

Page 3: Presentación del curso de Bioestadística

Estadística

Proporciona un conjunto de principios y metodologías para:

• colecta de datos

• su presentación y resumen,

• su interpretación

• Extraer conclusiones y generalidades

Page 4: Presentación del curso de Bioestadística

Su aplicación en medicina• Estadística vitalesPara facilitar su uso se requiere una comprensión

básica de la forma en que se determinan, que significan y como se emplean

• EpidemiologíaLos datos epidemiológicos muestran la prevalencia de

una enfermedad, la forma en que varía de acuerdo a la estación de año, la ubicación geográfica y como le afectan ciertos factores de riesgo

Page 5: Presentación del curso de Bioestadística

¿Qué tan sensible es una prueba de diagnóstico para la identificación de la presencia de la enfermedad y con cuanta frecuencia arroja resultados erróneos?

Procedimientos de diagnóstico

Page 6: Presentación del curso de Bioestadística

Valoración de protocolos de investigación

Ningún estudio proporciona información válida a menos que se diseñe y analice en forma científica.

Page 7: Presentación del curso de Bioestadística

Participación o dirección en proyectos de investigación

Es indispensable el conocimiento de la estadística y sus métodos de estudio, con él, podremos ser participantes activos en todos los aspectos de la investigación.

Page 8: Presentación del curso de Bioestadística

Algunas ramas de la estadística

• El diseño de experimentos guía al investigador a planear la manera y cuantos datos colectar.

• La estadística descriptiva resume y describe las características importantes de los datos.

• La inferencia estadística evalúa la información presente en los datos e indica el nuevo conocimiento ganado con esta información.

Page 9: Presentación del curso de Bioestadística

Objetivos principales de la estadística

• Hacer inferencias sobre una población a partir del análisis de la información de una muestra.

• Esto incluye medir el porcentaje de incertidumbre involucrado en estas inferencias.

• Diseñar el proceso de muestreo y el tamaño de la muestra de manera que las inferencias sean válidas.

Page 10: Presentación del curso de Bioestadística

• Los datos de un experimento proporcionan un nuevo conocimiento, y este en ocasiones sugiere una revisión de la teoría existente el cual requerirá mas investigación a través de mas experimento y análisis de datos.

Page 11: Presentación del curso de Bioestadística

Teoría de probabilidades

Estudia los métodos de análisis que son comunes en el tratamiento de fenómenos aleatorios, cualquiera que sea el área donde se presenten

Page 12: Presentación del curso de Bioestadística

Dos conceptos básicos: Población y muestra

Una población (estadística) es el conjunto de medidas (o registros) correspondientes a la colección completa de unidades de la cual se quiere inferir.

Una muestra de una población estadística es el conjunto de medidas que se colectan en el curso de una investigación

Page 13: Presentación del curso de Bioestadística

Estadística Descriptiva

Proporciona un conjunto de herramientas tales como tablas, gráficas, promedios, y otras para organizar y resumir la información de la muestra.

• Métodos Gráficos y Tabulares• Métodos Numéricos

Page 14: Presentación del curso de Bioestadística

Conceptos básicos

• Datos.Los datos estadísticos son valores de una

característica de interés medida en un conjunto de objetos o individuos.

Son la materia prima de las investigaciones.

Page 15: Presentación del curso de Bioestadística

Tipos de datos

• Cualitativos (categóricos)NominalesOrdinales

• Cuantitativos (numéricos)ContinuosDiscretos

Page 16: Presentación del curso de Bioestadística

Datos categóricos

• A) NominalesEn esta escala los datos son sólo categorías declasificación.Ejemplos.a) Variable: : Fumador/no fumadorb) Variable: Diabético/no-diabéticoc). Variable: Casado/soltero/divorciado/viudod). Variable: Tipo de sangres: A/B/AB/O

Page 17: Presentación del curso de Bioestadística

• B)Categóricos ordinalesEn esta escala, los datos también son categoríasde clasificación, pero existe un orden intrínsecoentre las categorías acorde con la variable quese está midiendo.Los datos pueden ser ordenados.

Page 18: Presentación del curso de Bioestadística

Datos Numéricos• A) DiscretosSe encuentran cuando las observaciones en

cuestión toman sólo un cierto número de valores.

Ejemplos.Conteos de eventos: número de hijos, número

de visitas al doctor.

Page 19: Presentación del curso de Bioestadística

• B) Numéricos continuosSer obtienen por medio de medicionesEjemplos:Peso, altura, temperatura, edad, presión

sanguínea, nivel de colesterol, % de grasa, etc.

Page 20: Presentación del curso de Bioestadística

• Estadísticamente, la escala de medición juega un papel muy importante. Las metodologías que se pueden aplicar en el análisis de datos están restringidas por la escala en la cual la variable fue medida.

Page 21: Presentación del curso de Bioestadística

Población estadística• Conjunto de todos los valores posibles de una

variable.Ejemplos• 1). Todos los pesos obtenidos para un objeto dado.• 2). Todos los valores de color para un conjunto de objetos dados.• 3). Todas las calificaciones obtenidas en una materia por los grupos de una universida

dada.

Page 22: Presentación del curso de Bioestadística

FrecuenciasClases Absolutas10-20 220-30 830-40 1240-50 750-60 1

30

0 10 20 30 40 50 60

Clases

0

2

4

6

8

10

12

fi

Distribución

Una distribución estadística es una función que indica la frecuencia de cada dato es una población dada

Page 23: Presentación del curso de Bioestadística

Distribuciones mediante ecuaciones

0 1 2 3 4X

0

0.1

0.2

0.3

0.4

0.5

p(x)

0 2 4 6 8

X0

0.1

0.2

0.3

0.4

0.5

f(x)

xxxCxp 313

21

2x

exxf

Page 24: Presentación del curso de Bioestadística

-4 -2 0 2 4

X

0

0.1

0.2

0.3

0.4

f(x) Normal Estandar

0 0.2 0.4 0.6 0.8 1

X

0

0.4

0.8

1.2

1.6

2

2.4

f(x) Beta

2

2

21

)(x

exf

11 1 xxxf

Page 25: Presentación del curso de Bioestadística

Un parámetro es una constante asociada a la distribución de una población estadística.

Ejemplos

Normal

Exponencial

Poisson

, 2

Parámetro

221

21

)(

x

exf

xexf

!x

exf

x

Page 26: Presentación del curso de Bioestadística

MuestraPorción o parte seleccionada de una

población estadística de interés.

Ejemplos

Población:

Muestra:

Edad de los estudiantes en una universidad.

Estudiantes mayores de 20 años.

Page 27: Presentación del curso de Bioestadística

Estadísticos

Las características numéricas calculadas a partir de una muestra se denominarán estadísticos.

Ejemplos

s2

proporción

varianza

media

x

Page 28: Presentación del curso de Bioestadística

Estadística descriptivaProcedimiento matemáticos para

transformar un conjunto de datos en índices que resuman las características de una población o una muestra

Los procedimientos pueden ser tabulares, gráficos o numéricos.

Page 29: Presentación del curso de Bioestadística

Métodos gráficos1). Tablas de Frecuencias.2). Histogramas.3). Polígonos.4). Ojivas (Distribuciones de frecuencias acumuladas).

Los métodos gráficos permiten estudiar, a partir de la distribución de un conjunto de datos, aspectos tales como: Forma, Localización (centro), Dispersión.

Page 30: Presentación del curso de Bioestadística

Ofrece un resumen mas compacto de los datos1.- Elegir un intervalo que contenga todos los

puntos.2.- Dividirlo en subintervalos (intervalos de

clase) de la misma longitud. Sus puntos medios se llaman marca de clase.

3.- Frecuencia de clase es el número de valores en una clase. Los dividimos entre el tamaño de la muestra (frec. relativa de clase).

Tabla de Frecuencias Cuantitativas

Page 31: Presentación del curso de Bioestadística

4.- Frecuencia acumulada de clase es el número de valores que pertenecen a esta y a las anteriores clases. Divididas entre el tamaño de la muestra se llama frecuencia relativa acumulada de clase.

Page 32: Presentación del curso de Bioestadística

5.- Determine el número de clases (k)

Para determinar el valor de k se puede usar cualquiera de los tres criterios siguientes:

b)k = 1 + 3.3log10(n)

c) Use la tabla siguiente

a) k = n

Page 33: Presentación del curso de Bioestadística

Métodos Numéricos

Medidas de tendencia central.

Sea x1,x2,..,xn, una muestra aleatoria (m.a.) de tamaño n de una población.

El primer paso para describir un conjunto de datos es definir un representante o centro, existen varios:

a). Media:n

xxx

n

xx n

n

ii

211

Page 34: Presentación del curso de Bioestadística

Ejemplo 1Valores de colesterol total/LAD en 9

pacientes sin crecimiento de lesión aterosclerótica.

23.69

)6.48.32.70.6( x

Calcule la media:

“Los pacientes muestran en promedio 6.23 mMol/L de colesterol”

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Page 35: Presentación del curso de Bioestadística

La media se emplea cuando los datos pueden sumarse; es decir, se miden en una escala numérica.

La media es muy sensible a datos extremos o atípicos.

Notas:

Si colocáramos los datos en una balanza, la media sería el centro.

Page 36: Presentación del curso de Bioestadística

EjemploCalcule la mediana para los datos del

ejemplo 1

La muestra ordenada queda:

x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Como n=9 es impar por tanto, la mediana es

0.6~5 xx

Page 37: Presentación del curso de Bioestadística

“El 50% de los pacientes tiene niveles de colesterol mayores (menores) a 6.0 mMol/L”

Para observar como la mediana es menos sensible a datos extremos, eliminemos el dato 8.8. Y la mediana resulta en 5.91

La mediana resultó menos afectada que la media.Nota:

La mediana puede utilizarse tanto para datos numéricos como ordinales.

Page 38: Presentación del curso de Bioestadística

C). Moda:

EjemploCalcule la moda del ejemplo 1

Es la observación que se presenta con mayor frecuencia en la muestra.

El dato mas frecuente es 6.0 mMol/L., por tanto la moda es 6.

Solución:

Page 39: Presentación del curso de Bioestadística

Relación entre: Media, mediana (m) y moda(M)

m

M

x

M mx

Figura 1 Figura 2

Page 40: Presentación del curso de Bioestadística

¿Cuál medida utilizar?

Si la distribución de los datos es simétrica, y la variable es cuantitativa, de acuerdo a la figura 1, las tres medidas de tendencia central coinciden.

Si la variable es cualitativa se prefiere la mediana. Así mismo, si considera la posibilidad de que la muestra contenga datos atípicos.

Page 41: Presentación del curso de Bioestadística

Las propiedades matemáticas y estadísticas de la media hacen de esta la mas importante. Otras propiedades la hacen elección universal.

Notas:

1). La media es afectada por datos extremos.2). La mediana no es fácil de manipular algebraicamente.3). La moda puede no existir o haber varias modas.

Page 42: Presentación del curso de Bioestadística

Medidas de Variabilidad

Una medida de variabilidad (o dispersión) es un valor numérico que indica la magnitud de la separación entre los elementos de una muestra o población.

Page 43: Presentación del curso de Bioestadística

A: 10 20 60 B: 28 29 33

Compare los datos de tiempo de vida en ratones sometidos al tratamiento A y tratamiento B.

Ejemplo

nA=3, nB=3Media= 30, Media =30

Solución

En ambos casos “el tiempo de vida promedio es de 30 semanas”. Sin embargo, existe mayor variabilidad en los datos de tratamiento A.

Veremos algunas formas de medir variabilidad.

Page 44: Presentación del curso de Bioestadística

Hay al menos dos razones para medir variabilidad.

1)Para tener una idea de la precisión con la que un valor central muestral representa a la población.2)Para conocer la magnitud de la variabilidad y así poder tomar medidas para su control.

Page 45: Presentación del curso de Bioestadística

Las medidas de dispersión más utilizadas son:

a) El rangob) La varianzac) La desviación estándard) Coeficiente de variación

Comúnmente, la variabilidad se expresa como una desviación promedio de los datos con respecto al centro.

También puede expresarse como la posición de un dato con respecto a los demás.

Page 46: Presentación del curso de Bioestadística

a)El rango es mínimomáximo R

Ejemplo

La muestra A tiene mayor variabilidad que la B.

Calcule el rango para el ejemplo anterior.Solución:

RA= 50 - 60 = 50 RB = 33- 28 = 5

Nota: Aun cuando el rango es una medida sencilla de variabilidad, solo toma en cuenta dos datos para su cálculo.

Page 47: Presentación del curso de Bioestadística

b). La varianza es

n

i

i xxn

s

1

22

11

Calcule la varianza de los datos anteriores

70030603020301013

1 2222

As

730333029302813

1 2222

Bs

Preferimos tratamiento B porque tiene menor variabilidad

Page 48: Presentación del curso de Bioestadística

La varianza se expresa un unidades cuadradas, en el ejemplo anterior son semanas al cuadrado, si calculamos raíz cuadrada se obtiene una medida de variabilidad en las mismas unidades que los datos originales; así se define la desviación estándar o típica.

Page 49: Presentación del curso de Bioestadística

c). La desviación estándar es

n

i

i xxn

ss

1

22

11

7002 AS72 BS

45.26AS 645.2BSsem sem

sem2sem2

Page 50: Presentación del curso de Bioestadística

Gracias …

Lupita Valdez Zazueta