Bioestadística. Lic. Henry Andrade

34
Lic.: Henry Andrade Ruiz Correo. [email protected] [email protected]

Transcript of Bioestadística. Lic. Henry Andrade

Programa Doctoral

“Formación, Empleo

y Desarrollo

Regional”

1. Conceptos básicos en estadística.

2. Escalas de medición

3. Medidas de tendencia central: media, moda

y mediana

4. Medidas de dispersión: desviación estándar,

error estándar

5. Distribución normal (de gauss). Test de

normalidad de los datos

6. Elaboración de tablas y gráficos

Estructura de la presentación

1. Conceptos Básicos en Estadística.

Medidas Básicas en Bioestadística

¿QUÉ ES LA BIOESTADÍSTICA?

Es la Ciencia que aplica el análisis estadístico a los

problemas y objetos de estudio de la biología

¿QUÉ ES LA ESTADÍSTICA?

“Conjunto de conocimientos y métodos usadosen la recolección, organización presentación yanálisis de la información relativa a unfenómeno determinado permitiéndole alinvestigador tomar decisiones en fenómenosdonde este presente la incertidumbre”

José Manuel Armas.

1. Conceptos Básicos en Estadística.

Medidas Básicas en Bioestadística

BIOESTADÍSTICA: NOCIONES ELEMENTALES

INCERTIDUMBREMEDICINA

LA ESTADISTICA COMO HERRAMIENTA FUNDAMENTAL EN LA INVESTIGACIÓN MÉDICA

MANEJO

ACTIVIDADES PREVENTIVAS,

DIAGNOSTICAS, TERAPÉUTICAS Y

PRONOSTICAS

PRACTICA

CLÍNICA

GENERA

INVESTIGACION

1. Conceptos Básicos en Estadística.

Aspectos que el investigador debe tener en cuenta sobre las

técnicas estadísticas

1. Centrar el problema de la investigación en su campo de

especialización. (objetivos, variables, hipótesis, relaciones

básicas de las variables).

2. Mantener el diseño y el análisis tan simple como sea posible

para no exagerar en el uso de técnicas estadísticas (análisis de

datos).

Medidas Básicas en Bioestadística

RAMAS DE LA ESTADÍSTICA

Estadística Descriptiva: Describe, analiza y

representa un grupo de datos utilizando métodos

numéricos y gráficos que resumen y presentan la

información contenida en ellos.

Estadística Inferencial: Apoyándose en el cálculo

de probabilidades y a partir de datos muestrales,

efectúa estimaciones, toma de decisiones,

predicciones u otras generalizaciones sobre un

conjunto mayor de datos.

1. Conceptos Básicos en Estadística.

Medidas Básicas en Bioestadística

1. Conceptos Básicos en Estadística.

Individuos o elementos: personas u objetos que contienen cierta

información que se desea estudiar.

Población: conjunto de individuos o elementos que cumplen ciertas

propiedades comunes.

Muestra: subconjunto representativo de una población.

Parámetro: función definida sobre los valores numéricos de

características medibles de una población.

Estadístico: función definida sobre los valores numéricos de una

muestra.

2. Escalas de medición

Medidas Básicas en Bioestadística

Es una característica observable que varía entre los diferentes

individuos de una población. La información que disponemos de cada

individuo es resumida en variables.

Ejemplo

El grupo sanguíneo

{A, B, AB, O} Var. Cualitativa

Su nivel de felicidad “declarado”

{Deprimido, Muy Feliz} Var. Ordinal

El número de hijos

{0,1,2,3,...} Var. Numérica discreta

La altura

{1’62 ; 1’74; ...} Var. Numérica continua

VARIABLES CATEGÓRICAS VARIABLES NUMÉRICAS

CUALITATIVAS CUANTITATIVAS

(0) NOMINAL

Ningún atributo

(1) ORDINAL

Un atributo

(2) (INTERVALO)

Dos atributos

(3) RAZÓN

Tres atributos

Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen

Posee categorías que no

se pueden ordenar por

alguna jerarquía

Posee categorías que se

pueden ordenar por

alguna jerarquía, pero no

se puede medir la

distancia entre ellas

Son variables numéricas

cuyos valores

representan magnitudes

y la distancia entre los

números de su escala es

igual

Las variables de razón

poseen las mismas

características de las

variables de intervalo, con

la diferencia que cuentan

con un cero absoluto; es

decir, el valor cero (0)

representa la ausencia

total de medida

Género Estado Civil Instrucción Intensidad Temperatura Hora (24 h) Peso Hijos

Masculino Soltero Primaria Leve -10º C 00 horas 00 Kg 1

Femenino Casado Secundaria Moderado 0º C 12 horas 25 Kg 3

Divorciado Universitaria Severo 15º C 22 horas 40 Kg 5

Dicotómicas: tiene solo dos categorías

Continuas : proviene de medir con números enteros o

fraccionaros, entre dos valores siempre existe

números intermedios

Politómicas: tienen más de dos categoríasDiscretas: provienen de contar, sólo admite valores

enteros

Medidas Básicas en Bioestadística

3. Medidas de tendencia central: media, moda y mediana

MEDIA

Es la medida de posición central más utilizada, la más conocida y la más

sencilla de calcular, debido principalmente a que sus ecuaciones se

prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su

principal desventaja radica en su sensibilidad al cambio de uno de sus

valores o a los valores extremos demasiado grandes o pequeños. La

media muestral se define como la suma de todos los valores observados,

dividido por el número total de observaciones.

n

x

X

n

i

i 1

Medidas Básicas en Bioestadística

3. Medidas de tendencia central: media, moda y mediana

MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el

centro de los datos, es decir, divide el conjunto de datos en dos partes

iguales. 50-50

MODA

La medida modal nos indica el valor que más veces se repite dentro

de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el

valor que más veces se repite es el número 2 quien seria la moda de

los datos. Es posible que en algunas ocasiones se presente dos

valores con la mayor frecuencia, lo cual se denomina Bimodal o en

otros casos más de dos valores, lo que se conoce como multimodal.

Nota: Cuando la media, mediana y moda son iguales en un conjunto

de datos, estos deben proceder de una distribución normal

4. Estadísticos de posición

Percentil: Dividen a la muestra en 100 partes

iguales

• La mediana es el percentil 50

• El percentil de orden 15 deja por debajo al 15% de las

observaciones. Por encima queda el 85%

Cuartiles: Dividen a la muestra en 4 grupos con

frecuencias similares.

• Primer cuartil = Percentil 25 =

• Segundo cuartil = Percentil 50 = mediana

• Tercer cuartil = Percentil 75 =

5. Importancia de la media, mediana y estadísticos de posición en el análisis

estadístico

1.Permiten definir grupos de comparación categorizando variables cuantitativas

2. La muestra se homogeniza al categorizar la variable ya que los grupos tienen

aproximadamente el mismo número de elementos.

3. Permiten determinar puntos de corte donde se encuentra significancia

estadística.

Virtudes

Resiliencia total

P< 84,09 >= 84,09

Media (Ds) Media (Ds)

Sabiduría 4,04 (0,4) 4,4 (0,35) 0,000

Coraje 4,08 (0,4) 4,45 (0,33) 0,000

Humanidad 4,12 (0,42) 4,46 (0,36) 0,000

Justicia 4,17 (0,43) 4,42 (0,42) 0,000

Templanza 3,87 (0,47) 4,14 (0,47) 0,000

Trascendencia 4,11 (0,42) 4,43 (0,36) 0,000

Cuadro N° 1.

Comparación del puntaje promedio de las virtudes por resiliencia total

Universidad de Los Andes - Facultad de Medicina

Mérida, Venezuela. Año 2011

Resiliencia

Grupo de Edad

P≤ 21 > 21

Media (DS) Media (DS)

Inicio

Escala de Resiliencia 75,94 (13,11) 80,00 (9,70) 0,26

Competencia personal, tenacidad y

control 85,89 (12,8) 92,09 (11,22) 0,08

Confianza en si mismo 67,67 (17,25) 77,38 (14,41) 0,04

Aceptación positiva al cambio 79,51 (13,15) 82,14 (13,51) 0,48

Optimismo 72,18 (16,03) 71,88 (17,12) 0,95

Cuadro N° 2.

Comparación de la resiliencia por grupo de edad

Facultad de Farmacia y Bioanálisis

ULA. Año 2011

Medidas Básicas en Bioestadística

6. Medidas de dispersión: desviación estándar, error estándar y varianza

Así como las medidas de tendencia central nos permiten identificar el

punto central de los datos, las Medidas de dispersión nos permiten

reconocer que tanto se dispersan los datos alrededor del punto

central; es decir, nos indican cuanto se desvían las observaciones

alrededor de su promedio aritmético (Media)

Medidas Básicas en Bioestadística

6. Medidas de dispersión: desviación estándar, error estándar y varianza

VARIANZA

Esta medida nos permite identificar la diferencia promedio que hay entre cada

uno de los valores respecto a su punto central (media) al cuadrado.

1

)( 2

2

n

xxS

i

Desventajas

Es sensible a valores extremos (alejados de la media).

Su interpretación no es sencilla ya que las unidades de medida están

cuadrado.

Ventajas

De gran utilidad para determinar tamaños muestrales en estudios

posteriores

Medidas Básicas en Bioestadística

6. Medidas de dispersión: desviación estándar, error estándar y varianza

Desviación Estándar o Típica

Esta medida nos permite determinar el promedio aritmético de fluctuación de

los datos respecto a su punto central o media.

2SS Desventajas

Es sensible a valores extremos (alejados de la media).

Ventajas

Tiene las misma dimensionalidad (unidades) que la variable original.

Cierta distribución que veremos más adelante (normal o gaussiana) quedará

completamente determinada por la media y la desviación típica. De gran utilidad

para pruebas de hipótesis e intervalos de confianza

Medidas Básicas en Bioestadística

6. Medidas de dispersión: desviación estándar, error estándar y varianza

Error Estándar o Típica de la Media Muestral

Mide el grado de variabilidad de la media muestral con respecto a la media

poblacional. Se determina mediante el cociente entre la desviación estándar y

la raíz de n.

n

SS x

Es de gran utilidad para la inferencia estadística, para la elaboración de

intervalos de confianza para la media poblacional y para las pruebas de

hipótesis ya que permiten definir el estadístico de prueba.

7. Distribución normal (de gauss). Test de normalidad de los datos

La distribución normal o gaussiana es la distribución de probabilidad

más importante de la estadística, es una variable aleatoria continua con

media µ y varianza σ2 .

Propiedades de la distribución normal

1.Tiene forma de campana ya que es simétrica con respecto a la media

2. Todas las medidas de tendencia central son iguales (media, moda y

mediana)

3. Es unimodal

4. Rango de variación desde hasta

Medidas Básicas en Bioestadística

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss). Test de normalidad de los datos

La distribución normal en las pruebas estadísticas.

Existen pruebas estadísticas paramétricas y no paramétricas, las primeras

son de mayor precisión para detectar las relaciones existentes entre

variables, si es que estas existen, para llevar acabo este tipo de prueba es

necesario que los valores de la variable dependiente sigan una distribución

normal. Para ello se emplea la prueba de kolmogorov-smirnov para probar

normalidal

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Áreas de la Inferencia Estadística

1. Estimación

a) Estimación Puntual

b) Estimación Por Intervalos de Confianza

2. Prueba de Hipótesis

a) Pruebas de hipótesis para diferencias entre medias y/o

proporciones dos muestras (independientes, dependientes)

b) Experimentos de un factor (análisis de varianza para más de dos

muestras)

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Estimación Por Intervalos de Confianza.

La estimación por intervalos se refiere al proceso de

determinar un intervalo de valores, el cual incluirá el

verdadero valor del parámetro, con un nivel de

confianza determinado y expresado en términos de

probabilidades.

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Estimación Por Intervalos de Confianza.

Teorema del Límite Central.

Si es la media de una muestra aleatoria de tamaño

“n” tomada de una población con media µ y varianza

finita , entonces la forma límite de la distribución

de

X

2

nσ/

μXZ

Cuando n , se aproxima a la Distribución N(0,1) ∞

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Estimación Por Intervalos de Confianza de µ con σ

conocida

Si es la media de una muestra aleatoria de tamaño

“n” de una población con varianza , conocida, un

intervalo de confianza de (1-α) 100% para µ está dado

por

X2

nzx

nzx

2/2/

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Estimación Por Intervalos de Confianza para µ1-µ2

con σ1 y σ2 conocida

Si son las medias de muestras aleatorias

independientes de tamaño “n1 y n2” de poblaciones

normales con varianzas conocidas ,

respectivamente, un intervalo de confianza de (1-α)

100% para µ1-µ2 está dado por

2

2

1

1

2/2121

2

2

1

1

2/21)()(

nnzxx

nnzxx

21XyX

2

2

2

1 y

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Conceptos básicos.

Hipótesis estadística: es una aseveración o conjetura con respecto a una o

más poblaciones.

Hipótesis nula y alternativa: la hipótesis nula se refiere a la hipótesis que

deseamos someter a prueba se denota con H0. El rechazo de H0 conduce a la

aceptación de la hipótesis alternativa que se denota con H1.

Prueba de Hipótesis.

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Situaciones posibles al probar una hipótesis estadística

Resultado de la prueba

Realidad

H0 es verdadera H0 es falsa

Aceptar H0 Decisión correcta Error tipo II

Rechazar H0 Error tipo I Decisión correcta

Tipos de errores que se puede incurrir al probar una hipótesis estadística

Medidas Básicas en Bioestadística

7. Distribución normal (de gauss).

Procedimiento para pruebas de hipótesis.

1. Establecer las hipótesis nula y alternativa

2. Definir el nivel de significación α

3. Seleccionar la estadística de prueba apropiada (t-studen, F, otros.)

4. Calcular el valor de la estadística de prueba, a partir de los datos de la

muestra

5. Decisión

Medidas Básicas en Bioestadística

5. Distribución normal (de gauss).

Pruebas con respecto a una sola media (varianza conocida)

Estadística de prueba

nσ/

μXZ 0

Medidas Básicas en Bioestadística

5. Distribución normal (de gauss).

Pruebas con respecto a dos medias (varianza conocida)

Estadística de prueba

2

2

2

1

2

1

2121)μμ()XX(

Z

nn

Elaboración de gráficos y tablas

Obligación de revelar la fuente del dato

Artículo 16. Todas las personas naturales y jurídicas, privadas y públicas

que difundan información estadística están en la obligación de indicar la

fuente del dato.

Tutela del Secreto Estadístico

Artículo 19. Están amparados por el secreto estadístico los datos

personales obtenidos directamente o por medio de información

administrativa, que por su contenido, estructura o grado de desagregación

identifiquen a los informantes.

Gracias por

Su

Atención

Lic. Henry Andrade

Correo. [email protected]

[email protected]