Manual Bioestadística PLUS MEDIC A

of 38/38
BIOESTADÍSTICA
  • date post

    20-Jan-2016
  • Category

    Documents

  • view

    453
  • download

    3

Embed Size (px)

Transcript of Manual Bioestadística PLUS MEDIC A

  • Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A

    www.plus-medica.com

    BIOESTADSTICA

  • Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A

    www.plus-medica.com

    1 Edicin

    Paul Pachas Chvez MD, MPH (c), MSc(c)

    Jos castro Zevallos

    Ramn Flores Valdeiglesias

    Cartula: Edy Flores Valdeiglesias

    Derechos Reservados 2012

    Prohibida su venta

    MANUAL de BIOESTADSTICA , SALUD

    PBLICA, y EPIDEMIOLOGA

    PLUS MEDIC A

    Mdico epidemilogo Instituto Nacional de Salud

    Ministerio de Salud

    Mdico internista Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo

    Docente de la Universidad Cientfica del Sur Docente de la Universidad San Juan Baustista

    Mdico internista

    Asistente del Dpto de Medicina del Hospital Nacional Dos de Mayo Docente de la Universidad Ricardo Palma

    Docente de la Universidad Cientfica del Sur

  • Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A

    www.plus-medica.com

    Este manual est dedicado a los estudiantes de Medicina Humana y a los mdicos jvenes de las diferentes universidades de Lima y de nuestro Per, que se esfuerzan

    da a da en busca del conocimiento mdico actualizado y que son fuente de inspiracin y razn de ser de PLUS MEDIC A.

    Los autores

  • Manual de Bioestadstica, Salud Pblica y Epidemiologa RM PLUS MEDIC A

    www.plus-medica.com

    Contenido 1. Estadstica. Generalidades .. 6 1.1 Tipos de estadstica 1.2 Poblacin 1.3 Parmetro 1.4 Estadstico 2. Estadstica descriptiva 21 2.1 Variables 2.2 Grficos para variables cualitativas 2.3 Grficos para variables cuantitativas 2.4 Medidas de posicin y de dispersin 3. Diseo y anlisis del muestreo . 37 3.1 Poblacin o universo 3.2 Muestra 3.3 Marco muestral, unidad de muestreo, unidad de informacin y unidad de anlisis. 3.4 Muestreo 3.5 Muestreo probabilstico 3.6 Muestreo no probabilstico 3.7 Tamao muestral 4. Estadstica inferencial .... 42 4.1 Estadstica paramtrica 4.2 Estadstica no paramtrica 4.3 Anlisis estadstico 4.4 Pruebas con dos muestras independientes 5. Contraste de hiptesis........ 56 5.1 Hiptesis nula, hiptesis alternativa y grado de significacin estadstica 5.2 Errores alfa y beta 5.3 Pruebas de significacin estadstica 5.4 Prueba de Chi cuadrado

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    5

    INTRODUCCIN

    La estadstica es una serie ordenada de mtodos que se ocupan de la recoleccin, organizacin, presentacin, anlisis e interpretacin de datos numricos. Cmo se clasifica la estadstica?

    Utiliza tcnicas para recolectar, resumir, analizar presentar un conjunto de datos, a travs de tablas o grficos, con la finalidad de describir apropiadamente las caractersticas de ese conjunto.

    Comprende las tcnicas matemticas que permiten generalizar la informacin obtenida de una muestra a la poblacin. Debido a que las decisiones se toman en condiciones de incertidumbre, sern confiables con cierto grado de probabilidad.

    POBLACIN

    Es el conjunto total de

    individuos, objetos o medidas

    que poseen algunas

    caractersticas comunes obser-

    vables en un lugar y en un

    momento determinado.

    Cuando se vaya a llevar a cabo alguna investigacin

    debe de tenerse en cuenta algunas caractersticas

    esenciales al seleccionarse la poblacin bajo estudio:

    que todos los miembros de la poblacin tengan las mismas caractersticas segn las

    variables que se vayan a considerar en el estudio o

    investigacin.

    Determinar si el estudio es del momento presente o

    si se va a estudiar a una poblacin de cinco aos

    atrs o si se van a entrevistar personas de diferentes

    generaciones.

    Por falta de tiempo y recursos hay que limitar el

    estudio a un rea o comunidad en especfico.

    El tamao de la poblacin determina o afecta al

    tamao de la muestra que se vaya a seleccionar.

    MUESTRA

    Es un subconjunto fielmente representativo de la

    poblacin. sobre la que tenemos acceso y donde

    hacemos las observaciones (mediciones).

    Hay diferentes tipos de muestreo. El tipo de

    muestra que se seleccione depender de la

    calidad y cun representativo se quiera sea el

    estudio de la poblacin:

    cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser

    incluido.

    cuando se subdivide en estratos o subgrupos segn las variables o

    caractersticas que se pretenden investigar. Cada

    estrato debe corresponder proporcionalmente a

    la poblacin.

    : cuando se establece un patrn o criterio al seleccionar la muestra.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    6

    Muestreo

    Es indispensable para el investigador ya que es

    imposible entrevistar a todos los miembros de

    una poblacin debido a problemas de tiempo,

    recursos y esfuerzo.

    Al seleccionar una muestra lo que se hace es

    estudiar una parte o un subconjunto de la

    poblacin, pero que la misma sea lo

    suficientemente representativa de sta para

    que luego pueda generalizarse con seguridad

    de ellas a la poblacin.

    por su naturaleza y por la necesidad de tener control sobre las

    variables, se recomienda muestras pequeas que

    suelen ser de por lo menos 30 sujetos.

    se emplean muestras grandes y algunas veces se recomienda seleccionar

    de un 10 a un 20 por ciento de la poblacin

    accesible

    PARMETRO Es una unidad numrica calculada sobre una poblacin y resume los valores que sta toma en varios atributos.

    ESTADSTICO Es una unidad numrica calculada sobre una muestra que resume su informacin sobre algn aspecto.

    Ejemplo: la media del peso de 300 habitantes de la ciudad de Lima.

    VARIABLES Cmo se define a las variables en estadstica? a) Desde el punto de vista estadstico

    CUALITATIVAS Si sus valores no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos). Tipos:Si sus valores no se pueden ordenar .Sexo, Fumar (S/No) . : estado civil, color de los ojos, profesin. : si sus valores se pueden ordenar IRA, grado de desnutricin, Intensidad del dolor.

    CUANTITATIVAS Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos) Tipos: Si toma valores enteros Ejemplo: Nmero de abortos, nmero de parejas sexuales, etc. Si entre dos valores, son posibles infinitos valores intermedios. Ejemplo: Edad, talla, presin intraocular, etc. El cero no es absoluto Temperatura en grados centgrado, la nota de un examen El cero es absoluto. Altura, peso

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    7

    Variable cualitativa nominal

    Es la variable cualitativa que no tiene punto de comparacin. Ejemplo: el color de los ojos .

    Variable cualitativa ordinal

    Cuando hay un determinado orden. Ejemplo: duracin de una enfermedad (aguda, subaguda, crnica).

    Variable cuantitativa discreta, discontnua o de intervalo Cuando la variable cuantitativa slo se puede medir en valores enteros. Ejemplo: nmero de partos.

    Variables cuantitativas continuas o de razn

    Si la variable se puede expresar en fracciones, como peso al nacimiento (3,460 g) o estatura (51.3 cm)

    b) Desde el punto de vista metodolgico

    GRFICOS para variables CUALITATIVAS Grfico de barras

    Representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Cuando los tamaos de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podran resultar engaosas Fi. 1 Diagrama de barras para una variable cualitativa

    Si, mediante el grfico, se intenta comparar varias poblaciones entre s, existen otras modalidades, como las mostradas en la figura. Fi. 2 Diagrama de barras para comparar una variable cualitativa en varias poblaciones Grfico de sectores (tartas)

    Se divide un crculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa .

    Sean n1 < = n2 los tamaos respectivos de las 2 poblaciones. La poblacin ms pequea se representa con un semicrculo de radio r1 y la mayor con otro de radio r2.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    8

    La relacin existente entre los radios, es la que se obtiene de suponer que la relacin entre las reas de las circunferencias es igual a la de los tamaos de las poblaciones respectivas, es decir: Pictogramas

    Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Estos grficos se hacen representado a diferentes escalas un mismo dibujo.

    Fi. 3 Pictogramas

    GRFICOS para variables CUANTITATIVAS Para las variables continuas

    Utilizamos como diagramas diferenciales los histogramas y los polgonos de frecuencias. Histogramas

    El criterio para calcular la altura de cada rectngulo es el de mantener la proporcionalidad entre la frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos.

    Polgono de frecuencia

    Para representar el polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que corresponden a sus marcas de clase.

    El polgono de frecuencias tiene en comn con el histograma el que las reas de la grficas sobre un intervalo son idnticas.

    El diagrama integral para una variable continua se denomina tambin polgono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas.

    ESTADSTICOS Indican los valores centrales de los datos. Media, mediana y moda Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin. Desviacin tpica, coeficiente de variacin, rango, varianza

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    9

    Centralizacin o tendencia central Dispersin Cuantiles, percentiles, cuartiles, deciles PosicinAsimetra Apuntamiento o curtosis Forma

    Si los datos son una muestra, el promedio y la mediana se llamarn estadsticos. Si los datos son una poblacin entonces estas medidas de tendencia central se llamarn parmetros

    Ejem. Media de 2, 2, 3 y 7 es (2+2+3+7) /4=3,5 Cundo debemos usarla? cuando los datos tie- nen distribucin normal o casi normal Precaucin: es muy sensible a valores extremos. Cundo usarla? si la distribucin de los datos es asimtrica. No es sensible a valores extremos. Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7

    Pasos para encontrar la mediana: 1. Ordenar los datos de menor a mayor; 2. Calcular la posicin de la mediana: (n+1)/2, donde n es el nmero de observaciones 3. a) Si el nmero de observaciones es impar, la mediana es un nico trmino central. b) Si el nmero de observaciones es par, la mediana es el promedio de los dos trminos centrales.

    Ejemplo Edades de n=20 sujetos... Calculamos (n+1)/2 obtenemos (20+1)/2 = 10,5. Entonces los trminos centrales son la dcima y un-

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    10

    dcima observaciones, es decir 43 y 44. La mediana es el promedio de estos dos trminos, (43+44)/2=43,5 aos. 32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51 La moda de los valores: { 0, 0, 0, 0, 1, 1, 2, 2, 3, 4 } es 0. { 0, 0, 0, 1, 1, 2, 2, 2, 3, 4 } dos modas, 0 y 2 (bimodal). Cul sera la moda del siguiente conjunto de valores? { 0, 1, 2, 4, 5, 8 }. {0, 0, 0, 0, 0, 1, 2, 3, 4, 4, 4, 4, 5} ... La Moda no se usa a menudo como medida de tendencia central para datos cuantitativos. Sin embargo la Moda es la medida de tendencia central que puede ser calculada en datos cualitativos. Pregunta: En nueve familias encuestadas los nmeros de nios por familia fueron: 4,6,2,2,4,3,2,1 y 7. La media, mediana y moda de los nios por familia son respectivamente: a) 3.4, 2,3 b) 3, 3.4, 2 c) 3, 3.4, 2 d) 2, 3.5, 3 e) Ninguna anterior Pregunta: Un jefe de servicio desea considerar un valor central que resuma el tiempo de estancia de sus pacientes ingresados. En este valor prefiere que tengan escasa contribucin aquellos pacientes ingresados por error diagnstico que son trasladados a otro servicio en poco tiempo y aquellos pacientes que permanecen ingresados debido a su problemtica social una vez finalizada la intervencin mdica. Qu parmetro le recomendara?: A. Mediana. B. Moda. C. Media. D. Desviacin tpica. E. Recorrido.

    Estadsticos de DISPERSIN

    Miden el grado de dispersin (variabilidad) de los da-

    tos, independientemente de su causa.

    Diferencia entre observaciones extremas. -2, 1, 4, 3, 8, 4. El rango es 8-1=7 -Es muy sensible a los valores extremos.

    Rango Es la medida de variabilidad o dispersin ms simple. Se calcula tomando la diferencia entre el valor mximo y el mnimo observado. Rango = Mximo Mnimo. Analice cules podran ser las ventajas y desventajas del rango como medida de variabilidad.

    -Es la distancia entre el primer y tercer cuartil. Rango intercuartlico = P

    75 - P

    25

    -Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. -No es tan sensible a valores extremos.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    11

    Pensemos la desviacin estndar como aproximadamente un promedio de las distancias de las observaciones a la media. Si todas las observaciones son iguales, entonces la desviacin estndar es cero. La desviacin estndar es positiva y mientras ms alejados estn los valores del promedio, mayor ser la desviacin estndar.

    Dispersin en distribuciones normales -Centrado en la media y a una desviacin estndar de distancia tenemos ms de la mitad de las observaciones (68.25%). -A dos desviaciones estndar tenemos al 95.45% -A tres desviaciones estndar tenemos el 99.7%

    ESTADSTICOS de POSICIN .

    -La mediana es el percentil 50 -El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85% En general, el k-simo percentil es un valor tal que el k% de los datos son menores o iguales que l, y el (100-k) % restante son mayores o iguales que l. .-Primer cuartil = Percentil 25 = Cuantil 0,25 -Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana -Tercer cuartil = Percentil 75 = cuantil 0,75

    i

    i xxn

    S 22 )(1

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    12

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    13

    OF: Un estudio ha codificado la intensidad del dolor

    de los pacientes como: sin dolor, dolor leve, dolor moderado y dolor intenso. La variable ha sido media en una escala: a. Cualitativa nominal b. Cualitativa ordinal c. Cualitativa discreta d. Cualitativa contnua e. Dicotmica Rpta. B OF: Se est realizando un estudio para conocer el

    efecto de un analgsico. La variable principal de respuesta es una escala de dolor con los siguientes valores: 1 . No dolor 2. Dolor leve 3.Dolor moderado y 4. Dolor intenso. De qu tipo de variable se trata? a. Variable dicotmica b. Variable contnua c. Variable discreta d. Variable ordinal e. Variable cuantitativa Rpta. D OF : Al consultar la distribucin del peso en una muestra de sujetos adultos, se aprecia que el percentil 25 corresponde a 65 kg. Cul de las siguientes afirmaciones es correcta?: a)El 25% de los sujetos de la muestra pesan aproximadamente 65 kg. b)El 25% de los sujetos de la muestra tienen un peso igual o superior a 65 kg. c)Para poder interpretar este valor, es necesario conocer la desviacin estndar de la distribucin. d)Para poder interpretar este valor, es necesario conocer la media de la distribucin. e)El 25% de los sujetos de la muestra tienen un peso igual o inferior a 65 kg. Rpta. E OF : En un estudio en que se ha medido la intensidad

    de dolor en un grupo de 145 pacientes con artritis reumatoide mediante una escala de 0 (ausencia de dolor) a 10 (dolor de intensidad mxima), se informa que la mediana es de 6. Cul el significado de este valor?: a)La mitad de los sujetos de la muestra tienen valores de intensidad de dolor iguales o inferiores a 6.

    b)El valor 6 indica la intensidad de dolor que puede considerarse normal en la escala utilizada. c)El valor 6 de la escala ha sido la puntuacin obtenida con mayor frecuencia por los sujetos de la muestra. d)El valor 6 es la media aritmtica de las puntuaciones obtenidas por los sujetos de la muestra. e)La diferencia entra la puntuacin mxima y la mnima obtenida por los sujetos de la muestra es 6. Rpta. A OF: En un ensayo clnico se comparan 3 tratamientos

    (p.e. placebo, tratamiento establecido y un tratamiento nuevo). La variable respuesta es contnua (p.e. nivel de glucosa en sangre). Aceptando que la variable tiene una distribucin normal, el test correcto para comparar la respuesta es: a)La t de Student. b)El test de Wilcoxon. c)Anlisis de la varianza. d)El test de Kruskal-Wallis. e)El test ji-cuadrado. Rpta. C

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    14

    INTRODUCCIN

    La investigacin en salud tiene como objeto obtener conclusiones que permitan una adecuada toma de decisiones en lo que compete a conductas especficas y cambio de polticas establecidas en relacin con la salud de los seres humanos. CONCEPTOS

    Poblacin o Universo Es un conjunto de individuos o elementos que guardan similitud entre s en los aspectos que son relevantes para los objetivos de la investigacin. Cada uno de los elementos estn perfectamente identificados.

    La poblacin o universo es demasiado grande para estudiarla en su totalidad.

    Poblacin o universo

    Estudiar a la poblacin de baistas de una

    piscina es fcil, pero no precisamente de la

    piscina de abajo! Cules son las razones que limitan la medicin en todos los sujetos de la poblacin? -Las limitaciones severas en relacin a recursos econmicos y de tiempo, para lograr un cubrimiento del ciento por ciento de la poblacin. -Falta de recurso humano suficientemente calificado para realizar las observaciones o para obtener las mediciones necesarias . -Dificultades geogrficas y logsticas que presenta una tarea de gran magnitud como es el cubrimiento total de una poblacin. Muestra Es un subgrupo de la poblacin total.

    Para muestra. un

    botn! Las dificultades ante- riormente menciona- das, que podran hacer irrealizable un estudio, pueden ser soluciona- das si se estudia una muestra de la pobla- cin.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    15

    Una muestra correctamente seleccionada puede representar a la comunidad total de la cual fue extradas y permite , que los resultados obtenidos en ella puedan extrapolar a un nmero mucho mayor personas pertenecientes a la misma poblacin o a po-blaciones diferentes de caractersticas muy similares.

    Marco muestral Es un subconjunto de la poblacin en el cual cada uno de los elementos est identificado Es una lista de unidades de muestreo.

    Dentro del marco muestral se va a identificar la unidad de muestreo.

    Unidad de muestreo

    Es la unidad que se somete al proceso de aleatorizacin en los estudios que requieren muestreo.

    En un muestreo por conglomerados o clsters son los grupos de unidades de estudio los que ingresan al sorteo. En un estudio sobre la relacin mdico-paciente son los mdicos las unidades de muestreo.

    Unidad de informacin

    Es la unidad que nos brinda informacin de la unidad de estudio.

    Cuando la unidad de estudio es la poblacin el individuo se convierte en unidad de informacin. En un estudio retrospectivo las unidades de informacin son las historias clnicas.

    Unidad de anlisis

    Es la unidad definida por el investigador para realizar mediciones. Es el elemento bsico de estudio.

    Las unidades de anlisis pueden corresponder a las siguientes categoras o entidades:

    El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio mdico, la

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    16

    unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese servicio mdico.

    Seleccin de una muestra La muestra se selecciona del Universo, de acuerdo con unos criterios de inclusin y exclusin previamente establecidos. En este sentido, cuantos ms criterios de inclusin o exclusin se propongan, ms reducida ser la poblacin a la que se pueda extrapolar el resultado.

    MUESTREO

    Preguntas en todo proceso de muestreo: Para que los datos sean representativos de la poblacin que se pretende estudiar.

    Tamao de la muestra : A cuntos vamos a muestrear ? Diseo muestral : A quienes vamos a muestrear?

    Objetivo del muestreo Es obtener una poblacin que permita generalizar los resultados del estudio a personas que comparten las caractersticas del inters, pero que no estuvieron involucradas en el desarrollo del mismo.

    Validez Interna Se refiere al grado en que la seleccin de sujetos y los otros aspectos del desarrollo de un estudio estn libres de sesgos o errores sistemticos que, de estar

    presentes, podran cambiar radicalmente los resultados finales de una investigacin. Validez externa Equivale a la posibilidad de generalizar los resultados a la poblacin, que se caracteriza por tener caractersticas compartidas.

    Mtodos de muestreo El muestreo puede ser, de acuerdo con sus caractersticas bsicas, de dos tipos: probabilstica y no probabilstica. Muestreo no probabilstico

    -Por conveniencia o deliberado -Accidental -Seleccin por expertos

    Muestreo no probabilstico

    -Muestreo aleatorio simple o irrestricto -Muestreo Sistemtico -Muestreo Estratificado -Muestreo por Conglomerados -Muestreo Polietpico Estratificado.

    MUESTREO NO PROBABILSTICO En general, en este tipo de muestreo, las unidades se seleccionan por conveniencia, de manera secuencial, siguiendo determinados criterios subjetivos o porque simplemente estn disponibles.

    Desventaja La desventaja del muestreo no probabilstico es que no sirven para realizar generalizaciones, dado que no se tiene certeza de que la muestra extrada sea representativa de la poblacin.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    17

    Muestreo por CONVENIENCIA : Implica el empleo de una muestra integrada por las personas o los objetos cuya disponibilidad como sujetos de estudio sea ms conveniente.

    Las muestras por conveniencia no constan necesariamente de individuos que el investigador conozca.

    Las chicas los prefieren

    flaquitos!

    El muestreo por convenien- cia es la tcnica menos slida, pero tambin la que ms se utiliza en los estudios de ciencias de la

    salud.

    Cuando los fenmenos que se investigan son suficientemente homogneos en la poblacin, se reduce el riesgo de sesgo. Muestreo por CUOTAS : En el muestreo por cuotas el investigador identifica estratos de la poblacin y establece las proporciones de elementos necesarias a partir de los distintos segmentos estratificados.

    Muestreo por cuotas?

    Con base en informacin previa acerca de la composicin de la poblacin, el investigador se asegura de que los diversos segmentos o sectores estn representados en la muestra en las mismas proporciones en que se presentan en la poblacin.

    El muestreo por cuotas no requiere de la aplicacin de tcnicas complejas ni la inversin de una cantidad extraordinaria de tiempo o esfuerzos, salvo por la identificacin de estratos y la representacin proporcional correspondiente, la tcnica de muestreo por cuotas es muy semejante a la de conveniencia.

    Este muestreo comparte muchas de las deficiencias de la tcnica de conveniencia.

    Muestreo INTENCIONAL : Se basa en la idea de que el investigador puede usar sus conocimientos acerca de la poblacin para elegir los casos que incluir en la muestra. El investigador debe seleccionar la variedad ms amplia posible de personas o los sujetos que a su juicio son caractersticos de la poblacin que le interesa o que disponen de mayor informacin acerca del tema de estudio. Si bien esta forma subjetiva de muestreo no ofrece un mtodo externo y objetivo para evaluar cun tpicos de la poblacin son los sujetos seleccionados, puede representar ciertas ventajas en circunstancias como la evaluacin preprueba de instrumentos recin desarrollados con una muestra de diversos tipos de sujetos intencionalmente elegidos.

    El muestreo intencional se aplica a menudo se busca una muestra de expertos, como cuando se desea aplicar una prueba de deteccin de necesidades con base en la tcnica del informante clave.

    MUESTREO PROBABILSTICO En este tipo de muestreo cada miembro de la poblacin tiene una probabilidad, conocida y superior a cero, de ser incluido en la muestra y las unidades muestrales hacen parte de la muestra independientemente del criterio o gusto del investigador.

    Es el MEJOR MTODO para asegurar la validez de cualquier inferencia o generalizacin hecha con base en los resultados obtenidos a partir de la muestra.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    18

    Clasificacin El muestreo probabilstico se clasifica en: Muestreo ALEATORIO SIMPLE o Irrestricto: Es la tcnica considerada como la ms sencilla en el muestreo probabilstico. En ella, cada sujeto o unidad tiene una probabilidad igual y conocida de ser seleccionado. Todas las unidades estn adecuadamente identificadas.

    Asi de fcil es el

    Muestreo aleatorio simple!

    Supone que no existen razones para considerar que un conjunto especfico de la poblacin debe ser seleccionada con prioridad a otro.

    Debido a estas importantes caractersticas, las muestras aleatorias simples son consideradas relativamente libre de sesgos.

    Forma de seleccionar una muestra Este mtodo se realiza en poblaciones pequeas , lo que permite identificar y enumerar todos los elementos de la poblacin de manera unvoca y exacta. Qu se requiere para el muestreo? A travs de algn procedimiento (tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora o una lista aleatoria generada por paquetes estadsticos) se elige a tantos participantes como sea necesario para completar el tamao de muestra requerido.

    Aplicacin prctica Como puede verse en la fig. 1 primero debemos seleccionar de una poblacin una muestra. Luego de seleccionar la muestra hay que determinar los estadsticos: x=Media s=Desviacin standard

    s2 =

    Varianza p=Proporcin n=Tamao Luego estos estadsticos deben ser extrapolados a la poblacin para obtener los parmetros. = Media = Desviacin standard

    2=

    Varianza =Proporcin N=Tamao Fig 1. Muestreo aleatorio simple Muestreo ALEATORIO SISTEMTICO : Este procedimiento se caracteriza por seleccionar las unidades de muestreo empleando un intervalo de medida constante sobre el marco muestral. No requiere la enumeracin de las unidades del marco muestral; solamente basta con que estn fsicamente ordenadas en un orden ascendente o descendente, para permitir el conteo.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    19

    La aplicacin de este procedimiento requiere determinar de manera inicial el: -Intervalo muestral (k) intervalo que se calcula dividiendo N / n N = tamao de la poblacin total n= tamao de la muestra calculada

    Aproximando el resultado al nmero entero ms prximo.

    La variable de inters es una variable que puede influir en los resultados del estudio. Ej. Si se quiere determinar la media de la talla de un grupo de alumnos de un colegio mixto ,es necesario ordenar a los alumnos por la variable sexo, ya que la talla va a depender del sexo. El sexo es una variable que va a influir en la media de la talla que se va a determinar. Para hacer esta divisin vamos a tener una constante que se denomina como K . Por ejemplo: N = 300 (poblacin total) n = 60 (tamao de la muestra) N / n =300/60 = K = 5 Se selecciona al azar el nmero .

    hasta completar el tamao de la muestra requerido se localizan las unidades del marco muestral corres-pondientes a los valores obtenidos.El primer elemento por lo tanto es , el segundo elemento es el resultado de la suma de , el tercer elemento se halla sumando , el cuarto elemento resulta de la suma de , el quinto elemento sumando , el sexto elemento

    resulta de la suma de y as sucesivamente hasta completar el tamao de la muestra que es Fig.2 Muestreo aleatorio sistemtico Aplicacin prctica Como puede verse en la fig. 1 tenemos una poblacin que debe ser ordenada en base a una variable que nos interesa controlar. Una vez ordenada la poblacin hay que calcular el valor de K. N = 40 y n = 8 N/n = K = 5 En este ejemplo el valor elegido entre 1 y K es 3. hasta completar el tamao de la muestra requerido 1 elemento : 3+5= 8 ; 2 elemento: 8+5= 13 ; 3 elemento : 13 +5 = 18 y as sucesivamente hasta completar el tamao de la muestra que es 40. y extrapolamos los valores de los estadsticos a la poblacin para obtener los parmetros. Muestreo ESTRATIFICADO : En algunas ocasiones la poblacin que se desea estudiar est compuesta por subgrupos bien definidos que pueden ser identificados con anterioridad al proceso de seleccin de la muestra.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    20

    La caracterstica de inters en el estudio vara ampliamente entre esos subgrupos definidos, es decir, existe gran heterogeneidad entre ellos; en tanto que dentro de cada subgrupo la variabilidad es poca, es decir, existe homogeneidad dentro del subgrupo.

    Muestreo estratificado : Dios los cra y ellos se

    juntan

    Estratificacin de la poblacin La estratificacin en algunas ocasiones puede obedecer a caractersticas de tipo espacial, tales como el sitio de vivienda, lo cual puede identificar una clase econmica determinada que sigue ciertos comportamientos sociales, polticos, econmicos y culturales.

    Existen diferentes formas de realizar la seleccin de las unidades dentro de los estratos: Afijacin igual: Consiste en distribuir equitativamente el tamao de la muestra en cada uno de los estratos de la poblacin; requiere conocer el nmero de estratos existentes.

    Afijacin proporcional: La distribucin del tamao de muestra se realiza porcentualmente segn tamao de cada estrato dentro de la poblacin; por tanto, requiere conocer el nmero de estratos y el tamao porcentual de cada uno en la poblacin.

    Afijacin ptima: Requiere conocer adems del nmero de estratos y el tamao porcentual de estos en la poblacin, la desviacin estndar poblacional en cada estrato. Consiste en balancear la variabilidad dentro de los estratos con su tamao.

    Ignorar la heterogeneidad que presenta la caracterstica de inters sobre el marco muestral puede llevar a que las estimaciones obtenidas a partir de la muestra difieran considerablemente de los verdaderos valores de la poblacin.

    Tenemos una poblacin bastante heterognea por lo que vamos a formar estratos para tratar de homogenizar la poblacin en cada uno de los estratos. Fig.3 Muestreo Estratificado

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    21

    En el ejemplo de la fig. 3 estamos formando 2 estratos para tratar de homogenizar los elementos en el estrato que estamos determinando. La variable que vamos a utilizar para estratificar la poblacin, es una variable que sabemos que puede influir en los resultados del estudio. Una vez determinados los estratos el siguiente paso es seleccionar una muestra de cada uno de los estratos ,. La seleccin de la muestra se puede realizar utilizando el: -Muestreo aleatorio simple -Sistemtico.

    Una vez obtenida la muestra determinamos los estadsticos. Extrapolamos los valores de los estadsticos a la poblacin para obtener los parmetros. Muestreo por CONGLOMERADOS o Complejos Los conglomerados son agrupaciones de elementos que existen naturalmente (no los define el investigador) por razones econmicas, biolgicas, sociales, etc. (el hogar, el curso de estudiantes de un colegio, un municipio o ciudad). Una muestra por conglomerados es una muestra aleatoria simple en la cual las unidades muestradas son grupos de unidades del marco muestral.

    DESVENTAJA

    Este muestreo tiende a contener ms errores de muestreo que los de tipo simple o estratificado.

    VENTAJA

    Sin embargo es mucho ms econmico y prctico que otras variantes de muestreo probabilstica, en particular cuando la poblacin es grande y se halla dispersa.

    Se tiene una poblacin bastante heterognea y

    grande, como por ejemplo la poblacin de un

    distrito , de una provincia o de un pas.

    Los conglomerados tienen las siguientes

    caractersticas: -Dentro de cada conglomerado debe haber la mayor heterogeneidad posible. Entre los conglomerados debe haber la mayor homogeneidad posible.

    Fig.4 Muestreo por conglomerados -El tamao de los conglomerados no necesariamente es el mismo. Al no ser del mismo tamao la probabilidad de seleccin de cada sujeto va a variar en cada conglomerado. Por lo tanto no todas las unidades de muestreo tienen las misma probabilidad de ser seleccionadas. -Una vez que se han formado los conglomerados vamos a seleccionar de todos estos una muestra de los conglomerados. Este muestreo se puede hacer con :

    . Muestreo aleatorio simple

    . Muestreo aleatorio Sistemtico. -Se ha seleccionado una muestra de los conglomerados pero que sigue siendo demasiado grande, es por eso que dentro de cada conglomerado vamos a seleccionar una muestra de cada conglomerado En la muestra de cada conglomerado estimamos los estadsticos y luego extrapolamos los valores de los estadsticos a la poblacin para obtener los parmetros (este proceso es difcil).

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    22

    Ms datos: Como puede verse en el ejemplo de la fig.4 en la seleccin de la muestra de los conglomerados (1ra. etapa) se utiliza el muestreo aleatorio Simple y para seleccionar la muestra de cada conglomerado (2da. etapa) es decir los elementos o unidades de muestreo se puede utilizar el muestreo aleatorio sistemtico.

    TAMAO DE LA MUESTRA Segn Fisher, el tamao de la muestra debe definirse partiendo de los criterios: Con relacin al primer criterio la recomendacin es siempre tomar la muestra mayor posible. La lgica nos indica que entre ms grande sea sta mayor posibilidad tendr de ser ms representativa y menor ser el error de muestreo, el cual siempre existe.Fisher plantea que el tamao de la muestra deber ser suficiente para permitir un anlisis confiable de los cruces de variables, para obtener el grado de precisin requerido en la estimacin de proporciones, y para probar si las diferencias entre proporciones son estadsticamente significativas.

    Otro de los conceptos bsicos Otro de los conceptos bsicos al usar las herramientas estadsticas es la diferencia entre los resultados de una muestra seleccionada (estimadores) y el valor poblacional de inters (parmetros).

    Cuando se selecciona una muestra especfica, esa muestra seleccionada es una de las posibles muestras que se pudo haber seleccionado. Por esta razn, existen procesos inferenciales que permiten extrapolar los resultados de una muestra aleatoria seleccionada a la poblacin de estudio.

    Uno de los criterios durante la planeacin de la seleccin de una muestra es obtener estimadores confiables para alcanzar los objetivos del estudio.

    Es necesario equilibrar los recursos, la logstica de la seleccin, el proceso de recoleccin y el anlisis de la muestra seleccionada. Por estas razones, existe un tamao de muestra especfico para cada diseo de muestreo y para los diferentes diseos de investigacin en salud.

    Adicionalmente, se quiere ganar eficiencia en el clculo del tamao de la muestra, involucrando dentro de la frmula los elementos del tipo de diseo implementado en el estudio. Adems, si se trata de un estudio exploratorio, los requisitos para calcular el tamao de la muestra son menores en cantidad si se les compara con estudios en los que el objetivo sea la evaluacin de una intervencin.

    El tamao de la muestra debe ser calculado siempre en la fase de planeacin, para permitir la planeacin adecuada del estudio, para programar las estrategias de recoleccin, determinar los costos, preparar las intervenciones y procedimientos de evaluacin y en general para determinar la factibilidad general.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    23

    DEFINICIN

    Estadstica inferencial es el conjunto de mtodos estadsticos que permiten deducir (inferir) cmo se distribuye la poblacin bajo estudio, a partir de la informacin que proporciona una muestra representativa obtenida de dicha poblacin.

    La estadstica inferencial extrapola los datos ob-tenidos de una muestra hacia la poblacin de la cual ha sido seleccionada la muestra que hemos estudiado.

    CLASIFICACIN

    Existen dos tipos bsicos de estadstica diferencial: -Estadstica paramtrica -Estadistica no-paramtrica

    Estadstica paramtrica

    Es la estadstica que se recomienda por tener mayor potencia, se trata de tcnicas ms precisas.

    Para que la estadstica inferencial proporcione buenos resultados debe cumplir con 3 requisitos: -Distribucin normal de los datos en la poblacin -Muestra aleatoria (representativa de la poblacin) -Datos cuantitativos: contnuos, discretos o de intervalo o razn.

    Tcnicas paramtricas

    Cuadro n 1 : Caractersticas comunes de las pruebas paramtricas.

    1. Independencia de las observaciones a excepcin de datos pareados.

    2. Las observaciones para la variable dependiente se han obtenido de manera aleatoria de una poblacin con distribucin normal.

    3. La variable dependiente es medida al menos en una escala de intervalo.

    4. Se recomienda un tamao de muestra mnimo de 30 sujetos por grupo.

    5. Los datos son obtenidos de poblaciones que tienen varianzas iguales (una varianza no debe ser el doble o mayor que la otra).

    6. Habitualmente las hiptesis se hacen sobre valores numricos, especialmente el promedio de una poblacin (), como ejemplo: Ho: 1 = 2 H1: 1 2

    7. Otros posibles requisitos: variable independiente nominal o de intervalo, homocedasticidad (para cada nivel de la variable independiente hay una variacin similar de la variable dependiente) y casillas de igual tamao.

    Cuadro N2 : Valoracin de las caractersticas de los datos. 1. Determinar el nivel de medida de la variable de inters.

    2. Valorar la distribucin de las variables.

    Medidas de tendencia central para cada variable.

    Sesgo y curtosis para cada variable.

    Valoracin visual de la distribucin de los datos.

    Examinar los diagramas de las probabilidades de la distribucin.

    Si se considera necesario transformar las variables.

    Ver los resultados de la transformacin.

    3. Ver la homogeneidad de las varianzas.

    4. Ver el tamao de muestra total y de los subgrupos.

    5. Determinar qu prueba estadstica paramtrica o no paramtrica es la ms adecuada.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    24

    Estadstica no paramtrica Si los procedimientos estadsticos no requieren plantear inferencias acerca de los parmetros de la poblacin (su media y dispersin) se le conoce como no paramtricos, o de distribucin libre (ya que no se hacen suposiciones acerca de la distribucin de la poblacin de donde procede la muestra.

    Es la alternativa para cuando no se puedan utilizar las tcnicas paramtricas.

    -No hay requisitos para la muestra -Se pueden utilizar tanto datos cualitativos como cuantitativos. -Datos cualitativos: nominal u ordinal

    Tcnicas no paramtricas para datos cuantitativos Tcnicas no paramtricas para datos cualitativos

    Cuadro 3. Caractersticas comunes de las pruebas no paramtricas.

    1. Independencia de las observaciones aleatorias a excepcin de datos pareados.

    2. Pocas asunciones con respecto a la distribucin de la poblacin.

    3. La variable dependiente es medida en escala categrica.

    4. El punto primario es el ordenamiento por rangos o por frecuencias.

    5. Las hiptesis se hacen sobre rangos, mediana o frecuencias de los datos.

    6. El tamao de muestra requerido es menor (20 o

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    25

    ANALISIS ESTADSTICO Tabla N1 Tcnicas de anlisis estadstico Preguntas bsicas en el anlisis estadstico

    1 Qu tipo de muestra nos estn presentando en el problema? La muestra es independiente o dependiente? Independiente: la seleccin de los elementos no depende de la seleccin de otras unidades o elementos.

    En este caso tenemos muestras pareadas. Por ejemplo: si estamos haciendo un muestreo de tipo pareado por una variable que nos interesa (por ejemplo el sexo), si selecciono un sujeto del sexo femenino el siguiente sujeto tambin tiene que ser femenino. El mximo grado de apareamiento lo tendremos cuando estamos haciendo estudios en los cuales los sujetos son grupo control y grupo de intervencin.

    2 Es una variable cualitativa o cuantitativa? 3 Cuntos grupos se estn comparando en el problema? 4 Qu tipo de distribucin tiene la variable que nos estn presentando?

    Luego de responder las 4 preguntas podemos identificar cual es la prueba estadstica que le corresponde.

    CASO: Se compara la talla promedio entre 2 grupos de nios que recibieron distintos patrones de alimentacin. Cada grupo comprenda 25 nios. Seale la prueba de significacin estadstica ms apropiada para analizar los datos: a)Prueba de Chi cuadrado bPrueba Z cPrueba t de student dPrueba de Spearson ePrueba de Mc Nemar Comentario Para resolver este caso es necesario formular varias preguntas: Cuando estamos frente a un problema y no nos dicen que la muestra es dependiente o independiente debemos asumir que es independiente.

    En el caso que estamos viendo no nos indican si la muestra es dependiente o independiente por lo que asumimos que es una muestra independiente. La variable que se va a comparar es la talla , la cual es una variable de tipo cuantitativa. En este ejemplo nos dicen explcitamente que se estn comparando 2 grupos. En este ejemplo no nos indican el tipo de distribucin de los datos, pero si nos dicen de manera implcita que los datos tienen distribucin normal, cuando nos

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    26

    indican que lo que se va a comparar es la talla promedio o sea la media de la talla. Si se van a comparar 2 medias , la condicin es que tengan una distribucin normal.

    CASO: En un ensayo clnico se comparan las cifras de glucosa en una muestra de sujetos representativa de una comunidad antes y despus de la aplicacin de un determinado tratamiento hipoglucemiante cuya eficacia queremos comprobar Cul prueba estadstica es ms adecuada para analizar los datos obtenidos? a)Test de la t de Student para datos independientes b)Anlisis de varianza c)Test de la t de student Fisher para los datos apareados d)Test de comparaciones mltiples e)Chi cuadrado Comentario Para resolver este caso es necesario formular varias preguntas: Como es un estudio antes y despus los sujetos son los mismos, por lo que es una muestra de tipo dependiente. Lo que se quiere comparar son los niveles de glucosa , la cual es una variable cuantitativa. A pesar que el estudio es de un solo grupo de sujetos, se consideran como 2 grupos debido a que los mismos sujetos estn antes de la intervencin y despus de la misma se vuelve a hacer la medicin. En este caso no se menciona ni implcita ni explcitamente cual es la distribucin de los datos , es

    por eso que tenemos que ir a las alternativas de la respuesta. a)Test de la t de Student para datos independientes La T de Student para datos independientes se usa cuando las muestras son independientes. En este ejemplo la muestra es dependiente por lo que no es el test estadstico apropiado. b)Anlisis de varianza Lo utilizamos cuando queremos comparar 2 ms grupos , la variable independiente es de tipo cuantitativa pero el tipo de muestra tambin tiene que ser independiente por lo tanto no es la alternativa correcta. c)Test de la t de student Fisher para los datos apareados La T de Student para datos pareados se usa cuando: Por lo que es la alternativa correcta. d)Test de comparaciones mltiples Se utiliza despus de realizar el Test de ANOVA para ver si hay alguna diferencia entre las medias que se estn comparando. El test de ANOVA nos dice que hay una diferencia significativa entre las medias que se estn comparando y el Test de comparaciones mltiples nos dice entre que medias hay esa diferencia significativa. Es falsa. e)Chi cuadrado Se utiliza para variables de tipo cualitativo Estadstica paramtrica

    Estadstica paramtrica Cuando se pretende probar una hiptesis respecto a uno o ms parmetros de una poblacin que tiende a una distribucin normal, las pruebas usadas son las de la estadstica paramtrica, como la t de Student (cuadro N2)

    Aunque la potencia de las pruebas estadsticas paramtricas es mayor que la que ofrecen las pruebas no paramtricas, ya que con ellas se tiene la probabilidad de rechazar la hiptesis nula cuando sta realmente es falsa (error de tipo II: 1-). El adecuado tamao de la muestra es un requisito indispensable para aumentar la eficacia de una prueba: a medida que aumenta el tamao de muestra, disminuye la posibilidad de cometer el error de tipo II.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    27

    Tabla N 2. Pruebas paramtricas y su alternativa no paramtrica. Es conveniente comentar que el adecuado tamao de muestra es un requisito indispensable para aumentar la eficacia de una prueba. PRUEBAS CON UNA SOLA MUESTRA

    Ji cuadrada Esta prueba de hiptesis se usa para comparar la posible diferencia entre las frecuencias observadas en la distribucin de una variable con respecto a las esperadas, en razn de una determinada hiptesis. Prueba binomial La prueba binomial compara las frecuencias observadas en cada una de las dos categoras de una variable dicotmica con respecto a las frecuencias esperadas bajo una distribucin binomial que tiene un parmetro de probabilidad especfico que, por defecto, para ambas categoras es 0.5. Para cambiar las probabilidades se puede ingresar una proporcin de la prueba para el primer grupo por lo que la probabilidad para el segundo ser 1 menos la probabilidad especificada para el primero.

    Se asume que:

    Esto quiere decir que si la variable no es dicotmica se deben colapsar los datos en 2 categoras mutuamente excluyentes.

    Esta proporcin terica puede venir de registros pblicos, censos o investigaciones previas. La prueba binomial est indicada cuando la variable a ser examinada es dicotmica, es especialmente til en casos de tamao de muestra pequeos, que no cumplen los requisitos de la bondad de ajuste de la Ji cuadrada.

    Prueba de las rachas La prueba de las rachas mide hasta qu punto en una variable dicotmica la observacin de uno de sus atributos puede influir en las siguientes observaciones; es decir, si el orden de ocurrencia en la observacin de uno de los atributos de una variable dicotmica ha sido por azar.

    Una serie de datos en los que hay muchas o pocas rachas, hacen pensar que stas no han ocurrido por azar. Alternativa: para probar que dos muestras vienen de poblaciones con las mismas distribuciones, se emplea la prueba de rachas sugerida por Wald-Wolfowitz. Prueba de Kolmogorov-Smirnov Para una muestra

    La prueba se usa para definir si el grado de ajuste de los datos a una distribucin terica: que puede ser con tendencia a la normal, a la de Poisson o exponencial.

    La prueba Z de Kolmogorov-Smirnov (K-S), se computa a partir de la diferencia mayor (en valor absoluto) entre la distribucin acumulada de una muestra (observada) y la distribucin terica.

    La bondad de ajuste de la muestra permite suponer de manera razonable, que las observaciones pudieran

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    28

    corresponder a la distribucin especfica. La contribucin de Kolmogorov corresponde al problema relacionado con una sola muestra, mientras que la de Smirnov se ocupa de responder al problema respecto a dos muestras, tratando de probar la hiptesis de igualdad entre las poblaciones de origen de una con respecto a la de la otra.

    La prueba de K-S no precisa que las observaciones sean agrupadas (como es el caso de la Ji cuadrada).

    Se usa en cualquier muestra de cualquier tamao, mientras que la Ji cuadrada requiere muestras con un tamao mnimo. Esta prueba no se debe usar cuando los parmetros tienen que ser estimados a partir de la poblacin y es til, especialmente cuando se conoce la estructura en que subyace la distribucin de la variable en estudio. Es ms poderosa que la Ji cuadrada, especialmente cuando el tamao de la muestra es pequeo y el nivel de medicin de la variable es ordinal.

    Alternativa: No hay opcin paramtrica. Una alternativa no paramtrica es la prueba de bondad de ajuste de Ji cuadrada. PRUEBAS DE DOS MUESTRAS

    INDEPENDIENTES

    Las pruebas de dos muestras independientes comparan dos grupos de casos con una variable.

    Hay disponibles cuatro pruebas para ver si las dos muestras independientes (grupos) vienen de la misma poblacin y son: U de Mann-Whitney Es la ms popular de las pruebas para el estudio de dos muestras independientes.

    Es equivalente a la prueba de suma de rangos de Wilcoxon y a la prueba de dos grupos de Kruskal-Wallis.

    Es la alternativa no paramtrica a la comparacin de dos promedios independientes a travs de la t de Student. Tiene tres asunciones:

    El nmero de pares debe ser pequeo en relacin al nmero total de observaciones. Si las poblaciones son idnticas en situacin, los rangos deben mezclarse al azar entre las dos muestras.

    Se calcula el nmero de veces que una cuenta del grupo 1 precede una cuenta del grupo 2 y el nmero de veces que una cuenta del grupo 2 precede una cuenta del grupo 1.

    t de Student Es la alternativa paramtrica para muestras independientes, que es ms poderosa que la U de Mann-Whitney cuando se llenan todas las asunciones, mientras que si los datos no se distribuyen normalmente, el tamao de muestra es pequeo, los grupos son de diferente tamao.

    Una alternativa no paramtrica que puede ser utilizada, sobre todo si las colas de la distribucin no son similares es la prueba de la mediana.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    29

    Prueba Z de Kolmogorov-Smirnov Est basada en la diferencia absoluta mxima entre la funcin de distribucin acumulada observada para ambas muestras. Cuando esta diferencia es significativamente grande, las dos distribuciones son consideradas diferentes. La prueba de las reacciones extremas de Moses asume que la variable experimental afecta algunos sujetos en una direccin y otros sujetos en la direccin opuesta.

    Prueba de rachas de Wald-Wolfowitz Es una alternativa no paramtrica para contrastar si dos muestras con datos independientes proceden de poblaciones con la misma distribucin. Combina y acomoda las observaciones de ambos grupos. Si las dos muestras son de la misma poblacin, los dos grupos deben distribuirse al azar a lo largo de la clasificacin jerrquica. Si hay pocas rachas habla de que se tratan de grupos diferentes mientras que, si hay muchas rachas no hay diferencias significativas en la distribucin de los dos grupos.

    MIR: Un investigador est interesado en determinar

    si existe una asociacin entre las cifras de tensin arterial diastlica (medida en mm de Hg) y los niveles de colesterol (medidos en mgr/ml). Para ello, ha realizado estas mediciones a 230 voluntarios. Qu prueba estadstica es la ms apropiada para examinar esta asociacin?: a)Regresin logstica. b)Prueba de la t. c)Prueba de chi cuadrado. d)Correlacin de Pearson. e)Prueba de Fisher. Rpta. D

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    30

    Prueba de hiptesis

    Definicin

    Es el mtodo para desarrollar un procedimiento para probar la validez de una aseveracin acerca de un parmetro poblacional .

    Objetivo

    El propsito de la prueba de hiptesis no es cuestionar

    el valor calculado del estadstico (muestral), sino hacer

    un juicio con respecto a la diferencia entre estadstico de

    muestra y un valor planteado del parmetro.

    Procedimiento sistemtico para una prueba

    de hiptesis de una muestra

    La hiptesis nula (Ho)

    se refiere siempre a un valor especificado del parmetro de pobla- cin, no a una esta- dstica de muestra.

    La letra H significa hiptesis y el subndice cero no hay diferencia.

    Por lo general hay un "no" en la hiptesis nula que indica que "no hay cambio" Podemos rechazar o aceptar la Ho.

    La hiptesis alternativa (H1) es

    cualquier hiptesis que difiera de la hiptesis nula. Es una afirmacin que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hiptesis nula es falsa.

    Nivel de significacia: Probabilidad de rechazar la hiptesis nula cuando es verdadera.

    Se le denota mediante la letra griega , tambin es denominada como nivel de riesgo.

    Si suponemos que la hiptesis planteada es

    verdadera, entonces, el nivel de significacin

    indicar la probabilidad de no aceptarla, es decir, que

    estn fuera del rea de aceptacin.

    Nivel de confianza (1-): indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera en la poblacin.

    La distribucin de muestreo de la estadstica de

    prueba se divide en dos regiones:

    -Regin de rechazo (conocida como regin crtica)

    -Regin de no rechazo (aceptacin).

    Si la estadstica de prueba cae dentro de la regin de

    aceptacin, no se puede rechazar la hiptesis nula.

    La regin de rechazo puede considerarse como

    el conjunto de valores de la estadstica de prueba que

    no tienen posibilidad de presentarse si la hiptesis nula

    es verdadera.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    31

    Tipos de errores

    Cuando realizamos una prueba de hiptesis estamos haciendo un test de significancia para ver si la hiptesis

    nula es verdadera o falsa.

    Cualquiera sea la decisin tomada a partir de una

    prueba de hiptesis, ya sea de aceptacin de la Ho o de la Ha, puede incurrirse en error.

    Error tipo I

    Un error tipo I se presenta si la hiptesis nula Ho siendo verdadera es rechazada por el test de significancia (Fig 1)

    La probabilidad de cometer un error tipo I se denomina con la letra alfa .

    Error tipo II

    Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada cuando de hecho es falsa y deba ser

    rechazada (Fig. 1)

    Fig 1. Tipos de error

    Decisin correcta

    Una decisin correcta se presenta si la hiptesis nula Ho es falsa y es rechazada por el test de significancia.

    Una decisin correcta tambin se presenta si la hiptesis nula Ho es verdadera y no es rechazada por el test de significancia (FIg. 1)

    Error tipo I (alfa)

    Una error tipo I se presenta si la hiptesis nula Ho es verdadera (en el estado real) y es rechazada por el test de significancia (FIg. 2)

    Nivel de significancia

    Tambin se conoce al error de tipo I como nivel de significancia y por convencin se considera que este

    error de significancia debe ser de 5%.

    Nivel de confianza

    Es el complemento del nivel de significancia, cuyo valor debe ser de 95%:

    La suma del nivel de significancia ms el nivel de confianza siempre debe ser 100%, lo que gana uno de ellos lo pierde el otro. Ejemplo: si el nivel de significancia aumenta a 10% , el nivel de confianza disminuye a 90%).

    Fig 2. Otros tipos de error

    Error tipo II (beta)

    Una error tipo II se presenta si la hiptesis nula Ho es falsa (en el estado real) y no es rechazada por el test de significancia (FIg. 2)

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    32

    Por convencin el error de tipo II tiene un valor de 20%.

    Potencia

    Es el complemento del error de tipo 2, su valor es de 80%.

    Si incrementamos el valor del error de tipo II la potencia disminuye.

    Si aumentamos la potencia se disminuye la probabilidad de cometer un error de tipo II.

    La suma de la potencia ms el error de tipo II siempre debe dar 100%

    Ejemplo:

    Tenemos un reo en la vida real, que puede ser inocente o culpable y un juez que da el veredicto.

    Fig. 3 Ejemplo de tipo de error

    Decisin correcta

    Tenemos 2 posibilidades:

    Se produce cuando en la vida real el reo es realmente

    inocente y el veredicto del juez dice que es inocente.

    Se produce tambin cuando en la vida real el reo es

    culpable y el veredicto del juez dice que es culpable.

    Error

    Se produce tambin cuando en la vida real el reo es

    culpable y el veredicto del juez dice que es inocente.

    Error ms grave

    Se produce cuando en la vida real el reo es inocente y el

    veredicto del juez dice que es culpable.

    Si aplicamos lo anterior a Salud tenemos:

    -Cuando la hiptesis nula es falsa y el test de significancia la rechaza es un decisin correcta.

    -Cuando la hiptesis nula es verdadera y el test de significancia no la rechaza tambin es un decisin correcta.

    Error de tipo II

    -Cuando la hiptesis nula es falsa y el test de significancia no la rechaza es un error de tipo II.

    Si estamos probando la eficacia de un tratamiento, de una droga A sobre una droga B , en este caso se comete un error de tipo II cuando decimos que el tratamiento si tiene un efecto pero no lo percibimos. Es decir que hay diferencia entre el tratamiento A y B pero la prueba de significancia dice que no hay diferencia, no se rechaza la hiptesis nula. Se busca un tratamiento alternativo y no hay consecuencias adversas para el paciente.

    Error de tipo I (alfa)

    -Cuando en la vida real el tratamiento no tiene efecto pero el test de significancia nos dice que si tiene efecto , es decir rechazamos la hiptesis nula. Este error es ms grave que el error de tipo II porque se est dando al paciente una droga que en la vida real no tiene efecto para la enfermedad que estamos tratando . Se le da porque la prueba de significancia nos dice que si tiene efecto.

    Fig. 4 Ejemplo de tipo de error

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    33

    Ejemplo:

    Pregunta: Al comparar dos medias muestrales el rechazo de una hiptesis nula, que es verdadera, nos lleva a cometer un ERROR conocido como _________. a. Beta o Tipo II b. Aleatorio c. Estndar d. Alfa o tipo I e. Sistemtico

    Comentario:

    Estamos frente a una hiptesis nula que es verdadera y que ha sido rechazada por el test de significancia. Se trata de un error alfa (tipo I).

    Factores que influyen en el poder estadstico de un estudio.

    El tamao de la muestra a estudiar: A > tamao muestral, > potencia estadstica de un estudio.

    Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los errores de decisin. La nica forma de reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser posible.

    El nivel de significacin estadstica: Si se disminuye el valor de tambin se disminuye el poder de la prueba.

    Es decir, si disminuimos la probabilidad de cometer un error de tipo I, aumentamos la probabilidad de cometer un error de tipo II. Se debe encontrar un punto de equilibrio de cometer ambos errores. Habitualmente se trabaja con un nivel de significacin de 5% y un poder de 80%.

    Trminos estadsticos

    es la probabilidad de que nuestro resultado sea correcto: Probabilidad = (1-) 95%

    es el mximo error que estamos dispuestos a aceptar como vlida nuestra hiptesis. Es el error tipo I o . Probabilidad : 5%

    significancia estadstica ,es la cuantificacin probabilstica de error tipo I.

    representa la probabilidad de observar en la muestra una determinada diferencia y efecto, si existe en la poblacin.

    Cmo nos protegemos contra el error tipo I? p < 0,05 protege contra el error tipo I debido al chance. No garantiza proteccin contra el error tipo I debido a sesgo o confusin

    Cmo nos protegemos contra el error tipo II? -Estimando un tamao de muestra adecuado -Estableciendo grandes diferencias en nuestras hiptesis

    La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequea.

    .

    Existe una relacin inversa entre la magnitud de los errores y : conforme a aumenta, disminuye. Esto

    obliga a establecer con cuidado el valor de a para las pruebas estadsticas. Lo ideal sera establecer y .

    En la prctica se establece el nivel y para disminuir

    el Error se incrementa el nmero de observaciones

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    34

    en la muestra, pues as se acortan los lmites de confianza respecto a la hiptesis planteada .

    Cmo incrementamos la potencia de un estudio? -Incrementando el tamao de muestra -Estimando un tamao de muestra adecuado -Utilizando el mtodo ms preciso y exacto (menor variabilidad) para medir la exposicin y el efecto

    La meta de las pruebas estadsticas es rechazar la hiptesis planteada. Es deseable aumentar cuando sta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- ).

    La aceptacin de la hiptesis planteada debe interpretarse como que la informacin aleatoria de la muestra disponible no permite detectar la falsedad de esta hiptesis.

    Este valor es determinado a partir de la informacin muestral, que se utiliza para determinar si se rechaza la hiptesis nula , existen muchos estadsticos de prueba para nuestro caso utilizaremos los estadsticos z y t.

    Tipos de prueba

    la hiptesis planteada se formula con la igualdad

    Ejemplo

    H0 : = 200

    H1 : 200

    la hiptesis planteada se formula con o

    H0 : 200 H0 : 200

    H1 : < 200 H1 : > 200

    En las pruebas de hiptesis para la media (), cuando se

    conoce la desviacin estndar () poblacional, o cuando

    el valor de la muestra es grande (30 o ms), el valor

    estadstico de prueba es z y se determina a partir de:

    El valor estadstico z, para muestra grande y

    desviacin estndar poblacional desconocida se determina por la ecuacin:

    En la prueba para una media poblacional con

    muestra pequea y desviacin estndar poblacional desconocida se utiliza el valor estadstico :

    Se establece las condiciones especficas en la que se rechaza la hiptesis nula y las condiciones en que no se rechaza la hiptesis nula.

    La regin de rechazo define la ubicacin de todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la suposicin de que la hiptesis nula es verdadera, es muy remota.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    35

    Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha

    Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la regin en la que no se rechaza la hiptesis nula.

    Paso 5: Tomar una decisin.

    En este ltimo paso de la prueba de hiptesis, se

    calcula el estadstico de prueba, se compara con el

    valor crtico y se toma la decisin de rechazar o no la

    hiptesis nula.

    Tenga presente que en una prueba de hiptesis solo

    se puede tomar una de dos decisiones: aceptar o

    rechazar la hiptesis nula.

    Debe subrayarse que siempre existe la posibilidad de

    rechazar la hiptesis nula cuando no debera haberse

    rechazado (error tipo I). Tambin existe la posibilidad

    de que la hiptesis nula se acepte cuando debera

    haberse rechazado (error de tipo II)

    Prueba de CHI CUADRADO

    Es una de las pruebas estadsticas ms utilizadas ,va a

    depender si tiene una 2 variables.

    Fig.5 Test de Chi cuadrado

    PRUEBA DE BONDAD DE AJUSTE

    Cuando queremos decidir , a partir de una muestra, si la poblacin sigue (ajusta) una determinada distribucin (problema de bondad de ajuste).

    Supongamos que tenemos un nmero k de clases en las cuales se han ido registrado un total de n observaciones (n ser el tamao muestral). Denotaremos las frecuencias observadas en cada clase por O1, O2, ..., O k

    (Oi es el nmero de valores en la clase Ai ). Se cumplir:

    E1 + E2 + ... + E k = n

    Se tratar ahora de decidir si las frecuencias

    observadas estn o no en concordancia con las

    frecuencias esperadas (es decir, si el nmero de

    resultados observados en cada clase corresponde

    aproximadamente al nmero esperado). Para

    comprobarlo, haremos uso de un contraste de

    hiptesis usando la distribucin Chi-cuadrado:

    El estadstico de contraste ser

    Observar que este valor ser la suma de k nmeros no negativos.

    El numerador de cada trmino es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto ms cerca estn entre s ambos valores ms pequeo ser el numerador, y viceversa. El denominador permite relativizar el tamao del numerador. 2

    Por el contrario, valores grandes de este estadstico indicarn falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hiptesis nula (los valores observados son coherentes con los esperados) cuando el estadstico es mayor que un determinado valor crtico.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    36

    Prueba de HOMOGENEIDAD

    Cuando queremos decidir si dos o ms muestras provienen de la misma poblacional Estas muestras provienen de poblaciones con la misma distribucin? Estamos interesados en determinar si los datos correspondientes a dos o ms muestras aleatorias provienen de la misma poblacin. Nuevamente el conjunto de posibles valores de las observaciones se divide en k conjuntos disjuntos: A1, A2, ..., Ak. ; clasificando en ellos las observaciones de cada muestra. Si nij representa el nmero de observaciones de la muestra i que pertenecen al conjunto Aj , los datos pueden tabularse en lo que se denomina una tabla de contingencia. La hiptesis de que las m poblaciones son homogneas, se traduce en que cada conjunto Aj debe tener una probabilidad terica pj , desconocida, pero que no vara de la poblacin i a la poblacin i. Esto debe verificarse para todas las categoras, i.e., las categoras deben ser homogneas en las diversas muestras. Del mismo modo que la Prueba de Bondad de Ajuste, en este caso debemos comparar las frecuencias observadas en cada una de las muestras y para cada categora con las frecuencias bajo el supuesto de homogeneidad en las poblaciones. En este caso las frecuencias observadas corresponde al nmero de individuos de la muestra i en la clase j, i.e., nij El estadstico de contraste ser Donde eij es la frecuencia esperada bajo el supuesto de homogeneidad, que puede representarse como ni Pj , es decir, el nmero de individuos en la muestra i por la probabilidad de que ocurra la caracterstica j en la poblacin. Para el clculo de las probabilidades

    de pertenecer un individuo a cada una de las categoras podemos utilizar: Observar que este valor ser la suma de n*k nmeros no negativos. El numerador de cada trmino es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto ms cerca estn entre s ambos valores ms pequeo ser el numerador, y viceversa. El denominador permite relativizar el tamao del numerador. Las ideas anteriores sugieren que, cuanto menor sean el valor del estadstico 2, ms coherentes sern las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este estadstico indicarn falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hiptesis nula (los valores observados son coherentes con los esperados) cuando el estadstico es mayor que un determinado valor crtico

    Prueba de INDEPENDENCIA

    Se trata de contrastar si dos variables cualitativas son independientes (es decir, si existe relacin entre ellas), o no. Por ejemplo: Los hbitos de lectura de los padres influyen en los hbitos de lectura de los hijos? Estamos interesados en determinar si dos cualidades o variables referidas a individuos de una poblacin estn relacionadas. Se diferencia de los contrastes anteriores en que en este caso estamos interesados en ver la relacin existente entre dos variables de una misma poblacin, no queremos contrastar la distribucin terica de una variable (prueba de bondad de ajuste) ni en comparar la distribucin de una nica variable en dos poblaciones (prueba de homogeneidad). Supongamos que de n elementos de una poblacin se han observado dos caractersticas X e Y, obtenindose una muestra aleatoria simple bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre la base de dichas observaciones se desea contrastar si las caractersticas poblacionales X e Y son independientes o no. Para ello se dividir el conjunto de posibles valores de X en k conjuntos disjuntos

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    37

    A1,A2,...,Ak; mientras que el conjunto de posibles valores Y ser descompuesto en r conjuntos disjuntos: B1,B2,...,Br . Al clasificar os elementos de la muestra, aparecer un cierto nmero de ellos, ijn , en cada una de las k r clases as constituidas, dando lugar a una tabla de contingencia de la forma: Al igual que para el Test de homogeneidad, el estadstico del contraste ser:

    EJEMPLO: Hemos preguntado a un grupo de 20 hombres y 20 mujeres si fumaban o no. Crees que hay diferencias significativas entre ambos sexos? Tenemos una tabla con la distribucin de los 20 hombres y 20 mujeres. El total de los hombres y mujeres estn en las columnas y en las filas el total de los que fuman y los que no fuman. En total son 40 sujetos.

    A los totales se les llama totales marginales

    En este caso vamos a estimar las frecuencias esperadas para las 4 celdas a, b, c y d y obtenemos los totales marginales de las filas y de las columnas . Hay una frmula para obtener estas frecuencias que consiste en multiplicar los tatoles marginales dividiendo entre el total de observacin.

  • MANUAL de SALUD PBLICA ,EPIDEMIOLOGA y BIOESTADSTICA PLUS MEDIC A

    38

    Cmo obtenemos el Chi cuadrado?

    El Chi cuadrado es igual a la sumatoria de las frecuencias observadas (Oi) menos las frecuencias esperadas (Ei) elevadas al cuadrado sobre las frecuencias esperadas.

    Los valores esperados en cualquiera de las celdas siempre deben de ser > o = a 5

    Si en una de las celdas el valor es menor a 5 NO podemos utilizar el valor del Chi cuadrado., debindose usar la prueba de Fisher exact ( ms frecuentemente utilizado) o la prueba de Correccin de yates. OF: En un estudio que compara la eficacia de dos

    frmacos no se observa una diferencia estadsticamente significativa entre ellos. Si en realidad ambos tratamientos fueran diferentes, todos los siguientes factores podran explicar por qu se ha obtenido un resultado "falso negativo", EXCEPTO uno. Selelo: a)Error tipo alfa. b)Error tipo beta. c)Potencia estadstica insuficiente. d)Nmero de sujetos estudiados insuficiente. e)Existencia de un sesgo en la comparacin. Rpta. A

    OF: En un contraste de hiptesis, la potencia es la

    probabilidad de: a)Rechazar la hiptesis nula siendo cierta. b)Rechazar la hiptesis nula siendo falsa. c)Aceptar la hiptesis alternativa. d)Que la hiptesis alternativa sea verdadera. e)Que la hiptesis nula sea falsa. Rpta. B

    OF: Un ensayo clnico evala dos pautas

    teraputicas en pacientes hipertensos. Para comparar los porcentajes de pacientes controlados observados en cada grupo a los 6 meses de tratamiento, qu prueba estadstica le parece ms adecuada?:

    a)t de Student para datos independientes. b)Anlisis de la varianza de medidas repetidas. c)Chi-cuadrado. d)t de Student para datos apareados. e)Anlisis de la varianza. Rpta. C