Bioestadística Cap II.1.1 m t Central

55
FACULTAD DE ENFERMERÍA BIOESTADÍSTICA ING. Q. ELÍAS CONTRERAS CORDERO LIC. EN GERONTOLOGÍA SAN FRANCISCO DE CAMPECHE, MARZO/13

description

bioestadistica inferencial

Transcript of Bioestadística Cap II.1.1 m t Central

  • FACULTAD DE ENFERMERABIOESTADSTICAING. Q. ELAS CONTRERAS CORDEROLIC. EN GERONTOLOGASAN FRANCISCO DE CAMPECHE, MARZO/13

  • ESTADSTICA INFERENCIALESTADSTICA SERIE SCHAWM, AUTORES: MURRAY R. SPIEGEL, LARRY J. STEPHENS EDITORIAL: MCGRAW-HILLPROBABILIDAD Y ESTADSTICA PARA CIENCIAS QUMICO BIOLGICAS, AUTOR: MARA JOS MARQUES DE CANT, EDITORIAL: MCGRAW-HILLBIOESTADSTICA, AUTOR: WAYNE W. DANIEL, EDITORIAL: LIMUSA WILEY

  • RESUMEN DE DATOS NUMRICOS.* PARMETROS- Caractersticas medibles de una poblacin.- Representadas por letras griegas.- Valor fijo para una poblacin dada.*ESTADSTICOS- Caractersticas medibles de una muestra, usadas para estimar parmetros poblacionales.- Representadas por letras latinas.- Variable para la poblacin, fija para la muestra dada.DEFINICIONES:

  • Resumen numrico de datos.* MEDIDAS DE LOCALIZACINValores que tienden a tipificar o representar mejor al conjunto de datos.

    *MEDIDAS DE TENDENCIA CENTRAL Media Aritmtica , Donde es la media poblacional y es la media muestral. Media Geomtrica G Media Armnica H Media Cuadrtica MC Mediana Mn Moda Mo SE INCLUYEN EN LAS MTC LOS CUANTILES Cuartiles, Quintiles, Deciles, Percentiles.

    * MEDIDAS DE DISPERSINMedida de informacin respecto a la cantidad de variabilidad presente en un conjunto de datos. Amplitud o Rango A El rango Semirrecorrido Intercuartlico Q El rango Percentilar 10-90 Varianza 2 s2 Desviacin Tpica Estandar s Coeficiente de Variacin V) Desviacin Tpica Media DMESTADSTICA SERIE SCHAWM, AUTORES: MURRAY R. SPIEGEL, LARRY J. STEPHENS EDITORIAL: MCGRAW-HILL, pAgs. 58 a 113

  • HOJA 1 DE 9RESUMEN DE DATOS NUMRICOSMedidas de Tendencia Central: Las medidas de tendencia central proporcionan informacin acerca de los valores cntricos de una variable a estudiar. Los valores medios nos darn una idea esencial a cerca del comportamiento de la variable, por ejemplo el promedio de los datos.Media Armnica HMediana Mn Moda Mo Media Aritmtica Las medidas de tendencia central como su nombre lo dice son clculos o evaluaciones que nos proporcionan idea del comportamiento del fenmeno en la parte cntrica de ste. En otras palabras las medidas de tendencia central se ocupan de medir el centro, el foco o el medio de un fenmeno. Algunas medidas son las siguientes:Media Cuadrtica MC Media Geomtrica G

  • POSICION DE UN DATO CON RESPECTO A LA MEDIA

  • MEDIDAS DE POSICIN

    Tambin llamadas de centralizacin o de tendencia central.

    Sirven para estudiar las caractersticas de los valores centrales de la distribucin atendiendo a distintos criterios.

  • ejemplo:

    Supongamos que queremos describir de una forma breve y precisa los resultados obtenidos por un conjunto de alumnos en un cierto examen; diramos: A)La nota media de la clase es de 6,5.B) La mitad de los alumnos han obtenido una nota inferior a 5. C) La nota que mas se repite es el 4,5.

  • En la expresin a) se utiliza como medida la media aritmtica o simplemente la media.

    En la b) se emplea como medida la mediana, que es el valor promedio que deja por debajo de ella la mitad de las notas y por encima de ella la otra mitad.

    Y en la c) se usa el valor de la nota que ms veces se ha repetido en ese examen, este valor es la moda.

  • media aritmtica es la medida ms utilizada ya que se puede calcular con exactitud y se basa en el total de las observaciones. Se emplea preferentemente en distribuciones simtricas y es el valor que presenta menores fluctuaciones al hacer variar la composicin de la muestra. Finalmente, la media aritmtica es especialmente til cuando se precisa despus calcular otros valores estadsticos, como desviaciones, coeficientes de correlacin, etc.

  • MEDIA ARITMTICA

    Normalmente se suele distinguir entre media aritmtica simple y media aritmtica ponderada.

    Media aritmtica simple: Es la suma de todos los elementos de la serie dividida por el nmero de ellos.

  • Se calcula como:

  • Siendo esta la mediaSuma de elementos

  • n : nmero de elementos incluyendo a los de igual valor

    k : nmero de elementos con distinto valor.

  • Media aritmtica ponderada Por lo general, en Estadstica, los datos se presentan agrupados mediante una distribucin de frecuencias que hace que no todos los elementos de la serie tengan el mismo peso especfico, y eso influye a la hora de calcular la media, por eso se llama media ponderada.

  • CMO SE DEFINE LA MEDIA ARITMETICA PONDERADA?Se define como la suma de los productos de cada elemento de la serie por su frecuencia respectiva, dividida por el nmero de elementos de la serie.

  • donde ni es la frecuencia o nmero de veces que se repite un valor. Tambin ni puede ser la ponderacin de cada valor xi.

  • EJEMPLO DE LA MEDIA ARITMETICA PONDERADADurante el mes de octubre de 1981 los salarios recibidos por un obrero fueron: Hallar el salario durante ese mes.

    Salario en pesosSalario en das.200.0005220.00015300.0004

  • Propiedades de la media aritmtica Las propiedades ms importantes son:

    La suma algebraica de las desviaciones de un conjunto de nmeros respecto de su media aritmtica es cero.La suma de los cuadrados de las desviaciones de un conjunto de nmeros con respecto a cualquier otro nmero es mnima cuando ese otro nmero es precisamente la media aritmtica.

  • Propiedades de la media aritmtica Si suponemos, antes de calcularla, que la media de un conjunto de nmeros es cualquier nmero A, resulta que la verdadera media aritmtica es:

  • Donde:A: media supuesta

    n: numero de elementos.SUMA DE LAS DESVIACIONES RESPECTO DE A

  • Clculo de la media aritmtica a partir de datos agrupados en clases. Hay dos mtodos principalmente para calcular la media de una distribucin con datos agrupados: mtodo directo (o largo) y mtodo abreviado (o corto).

  • Mtodo directo Consiste en aplicar la frmula ya vista para el clculo de la media ponderada, con la nica salvedad de que se toman como valores representativos de la variable los puntos medios de cada intervalo, que se denotan con xm.O sea:

  • Mtodo abreviado Consiste en elegir un intervalo en el que se supone que estar la media y llamamos A al valor de la media supuesta, que coincidir con el centro del intervalo elegido.Entonces aplicamos la frmula

  • Siendo d las desviaciones de las marcas de clase con respecto a la media supuesta A, y ni la frecuencia de cada intervalo.

    Este mtodo abreviado es ms rpido que el mtodo directo, pues las operaciones que hay que realizar son ms sencillas.

  • Mtodo clave Se diferencia fundamentalmente del mtodo abreviado en que en lugar de calcular las desviaciones d de cada marca de clase a la media supuesta, simplemente se escriben al lado de cada marca unos nmeros enteros d, que expresan el nmero de clases, ms uno, que hay desde la marca considerada a la marca que coincide con la media supuesta

  • A estos nmeros se les asigna signo menos si estn por debajo de la media considerada y signo ms si estn por encima.La frmula que se utiliza es la siguiente:

  • La mediana es preferida cuando la distribucin de los datos es asimtrica, y cuando los valores extremos estn tan alejados que distorsionaran el significado de la media. Tambin se calcula la mediana en aquellas distribuciones en las que existen valores sin determinar,

  • por ejemplo, aquellas cuya primera clase es del tipo menos que x, y la ltima clase: ms de y. En definitiva, lo ms importante de esta medida es que no se ve afectada por los valores extremos.

  • COMO CALCULAR LA MEDIANA.calculamos la mediana por alguna de estas dos frmulas, respectivamente:

  • La moda es una medida que no suele interesar especialmente, a no ser que haya tal concentracin de datos en la distribucin que un valor destaque claramente sobre todos los dems. Puede servir tambin para cuando queramos estimar de una forma rpida, y no muy precisa, una medida de tendencia central.

    MODA

  • La moda, al igual que la mediana, es un valor que no se ve afectado por los valores extremos de la distribucin y tambin es poco susceptible de efectuar con l operaciones algebraicas.

  • EJEMPLO DE MODA3, 4, 4, 4, 6, 8 En este caso la moda es 4 ya que se repite el mayor numero de veces o sea 3. en la serie: 2, 4, 4, 5, 5, 5, 7, 8, la moda es

    5

  • HOJA 2 DE 9 Por lo anterior al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo nmero y para tal fin, desde luego, no se usar el valor ms elevado ni el valor ms pequeo como nico representante, ya que solo representan los extremos, ms bien que valores tpicos. Entonces sera ms adecuado buscar un valor central. Es importante tener en cuenta que estas medidas se aplican a grupos ms bien que a individuos. Es la medida ms obvia que se puede elegir, es el valor obtenido de sumar las observaciones y dividir esta suma por el nmero que hay en el grupo. Ejemplo:Calificaciones de 5 alumnos en una prueba: Alumno No. Calificacin 1 60 entonces se suman las Calificaciones: 2 54 60+54+31+70+62=277 3 31 Luego el total se divide por la cantidad de alumnos: 4 70 277/5=55.4 5 62 LA MEDIA ARITMTICA EN ESTE PROBLEMA SERIA 55.4La Media Aritmtica:Medidas de Tendencia Central

  • MEDIA ARITMTICADatos sinagruparDatos agrupados

  • EjemploSe toma una muestra de 14 personas y se determina su valor de potasio (K) en plasma (mmol/l): 4.374.874.353.924.684.545.244.57 4.594.66 4.404.734.834.21(4.37+4.87+4.35+3.92+4.68+4.54+5.24+4.57+4.59+4.66+4.40+4.73+4.83+4.21)/1463.96/14 = 4.57 mmol/lDATOS SIN AGRUPAR

  • = 13400/35 = 382.86DATOS AGRUPADOS1056/351011/35

    Hoja1

    PacienteColesterolTriglicridos

    15.122.3

    26.182.54

    36.772.95

    46.653.77

    56.364.18

    65.95.31

    75.485.53

    86.028.83

    910.349.48

    108.5114.2

    N de horas sin dormirN de errores0.8014666272

    880.475

    860.8014666272

    12616

    121010.6

    1685.96284794

    16143.5339622082

    2014

    2012

    2416

    2412

    Clasesf

    330-3443373337(3)101128.89

    345-3593523352(3)105630.17

    360-3743674367(4)146841.94

    375-38938212382(12)4584130.97

    390-4043977397(7)277979.4

    405-4194124412(4)164847.09

    420-4344272427(2)85424.4

    Total3513400382.86

    Hoja1

    2.3

    2.54

    2.95

    3.77

    4.18

    5.31

    5.53

    8.83

    9.48

    14.2

    Triglicridos

    Colesterol (mmol/l)

    Triglicridos(mmol/l)

    Diagrama de dispersin

    Hoja2

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    horas sin dormir

    N errores

    Ejercicio 2.

    Hoja3

    MBD00150BC5.unknown

    MBD00151674.unknown

    MBD00150EEB.unknown

    MBD001493BF.unknown

  • CARACTERSTICAS DE LA MEDIA ARITMTICA. Calculada para datos en escala de Intervalos y de Razn. nica para un conjunto dado de datos. Sensible a todos los valores del conjunto de datos. La influyen valores extremos. La suma de desvos de los datos con respecto a la media es 0. til para comparar poblaciones. No se puede calcular con clases abiertas.

  • HOJA 3 DE 9La media geomtrica de una cantidad finita de nmeros (digamos n nmeros) es la raz n-sima del producto de todos los nmeros . La media geomtrica de 2 y 18 es

    La Media Geomtrica:Medidas de Tendencia CentralLa media de 1, 3 y 9 seriaSlo es relevante la media geomtrica si todos los nmeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en los nmeros reales.

  • HOJA 4 DE 9Dentro de la rama de medidas de tendencia central en estadstica descriptiva, y considerando los datos de una muestra ordenada en orden creciente (de menor a mayor), definiremos como mediana al valor de la variable que deja el mismo nmero de datos antes y despus que l. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra.La Mediana:Matemticamente hablando la mediana sera: Me = (Xn +1)/2 , si n es impar > Me ser la observacin central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente. Me = (Xn/2 + Xn/2+1)/2, si n es par > Me ser el promedio aritmtico de las dos observaciones centrales.

  • HOJA 5 DE 9La Mediana:En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos).La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N19 < 19.5 < N20

  • HOJA 6 DE 9La Mediana:Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el decimonoveno y el vigsimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta el vigsimo octavo), con lo que Me = (5+6)/2 = 5,5 puntos.La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o msPrimero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basndonos en la frmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N18 < 19 < N19

  • MEDIANA- Sin AgruparN datos impar

    N datos par

    - Datos Agrupados

  • EJEMPLODATOS NO ORDENADOSDATOS ORDENADOS PERO NO AGRUPADOS

    314

    991

    789

    556

    412

    499

    350

    863

    455

    297

    598

    510

    388

    642

    474

    333

    421

    685

    536

    297

    314

    333

    350

    388

    412

    421

    455

    474

    499

    510

    536

    556

    598

    642

    685

    789

    863

    991

  • HOJA 7 DE 9Medidas de Tendencia CentralLa Moda:Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal.Donde la moda entonces es 6.En estadstica la moda es el valor que cuenta con una mayor frecuencia en una distribucin de datos.Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.Ahora vamos a ver un ejemplo:

  • MODADEFINICIN: Valor de la variable con mayor frecuencia o el ms repetido.CARACTERSTICAS: til para medidas categricas y ordinales. No se afecta por valores extremos. Se puede utilizar con clases abiertas. Puede no existir o no ser nica.Frmula de Mopara datosagrupados

  • EjemploDATOS ORDENADOS NO AGRUPADOSMo= 455

    297

    314

    333

    350

    388

    412

    421

    455

    455

    499

    510

    536

    556

    598

    642

    685

    789

    863

    991

  • EjemploClasesxifFfr330-344337330.09345-359352360.09360-3743674100.11375-38938212220.34390-4043977290.2405-4194124330.11420-4344272350.06 35 1Clase ModalDATOS AGRUPA-DOS

  • ModaDelta 1Delta 2REPRESENTACION GRAFICA DE LA MODA

  • Cul medida de tendencia central usar? Se debe considerar: Escala de Medicin Forma de la Distribucin MEDIA Datos numricos y distribuciones SimtricasMEDIANA Datos Ordinales o Numricos con distribuciones Sesgadas.MODA Datos Nominales o Categricos y distribuciones Bimodales.

  • HOJA 8 DE 9EjerciciosMedidas de Tendencia Central

  • HOJA 9 DE 9Medidas de Tendencia CentralEjercicios:3. Hallar la Moda:1. Hallar la Media Aritmtica:2. Hallar la Media Geomtrica de 4, 4,4,12:

  • GRACIAS!