03. Medidas de Dispersión

41
BIOESTADÍSTICA Tatiana Burga. Wilver Rodríguez. Medidas de Dispersión FACULTAD DE MEDICINA HUMANA FILIAL NORTE

description

Bioestadística

Transcript of 03. Medidas de Dispersión

  • BIOESTADSTICATatiana Burga.Wilver Rodrguez.

    Medidas de Dispersin

  • Las medidas de dispersin o variabilidadSon tiles porque:Permiten juzgar la confiabilidad de la medida de tendencia central.Los datos demasiados dispersos tienen un comportamiento especial.Es posible comparar dispersin de diversas muestras.

  • AMPLITUD TOTAL: A RANGO: R Se obtiene de la diferencia entre el dato mayor y el dato menor.Ejemplo:Los siguientes datos representan los pesos de 10 pacientes. Calcule el rango.60, 58, 80, 70, 75, 55, 76, 60, 68, 70Amplitud Total Rango = 80 - 55 = 25InterpretacinLa diferencia entre el paciente con mayor peso y el paciente con menor peso es 25 kilos.

  • Clculo a partir de datos agrupadosSe utiliza la siguiente formula:

    Amplitud Total o Rango = ( Ls - Li ) + 1 donde: Ls : Limite superior de la ltima clase : Limite inferior de la primera clase

  • Ejemplo: La distribucin de frecuencias siguiente representa las estancia hospitalaria(das) de una muestra de pacientes. Calcule e interprete el rango

    Rango = (20 - 1) + 1

    R = 20

    Interpretacin: la diferencia de das entre el paciente que ms das hospitalarios y el paciente con menos das hospitalarios es de 20 das.

    Hoja1

    N DasN de Pacientes

    1 - 44

    5 - 88

    9 - 1215

    13 - 1623

    17 - 2010

    Total60

  • Ventajasfcil de calcularfcil de entender e interpretar

    Desventajasslo considera los valores extremosno toma en cuenta ni el nmero de datos ni el valor de stosno es posible de calcular en tablas con extremos abiertos.

  • LA VARIANZAEs una medida de dispersin e indica la desviacin promedio con respecto a la media aritmticaa) Clculos a partir de datos no agrupados.para una muestra

    para un poblacin

  • Ejemplo: La siguiente informacin se refiere a los das de hospitalizacin de 6 pacientes en un centro de salud: 8, 10, 5, 12, 10, 15. Calcule la varianza. Elaboramos un cuadro de la forma siguiente

    Hoja1

    88 - 10 = 24

    1010 - 10 = 00

    55 - 10 = 525

    1212 - 10 = 24

    1010 - 10 = 00

    1515 - 10 = 525

  • LA DESVIACION ESTANDAREs la raz cuadrada de la varianza, sea poblacional o muestral.a) Clculos a partir de datos no agrupados

    Para la muestra

    Para la poblacin

  • Ejemplo: En relacin al ejemplo anterior. Calcular la desviacin estndar de los siguientes das hospitalarios: 8, 10, 5, 12, 10, 15Ya sabemos por el ejemplo anterior que S2 = 11,6 das2. Entonces:

  • DESVIACIN ESTANDARDonde: fi: frecuencias absolutas simples Xi: puntos medios de los intervalos de clase

  • Ejemplo: Calcular la desviacin estndar de la siguiente distribucin de frecuencias:

    N de Das HospitalariosXifiXi*fiXi2*fi2 - 43412365 - 7610603608 - 10915135121511 - 131230360432014 - 1615575112517 - 1918118324Total656607380

  • DESVIACIN ESTANDAR

  • -3 -2 - + +2 +3

    68.3 %

    95.5 %99.7 %

    Teorema de Chebyshev

  • El coeficiente de variacinEs una medida de variabilidad relativa de los datos, permite comparar la variabilidad de dos o ms conjuntos de datos expresados en unidades diferentes (peso; kg. y libras).

    a) Calculos a partir de datos no agrupados

    Para la muestra:

    Para la poblacin:

  • Ejemplo: A continuacin se presentan los pesos en dos grupos de pacientes Cul de los grupos tiene un peso ms estable?.

    I grupo II grupo40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

    Calculamos la media y desviacin estndar para cada uno de los grados

  • Grupo I

    Hoja1

    40-16.14260.50

    7013.86192.10

    603.8614.90

    48-8.1466.26

    52-4.1417.14

    658.8678.50

    581.863.46

  • Grupo II

    Hoja1

    105.87

    70-35.871286.6569

    35-70.875022.5569

    15044.131947.4569

    14034.131164.8569

    82-23.87569.7769

    1104.1317.0569

    14034.131164.8569

    12014.13199.6569

  • El II grupo presenta una mayor variabilidad en sus pesos que el I grupo.

  • CONSIDERACIONESSI:C.V 33% La distribucin se puede considerar aproximadamente simtrica.C.V 33% La distribucin puede ser asimtrica

    *

  • Curvas simtricas: Cuando al trazar una lnea el rea se divide en dos partes iguales. Curvas asimtricas o sesgadas: Concentrados en el extremo inferior o superior del eje horizontal. La cola indica el tipo de sesgo.Medidas Forma:

  • X=Me=Mo

    Mo

  • Refleja el grado de agudeza. (a) Leptocrtica (concentracin al centro) (b) Mesocrtica (distribuidos simtricamente) (c) Platicrtica (aplanada).Coeficiente de Curtosis

  • USO DE LAS DIFERENTES MEDIDAS DE DISPERSIONLa desviacin estndar se emplea cuando tambin es apropiado el uso de la media, es decir, con distribuciones simtricas(no sesgadas) de datos numricos.Percentiles y rango intercuartilicos se emplean, cuando la distribucin no es simtrica(sesgada) y es apropiado el uso de la mediana.

  • USO DE LAS DIFERENTES MEDIDAS DE DISPERSIONEl rango es una medida apropiada para datos numricos cuando el propsito es enfatizar valores extremos.El coeficiente de variacin es til cuando la intencin es comparar dos distribuciones numricas medidas en escalas diferentes.

  • El Boxplot (Diagrama de Caja)Al igual que el histograma y el grfico de Tallo y Hoja permite tener una idea visual de la distribucin de los datos (simetra y variabilidad)Permite detectar outliers (valores extremos).Permite comparar la media y la variabilidad de varios grupos (alternativa grfica a pruebas estadsticas)

  • Boxplot: ProcedimientoDibujar una caja cuyo lmite inferior ser Q1 y el superior Q3. Dentro de la caja trazar una lnea que localice la mediana.Calcular el rango intercuartlico: R.I. (Q) = RIQ = Q3 Q1Dibujar un bigote del borde inferior de la caja hasta Q1-1.5xRIQ .

  • Boxplot: ProcedimientoDibujar otrobigote del borde superior de la caja hasta Q3+1.5xRIQ .Dibujar cualquier observacin que se ubique fueras de los bigotes (estos sern los outliers).

  • BoxPlot: Ejemplo

    49.bin

  • OTRA ALTERNATIVA DE ANALIZAR LA DISPERSIN DE UN CONJUNTO DE DATOS: GRFICO DE TALLO - HOJAS

  • Grfico de Tallo - HojaUn diagrama de tallos y hojas consiste en una serie de hileras horizontales de nmeros. El nmero utilizado para designar una hilera es un tallo y el resto de nmeros en la hilera se denominan hojas.

  • Se tienen los siguientes datos permetro ceflico (cm) de recin nacidos, que constituye una muestra obtenida de una poblacin de recin nacidos:

    33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5

  • Para la clasificacin de datos, se deben identificar los valores entre los cuales se encuentra la distribucin, es decir, el dato menor y el dato mayor.

    Dato menor: 33.1cmDato mayor: 36.5cm

    33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5

  • Se deben identificar los tallos -los nmeros que van a designar las hileras- los cuales deben contener a todos los valores de la distribucin (del 33.1 al 36.5). La eleccin de los tallos depende de la unidad con la que se quiera trabajar: enteros, dcimas, centsimas... En el caso del ejemplo, los datos estn dados indicando dcimas por lo que trabajar con tallos enteros es la opcin ms precisa y cmoda. Los tallos seran entonces: 33, 34, 35 y 36.

  • Sin embargo, no se puede realizar un diagrama de tallos y hojas con menos de 5 tallos. Por lo tanto, los tallos propuestos se deben dividir (desdoblar) en una especie de intervalo, produciendo el doble. La divisin del tallo debe distinguirse visualmente:

    33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5

  • Seguidamente, se realiza el proceso de clasificacin en s. Todos los datos, dependiendo de su valor, se colocan a lado de su respectivo tallo. En el ejemplo, los datos cuyo valor se encuentre entre 33.0 y 33.4 se deben colocar en la hilera del tallo 33*. Se debe indicar el valor decimal exacto de cada dato a la derecha del tallo. En el ejemplo hay 2 valores entre 33.0 y 33.4. Para clasificar el primero (33.1) se agrega al diagrama de tallos y hojas de la siguiente manera:33*1Para clasificar el segundo dato que corresponde a este tallo (33.4):33*14

  • Lo mismo se realiza con cada tallo y lo valores que le correspondan: En la hilera del tallo 33. se debe colocar los nmeros 67789, correspondientes a los valores 33.6, 33.7, 33.7, 33.8, 33.8 y 33.9.A la hilera del tallo 34* se debe colocar 012222233 correspondientes a los valores que se encuentran entre 34.0 y 34.4.etc.

  • Al clasificar todos los valores en sus tallos respectivos, se obtiene el diagrama:

  • Anlisis de la distribucin usando Tallos y HojasLas principales caractersticas de la distribucin que se observan fcilmente en el diagrama de tallos y hojas son:Hay 35 observaciones.El dato menor es 33.1cm.El dato mayor es 36.5cm.El rango de los valores observados es de 3.4cm (dato mayor dato menor).De los 35 datos, 18 estn alrededor de 34cm.Los casos mayores a 36cm son pocos.La distribucin de los datos es asimtrica: distribucin heterognea.

    *