MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA...
Transcript of MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA...
MEDIDAS DE RESUMEN: MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA MEDIDAS DE TENDENCIA CENTRAL Y DISPERSICENTRAL Y DISPERSIÓÓNN
Lic. Esperanza GarcLic. Esperanza Garcíía a CribillerosCribilleros
ANANÁÁLISIS EXPLORATORIO DE LISIS EXPLORATORIO DE DATOSDATOS
Diagrama de tallo y hojasDiagrama de tallo y hojasDiagrama de cajaDiagrama de caja
DESCRIPCIDESCRIPCIÓÓN DE LOS DATOSN DE LOS DATOS
TablasTablasGrGrááficosficosMedidas de resumenMedidas de resumen
Stem-and-Leaf Display: Perdida de peso
Stem-and-leaf of Pérdida de peso N = 65Leaf Unit = 0.10
1 9 02 9 55 10 0008 10 56913 11 0000315 11 7826 12 0000000012329 12 566(11) 13 0000000022425 13 55566719 14 000002223338 14 5565 15 00033
Diagrama de Tallos y hojasLos datos tienen un decimal
Terminación de dígitos del 0 al 4
Terminación de dígitos del 5 al 9
8 datos menores e iguales que 10.9
11 datos entre 13 y 13.4 y uno de ellos es la mediana
8 datos mayores e iguales que 14.5
tallo hojas
BOXPLOT (Diagrama de Cajas)BOXPLOT (Diagrama de Cajas)Es un grEs un grááfico que nos sirve para ver cfico que nos sirve para ver cóómo estmo estáán distribuidas las n distribuidas las
observaciones (distribuciobservaciones (distribucióón sesgada a la derecha o izquierda), n sesgada a la derecha o izquierda), comparacicomparacióón de la dispersin de la dispersióón de dos o mas conjuntos de datos y si n de dos o mas conjuntos de datos y si existen valores extremos que afectan a la distribuciexisten valores extremos que afectan a la distribucióón.n.
XmXmííninonino : Es la observaci: Es la observacióón de menor valor n de menor valor XmXmááximoximo : Es la observaci: Es la observacióón de mayor valor n de mayor valor Q1 : Primer Q1 : Primer CuartilCuartilQ3 : Tercer Q3 : Tercer CuartilCuartil
Si aparece * en la grafica significa que es un valor extremoSi aparece * en la grafica significa que es un valor extremo
Mediana Q3Q1 XmáximoXmínimo
EJEMPLO:EJEMPLO:Se tienen las edades de 35 pacientes:Se tienen las edades de 35 pacientes:
2833455635382227463820554536292234216423452653374554123628283943213235
Explorar los datos especialmente para ver la simetría.
DIAGRAMA DE CAJAS
Valor máximo
Edad
70
60
50
40
30
20
10
EDAD DE 35 MADRES
Me
Q3
Q1
Valor Máximo
Valor mínimo
Diagrama de tallos y hojasDiagrama de tallos y hojas
Hojas
Tallo
12 madres tienen 29
años o menos
11 madres tiene 43 años o
más
Stem-and-leaf of Edad N = 35Leaf Unit = 1.0
1 1 212 2 01122367889(12) 3 23455667888911 4 3555565 5 34561 6 4
MEDIDAS DE RESUMEN PARA MEDIDAS DE RESUMEN PARA VARIABLES CUANTITATIVASVARIABLES CUANTITATIVAS
MEDIDAS DE TENDENCIA CENTRAL O DE POSICIMEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓÓN: N: MEDIA ARITMMEDIA ARITMÉÉTICA, TICA, MEDIANA, MEDIANA, MODAMODAOTRAS MEDIDAS : PERCENTILES Y CUARTILESOTRAS MEDIDAS : PERCENTILES Y CUARTILES
MEDIDAS DE DISPERSIMEDIDAS DE DISPERSIÓÓN: N: RANGORANGOVARIANZAVARIANZADESVIACION ESTANDARDESVIACION ESTANDARCOEFICIENTE DE VARIACIONCOEFICIENTE DE VARIACIONINTERVALO CUARTILARINTERVALO CUARTILAR
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRALO POSICIO POSICIÓÓNN
Son valores que indican el centro de la distribución de los datos. Es el valor representativo de estos. Las más usadas son: la media aritmética o promedio, la mediana, moda, cuartiles y percentiles .
MEDIDA DE ASIMETRMEDIDA DE ASIMETRÍÍAA
DistribuciDistribucióón simn siméétrica:trica: Cuando su curva de Cuando su curva de frecuencia es simfrecuencia es siméétrica con respecto al centro trica con respecto al centro de los datos, en este caso de los datos, en este caso μμ=Me=Mo.=Me=Mo.
7654321
9
8
7
6
5
4
3
2
1
0
X
Freq
uenc
y
Distribucion simetrica
DistribuciDistribucióón asimn asiméétrica positiva trica positiva μμ>Me>Mo>Me>Mo
654321
8
7
6
5
4
3
2
1
0
X
Freq
uenc
y
Distribucion asimetrica positiva
►►DistribuciDistribucióón asimn asiméétrica negativatrica negativa μμ<Me<Mo<Me<Mo
654321
8
7
6
5
4
3
2
1
0
X
Freq
uenc
y
Distribucion asimetrica negartiva
MEDIA ARITMETICA:MEDIA ARITMETICA:Medida descriptiva de tendencia central, llamada Medida descriptiva de tendencia central, llamada tambitambiéén promedio. Resulta de sumar los valores de n promedio. Resulta de sumar los valores de todas las observaciones y dividir la sumatoria entre todas las observaciones y dividir la sumatoria entre el total de ellas.el total de ellas.
Nx i∑=μ
Parámetron
xxxxnxx ni ++++==∑ ...321
Estadística
Se caracteriza por:Ser únicaFácil de calcularEs afectada por todos los valores
DondeN es la poblaciónn es la muestraxi Valores de x1, x2, …, xn
la media muestralx
PASOS PARA CALCULAR LA MEDIA:PASOS PARA CALCULAR LA MEDIA:
1.1. Verificar la simetrVerificar la simetríía de los datos: Edadesa de los datos: Edades
2833455635382227463820554536292234216423452653374554123628283943213235
Edad
70
60
50
40
30
20
10
EDAD DE 35 MADRES
años....nxx i
093635
283635=
+++=
=∑
Las madres tuvieron en promedio 36.09 años
2.
Es el valor que divide al conjunto ordenado de Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamadatos en dos grupos de igual tamañño en cuanto al o en cuanto al nnúúmero de observaciones se refiere.mero de observaciones se refiere.Es Es úúnica, fnica, fáácil de calcular y los valores extremos cil de calcular y los valores extremos no afectan su valor.no afectan su valor.
MEDIANA
Pasos:1. Los datos se ordenan en forma creciente: x1 + x2 +…+xn2. Calcular la mediana teniendo en cuenta:
a) Si n es par: con la fórmula
21 /)n(xMe +=n Tamaño de muestra
Me es la mediana
Valor de la mediana21 /)n(x +
Donde: Me es la medianan es el tamaño de la muestra(n+1)/2 es la posición donde se
encuentra la mediana.
Datos ordenados
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29
13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39
25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
añosxMe /n 3621 == + n impar
b) Si b) Si n es par:n es par:
MODAMODAValor mValor máás frecuente en el conjunto. En el s frecuente en el conjunto. En el ejemplo es 45ejemplo es 45
2
122+
+
=
nn xx
Me
Donde:
X n/2 Valor en la pesa posición
X (n/2) +1 Valor en la posición siguiente.
CuartilesCuartilesTres valores que dividen a un conjunto de Tres valores que dividen a un conjunto de datos en 4 partes iguales.datos en 4 partes iguales.
41
1+
=nQ
4)1(3
3+
=nQ
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 2913 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 3925 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
posiciónQ 94
1351 =
+=
Q1Q3
posición)n(Q 274
133 =
+=
Valor de Valor de Q=xQ=xnn/2/2+0. +0. …… ( x( x (n/2)+1(n/2)+1 ) ) –– (x(xn/2n/2))
Usos de los cuartiles:• Para indicar el porcentaje igual o menor que el
valor de un cuartil
• Para construir la curva endémica
• Para describir el 50% central de las observaciones
• Elaboración del gráfico de caja.
25% 25% 25% 25%
Q1 Q2 Q3
RICRIC
CURVA ENDCURVA ENDÉÉMICAMICA
Q3
Q2 =Me
Q1
PERCENTILES:PERCENTILES:99 valores que dividen a un conjunto de 99 valores que dividen a un conjunto de datos en 100 partes iguales. Indica el datos en 100 partes iguales. Indica el porcentaje de la distribuciporcentaje de la distribucióón igual o n igual o menor a su valor.menor a su valor.Ejemplo: Se tienen las edades de 35 Ejemplo: Se tienen las edades de 35 madres.madres.
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29
13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39
25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
Primero se ordenan los datos de menor a Primero se ordenan los datos de menor a mayor.mayor.CCáálculo: lculo:
El valor del percentil 25 es 27 aEl valor del percentil 25 es 27 añños os Valor del percentil 70Valor del percentil 70
1001 )n(k
iP += posición)(P 9100
1352525 =
+=
años.)(..*P 4434345204322510
367070 =−+⇒==
Uso de los Uso de los percentilespercentiles::Para comparar un valor de un individuo Para comparar un valor de un individuo con un conjunto de normas.con un conjunto de normas.Para determinar Rangos normales de Para determinar Rangos normales de ananáálisis de laboratorio. Los llisis de laboratorio. Los líímites mites normales de muchos annormales de muchos anáálisis se ubican lisis se ubican entre el percentil 2.5 y 97.5 .entre el percentil 2.5 y 97.5 .TambiTambiéén se usa para establecer el rango n se usa para establecer el rango intercuartintercuartíílicolico. .
MEDIDAS DE DISPERSIMEDIDAS DE DISPERSIÓÓNNMiden la variabilidad de un conjunto de Miden la variabilidad de un conjunto de datos.datos.
μ
RangoVarianza Desviación estándarCoeficiente de variaciónIntervalo cuartilar
RANGORANGOEs la diferencia entre el valor mEs la diferencia entre el valor máás s grande y el mgrande y el máás peques pequeñño del conjunto de o del conjunto de datos.datos.
Rango = Valor mRango = Valor mááximo ximo -- Valor mValor míínimonimo
R = 64 R = 64 –– 12 = 5212 = 52
VARIANZAVARIANZAEs la medida que cuantifica la variabilidad Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.de los datos respecto al valor de la media.
Donde: xi valores de la variable, x1 , x2, etc. n es de la muestra
es la media aritméticax
σ
μ
1
22
−−
=∑
n)xx(s i
USOS:USOS:En inferencia estadEn inferencia estadíísticasticaPara calcular la desviaciPara calcular la desviacióón n estestáándar.ndar.Para calcular el tamaPara calcular el tamañño de o de muestra.muestra.
Ejemplo: Ejemplo: Los datos de la siguiente tabla son los mismos Los datos de la siguiente tabla son los mismos que se usaron para el cque se usaron para el cáálculo de las medidas de lculo de las medidas de tendencia central.tendencia central.
0)( =−∑ xxi Propiedad de la media, por eso se eleva al cuadrado
2833455635382227463820554536292234216423452653374554123628283943213235
( ) ( ) ( ) 4436145135
093628093632093635 2222 .......s =
−−++−+−
=
One-Sample Kolmogorov-Smirnov Test
2020.052.212
.111
.109-.111.496.966
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)
respiracionesx minuti
(muestra)
Test distribution is Normal.a.
Calculated from data.b.
PRUEBA DE HIPÓTESIS
DESVIACION ESTANDAR: DESVIACION ESTANDAR: Es la raEs la raííz cuadrada positiva de la varianza. Mide la z cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se variabilidad de los datos en las unidades en que se midieron originalmente. Los smidieron originalmente. Los síímbolos son: mbolos son: s, s, si es si es una muestra y ; una muestra y ; σσ si es una poblacisi es una poblacióón.n.
CaracterCaracteríísticas de la desviacisticas de la desviacióón estn estáándar:ndar:1.1. Siempre es un valor positivoSiempre es un valor positivo2.2. EstEstáá influenciada por todos los valores de la influenciada por todos los valores de la
muestra o poblacimuestra o poblacióón.n.3.3. Mayor influencia ejercen los valores extremos Mayor influencia ejercen los valores extremos
debido a que son elevados al cuadrado en el debido a que son elevados al cuadrado en el ccáálculo.lculo.
4.4. Sirve para definir la dispersiSirve para definir la dispersióónn de los datos de los datos alrededor de la media. alrededor de la media.
2ss =
Aproximadamente el 68% de los alumnos tuvieron 36.09 ± 12.06 años.
061244361452 ..ss ===
Interpretación:
Las madres tuvieron en promedio 36.09 años con una desviación estándar de 12.06
3.573.5766BB
1.311.3166AA
DesviaciDesviacióón Estn EstáándarndarVarianzaVarianzaMediaMediaGrupoGrupo
Tabla 1. Medidas Descriptivas de las Edades de dos Tabla 1. Medidas Descriptivas de las Edades de dos GruposGrupos
5. Sirve para comparar
Dos grupos teniendo la misma media podemos identificar el más disperso. Cuando las medias son diferentes , para identificar cuál es el más variado se tiene que hacer utilizando el COEFICIENTE DE VARIACIÓN.
COEFICIENTE DE VARIACICOEFICIENTE DE VARIACIÓÓN:N:Medida de variabilidad relativa: Se usa para comparar la Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o mvariabilidad entre dos o máás muestras medidas en las s muestras medidas en las mismas unidades o no.mismas unidades o no.
%...
xsCV 4233
09360612100 ==×=
Si el coeficiente es:< 10 % poca dispersión10 – 33% aceptable34 – 50% alta dispersión> 50% muy alta
El CV es útil cuando se quieren comparar el efecto de un tratamiento en dos o más grupos.
PorquPorquéé se usa la media junto con la desviacise usa la media junto con la desviacióón n estestáándar en el anndar en el anáálisis de datos?lisis de datos?
Se quiere expresar una medida que represente Se quiere expresar una medida que represente a todos los datos (media) pero al mismo tiempo se a todos los datos (media) pero al mismo tiempo se desea expresar la variacidesea expresar la variacióón de los mismos respecto n de los mismos respecto a esa medida de tendencia central.a esa medida de tendencia central.
CuCuáál es la medida que expresa homogeneidad de l es la medida que expresa homogeneidad de un conjunto de datos? un conjunto de datos?
El coeficiente de variaciEl coeficiente de variacióónnCuCuáál es la ventaja de calcular medidas de resumen l es la ventaja de calcular medidas de resumen
con los datos sin agrupar?con los datos sin agrupar?La mayor exactitud de La mayor exactitud de ééstas.stas.
PREGUNTAS
MEDIDAS DEMEDIDAS DE RESUMEN CON DATOS RESUMEN CON DATOS AGRUPADOSAGRUPADOS
Presiónsistólica(mmHg) N° Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896
100
Total 100
Ejemplo: PRESIÓN SISTÓLICA EN 100 PACIENTESPresiónsistólica(mmHg) N° Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896
100
Total 100
CÁLCULO DE LA MEDIA ARITMÉTICA:
( )
1001
∑= =
k
iii fm
x
mi es el punto mediofi frecuencia absoluta absolutan tamaño de la muestra
( ) ( ) Hgmmx /1.133100
4162...21122)7112( =×++×+×=
Presiónsistólica(mmHg) N° Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
PRESIÓN SISTÓLICA EN 100 PACIENTES
mmHgMe 24.1321042
2850127 =×⎟⎠⎞
⎜⎝⎛ −
+=mmHgMo 67.13110
242121127 =×⎟
⎠⎞
⎜⎝⎛
++=
If
Fan
LIMeMe
×⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛ −+= 2
Idd
dLIMo ×⎟⎟⎠
⎞⎜⎜⎝
⎛+
+=21
1Cálculo de la Mediana:
CCáálculo de la Varianza:lculo de la Varianza:PRESIPRESIÓÓN SISTN SISTÓÓLICA EN 100 PACIENTESLICA EN 100 PACIENTES
( ) ( )11
2222
−−∑=
−∑ −
=n
xnxn
xms i
Presiónsistólica(mmHg)
N° Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896
100
Total 100
( ) ( ) ( ) 2222
2 6.1899
41.133162...211.13312271.133112 mmHgs =×−++×−+×−
=
mmHgs 31.46.18 ==
DESVIACIÓN ESTÁNDAR
CALCULO DE CUARTILES Y PERCENTILESPresiónsistólica(mmHg) N° Pm Fa
107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
If
Fank
LIQQ
k ×⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛ −+=
1
4)(
mmHgQ 57.1251021
7251171 =×⎟⎠⎞
⎜⎝⎛ −
+=
If
Fank
LIPkP
k ×⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛ −+= 100
)(mmHgP 75.15510
8889514795 =×⎟⎠⎞
⎜⎝⎛ −
+=