Medidas de Variabilidad

27

description

Medidas de Variabilidad

Transcript of Medidas de Variabilidad

Page 1: Medidas de Variabilidad
Page 2: Medidas de Variabilidad

¿Los tres grupos tienen igual media?

¿Los tres grupos tienen características similares?

Page 3: Medidas de Variabilidad

MEDIDAS

DE VARIABILIDAD

Page 4: Medidas de Variabilidad

VARIABILIDAD

•Es la medida de las diferencias que presentan los datos entre si. • Para medirla se aprovecha el echo, que si los datos son semejantes entre si, están más cerca a la media aritmética, entonces se dice que tienen poca variabilidad ó que son homogéneos. • Por el contrario si son muy diferentes entre si, estarán muy dispersos respecto a la media aritmética y se dice de ellos que son muy variables o que son heterogéneos. • ES PREFERIBLE SIEMPRE QUE LOS DATOS SEAN HOMOGÉNEOS

Page 5: Medidas de Variabilidad

LAS MEDIDAS DE VARIABILIDAD O DISPERSION SON AQUELLAS QUE MIDEN EL GRADO DE SEPARACION DE LOS DATOS CON RESPECTO A UN VALOR CENTRAL.

LAS PRINCIPALES MEDIDAS DE DISPERSION SON: EL RANGO (R) EL RANGO INTERCUARTILICO (RI) EL RANGO INTERPERCENTILICO (RIP) LA VARIANZA [ V(X) ó S2(X) ] LA DESVIACION ESTANDAR [S(X)] COEFICIENTE DE VARIACION [ CV(X) ]

Page 6: Medidas de Variabilidad

EL RANGO (R)

El Rango de variación o recorrido de una serie de datos, esta representado por la diferencia entre sus valores máximo y mínimo.

R = Xmáx – Xmín Donde: Xmáx : Valor Máximo Xmín : Valor Mínimo

Page 7: Medidas de Variabilidad

EL RANGO INTERCUARTILICO (RI) Es la diferencia entre el tercer cuartil y el primer cuartil.

RI = Q3 – Q1

El Rango Intercuartilico es una medida que excluye el 25% más alto y el 25% más bajo, dando un rango dentro del cual se encuentra el 50% de datos centrales, lo que evita el efecto causado por valores extremos. Si el rango intercuartilico es muy pequeño entonces indica alta uniformidad o pequeña variación de los valores centrales.

Page 8: Medidas de Variabilidad

EL RANGO INTERPERCENTILICO (RIp)

Es una medida que se calcula en base a los percentiles respectivos. Por ejemplo si queremos calcular el Rango interpercentilico del 80% de datos centrales tendremos que:

RI80 = P90 – P10 Si se desea hallar el Rango interpercentilico del 90% de datos centrales, tendremos que:

RI90 = P95 – P5

Page 9: Medidas de Variabilidad

LA VARIANZA

* VARIANZA POBLACIONAL

a) DATOS NO AGRUPADOS: N

NXXV

N

ii

2

1

2

)(

b) DATOS AGRUPADOS: N

NfXXV

i

k

ii

2

1

2

)(

Xi : i-ésima observación N: total de observaciones :media poblacional

Xi : marca de clase fi : frecuencia absoluta k: número de intervalos

Page 10: Medidas de Variabilidad

* VARIANZA MUESTRAL

a) DATOS NO AGRUPADOS:

1

2

1

2

2

n

XnXS

n

ii

b) DATOS AGRUPADOS:

1

2

1

2

2

n

XnfXS

i

k

ii

Xi : i-ésima observación n: total de datos de la muestra : media muestral

X

Xi : marca de clase fi: frecuencia absoluta k: número de intervalos

Page 11: Medidas de Variabilidad

LA DESVIACION ESTANDAR

La varianza se mide en unidades al cuadrado, por ejemplo si los datos están expresados en metros, la varianza se medirá en metros al cuadrado. Esto trae dificultades para la interpretación de los resultados obtenidos. Es por ello que en ocasiones se prefiere el uso de la Desviación Estándar, definido como:

Desviación Estándar Poblacional: )(XV Desviación Estándar Muestral:

2ss

Page 12: Medidas de Variabilidad

INTERPRETACION:

El valor numérico de la varianza y la desviación estándar cuantifican el grado de dispersión de los valores de la variable respecto a su media, es por ello que a mayor variabilidad o dispersión le correspondera una mayor varianza o una mayor desviación estándar.

Page 13: Medidas de Variabilidad

EJEMPLO1:

HALLAR LA VARIANZA Y DESVIACIÓN ESTÁNDAR DE: 17, 19, 19, 19, 19, 18, 18, 20, 21, 19, 18, 17, 20, 20, 17 X X2

17 289

19 361

19 361

. .

. .

x

2x

495.114

7333.18x155285S

5285X

7333.1815

281x281X

22

2

n=15

22.1495.1S * La dispersión de los datos respecto a la media es 1.22

1

2

1

2

2

n

XnXS

n

ii

Page 14: Medidas de Variabilidad

EJEMPLO2:

HALLAR LA VARIANZA Y DESVIACION ESTANDAR PARA LA SIGUIENTE DISTRIBUCIÓN DE DATOS:

INTERVALOS Xi fi

[0 , 3 > 1.5 2

[3 , 6 > 4.5 3

[6 , 9 > 7.5 5

[9 , 12 > 10.5 4

[12 , 15 > 13.5 1

Page 15: Medidas de Variabilidad

INTERVALOS Xi fi

[ 0 – 3> 1.5 2 3 4.5

[ 3 – 6> 4.5 3 13.5 60.75

[ 6 – 9> 7.5 5 37.5 281.25

[ 9 – 12> 10.5 4 42 441

[ 12 – 15> 13.5 1 13.5 182.25

TOTAL n =15 109.5 969.75

ii fX i2i fX

17.1214

3.7x1575.969S

3.715

5.109x

22

49.317.12S

1

2

1

2

2

n

XnfXS

i

k

ii

Page 16: Medidas de Variabilidad

PROPIEDADES DE LA VARIANZA 1) V(X)>0 (la varianza siempre es positiva)

2) Si c es una constante entonces: V(c)=0

3) Si Y=X+c entonces: V(Y) = V(X+c) = V(X)

4) Si Y=bX entonces: V(Y) = V(bX) = b2 V(X)

5) Si Y=bX+c entonces: V(Y) = V(bX+c) = b2V(X)

EJEMPLO: Si V(X)= 2 , C = 5 y b = 3

Si Y = X+5 entonces V(Y) = V(X+5) = V(X) = 2 Si Y = 3X entonces V(Y) = V(3X) = 32 V(X) = 9x2 = 18 si Y = 3X+5 entonces V(Y) = V(3X+5) = 32 V(X) = 9x2 =18

Page 17: Medidas de Variabilidad

EL COEFICIENTE DE VARIACION

Es una medida de variación relativa (adimensional) puesto que no tiene unidades, lo que permite poder usarla cuando se desean comparar grupos de datos con diferentes unidades de medida, o grupos de datos con diferentes medias. Se calcula mediante la siguiente formula:

CV (X) = S

X

CV (X) % = S

X

x100 también:

Page 18: Medidas de Variabilidad

CRITERIOS PARA COMPARAR LA VARIABILIDAD DE DOS O MAS GRUPOS DE DATOS

CASO1 A

SA

AX

B

SB

BX

A

XB

XSi y son iguales o aproximada- mente iguales y expresadas en las mismas

unidades, entonces usar la desviación estándar para la comparación. Esto es, la que tenga menor desviación estándar será el grupo más homogéneo.

CASO2 A B

SA

AX

SB

BX

Si AX

BXy no son iguales y los datos

presentan diferentes unidades, entonces usar el coeficiente de variación para la comparación.Esto es, el que tenga menor menor coeficiente de variación será el grupo más homogéneo.

Page 19: Medidas de Variabilidad

UNIDADES DE MEDIDA IGUALES

UNIDADES DE MEDIDA DIFERENTES

“MEDIAS IGUALES”

desviación estándar

Coeficiente de variabilidad

“MEDIAS DIFERENTES”

Coeficiente de variabilidad

Coeficiente de variabilidad

En resumen si los grupos tienen:

Page 20: Medidas de Variabilidad

EJEMPLO: Un Administrador debe decidir la compra de una de dos máquinas, tiene la siguiente información con respecto al tiempo diario que requiere cada máquina para su mantenimiento.

Promedio Varianza

Máquina A 27 min 4.5 min2

Máquina B 35 min 5 min2

Utilizando la medida de variabilidad adecuada.Cuál de las dos máquinas tiene menos variabilidad en cuanto al tiempo de mantenimiento?

Solución: Dado que las unidades es la misma para ambos grupos pero las medias no son iguales,entonces utilizamos el coeficiente de variación para comparar

CVA = 275.4

A

A

XS

= = 0.07856 CVB = B

B

XS

= 35

5 = 0.06388

ó 7.86 % ó 6.39 %

Entonces la máquina B es menos variable.

Page 21: Medidas de Variabilidad

VARIANZA TOTAL

Se utiliza cuando se desea hallar la varianza de dos o más grupos reunidos en uno solo, donde cada grupo interviene con su respectiva varianza y su respectivo número de datos (es una especie de varianza ponderada).

2

T

i

2k

1i

ii

T xn

)sx(n V

2

k: número de grupos ni: tamaño del i-ésimo grupo n: tamaño total

Page 22: Medidas de Variabilidad

MEDIDAS DE FORMA Es una medida que nos determina la forma de una distribución de datos como un primer paso al estudio de esta. Se estudiará la deformación de una distribución tanto en el sentido horizontal como vertical con respecto a la forma de la curva normal.

I. ASIMETRÍA

La asimetría o sesgo es el grado de deformación horizontal de una distribución, con respecto a la distribución normal.

Page 23: Medidas de Variabilidad

Asimetría Negativa: cuando la“cola”más larga de la distribución está a la izquierda, esto significa que el grueso de los datos están concentrados a la derecha. Asimetría Positiva: cuando la“cola”más larga de la distribución está a la derecha, esto significa que el grueso de los datos están concentrados a la izquierda.

Para medir la Asimetría de una distribución se emplea el coeficiente de Pearson:

S

)MeX(3Ak

Page 24: Medidas de Variabilidad

Si Ak = 0 se tiene simetría perfecta Si Ak >0 se tiene asimetría positiva Si Ak <0 se tienen asimetría negativa

EJEMPLO: encuentre la forma de una distribución con media igual a 7.87, mediana igual a 7.80 y desviación estándar 1.293

Ak = 3(7.87- 7.80)

1.293 = 0.162

Ak = 0.162 > 0 se tiene una asimetría positiva

(distribución con cola a la derecha)

Page 25: Medidas de Variabilidad

II. CURTOSIS

Analiza la deformación vertical de una distribución de datos respecto a la normal, es decir el grado de elevación o apuntamiento de la curva. Para medir la Curtosis se emplea el coeficiente de curtosis:

)PP(2

PPK

1090

2575U

Page 26: Medidas de Variabilidad

El coeficiente de curtosis se compara con un valor referencial “0.263” de la siguiente manera, si:

KU > 0.263 la distribución es Leptocúrtica (Distribución Elevada)

KU = 0.263 la distribución es Mesocúrtica (Distribución Normal)

KU < 0.263 la distribución es Platicúrtica (Distribución Aplanada)

Page 27: Medidas de Variabilidad

EJEMPLO: evalue la curtosis para una distribución con: P75 = 8.8 P25 = 7.0 P90 = 9.7 P10 = 6.1

Ku = 8.8 – 7.0

2 (9.7 – 6.1) = 0.25

Ku = 0.25 < 0.263 entonces se tiene una distribución Platicúrtica

(aplanada)