Material Unidad IV

17
Unidad Académica del Norte Estadística ESTADÍSTICA UNIDAD IV MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN Anteriormente se consideraron las medidas de centralización de una distribución, que nos sirve para localizar el “centro” de la distribución, pero no nos dice como se reparten ó dispersan los datos a uno y otro lado del centro. Esta última característica de una distribución se suele llamar “DISPERSIÓN ó VARIACIÓN”, la variación de los valores puede ser medida por varios métodos. Una medida de dispersión es importante en dos modos: Primero, puede ser usada para mostrar el grado de variación entre los valores en los datos dados. Ejemplo: Una muy baja dispersión de los salarios por hora de un grupo de trabajadores por hora en una fábrica, dará la indicación que a los trabajadores en la fábrica les son pagados, aproximadamente, salarios iguales. Pero por otro lado, una alta dispersión dará a un lector la impresión de que los trabajadores son pagados en una amplia variación de los salarios por hora. Segundo, la medida de dispersión puede ser usada para suplementar un promedio para describir un grupo de datos ó para comparar un grupo de datos con otro. Cuando la dispersión es alta, el promedio se vuelve de poca ó ninguna significación. Cuando la dispersión es baja, el valor promedio es un valor altamente representativo. Ejemplo: La media del grupo de números 1, 2 y 12 es x = 1+2+12 = 5, puesto que 5 no esta cercano a ningún número en el grupo, se espera una alta dispersión. 3 La media del grupo de 4, 5 y 6 es X = 4+5+6 = 5, puesto que 5 esta cercano (o igual) a cada número se espera una baja dispersión. 3 Podemos decir que las medidas de dispersión nos indican si los valores están relativamente cercanos uno del otro ó si se encuentran dispersos. M.A.C Ing. Josué Salvador Sánchez Rodríguez 1

description

ESTADÍSTICA

Transcript of Material Unidad IV

Page 1: Material Unidad IV

Unidad Académica del Norte Estadística

ESTADÍSTICAUNIDAD IV

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓNAnteriormente se consideraron las medidas de centralización de una distribución, que nos sirve

para localizar el “centro” de la distribución, pero no nos dice como se reparten ó dispersan los datos a uno y otro lado del centro. Esta última característica de una distribución se suele llamar “DISPERSIÓN ó VARIACIÓN”, la variación de los valores puede ser medida por varios métodos.

Una medida de dispersión es importante en dos modos:Primero, puede ser usada para mostrar el grado de variación entre los valores en los datos dados.

Ejemplo:

Una muy baja dispersión de los salarios por hora de un grupo de trabajadores por hora en una fábrica, dará la indicación que a los trabajadores en la fábrica les son pagados, aproximadamente, salarios iguales. Pero por otro lado, una alta dispersión dará a un lector la impresión de que los trabajadores son pagados en una amplia variación de los salarios por hora.

Segundo, la medida de dispersión puede ser usada para suplementar un promedio para describir un grupo de datos ó para comparar un grupo de datos con otro. Cuando la dispersión es alta, el promedio se vuelve de poca ó ninguna significación. Cuando la dispersión es baja, el valor promedio es un valor altamente representativo. Ejemplo:

La media del grupo de números 1, 2 y 12 es x = 1+2+12 = 5, puesto que 5 no esta cercano a ningún número en el grupo, se espera una alta dispersión. 3

La media del grupo de 4, 5 y 6 es X = 4+5+6 = 5, puesto que 5 esta cercano (o igual) a cada número se espera una baja dispersión. 3

Podemos decir que las medidas de dispersión nos indican si los valores están relativamente cercanos uno del otro ó si se encuentran dispersos.

Las medidas de dispersión más usuales son: el rango, la desviación media, la varianza y la desviación típica o estándar.

RANGO Ó RECORRIDO

El rango ó amplitud es la medida más sencilla de calcular, pero también la más tosca, el rango no es otra no es otra cosa más que la diferencia entre el dato de mayor valor y el de menor valor, y nos da la variabilidad ó dispersión de los datos extremos, por lo que a mayor rango mayor variabilidad y a menor rango menor variabilidad.

El rango es sensible a cambios de los valores extremos (máximo y mínimo) e insensible a cambios de los valores intermedios. El rango es una burda medida de dispersión ya que no se altera cuando se cambian algunos valores de los datos intermedios que podrían ocasionar el aumento ó disminución de la media.

R = xn –x1

M.A.C Ing. Josué Salvador Sánchez Rodríguez 1

Nota: Ejemplo, en una situación donde se desea conocer solo la extensión de la dispersión extrema en condiciones ordinarias.Ejemplo: Los informes del mercado de acciones se expresa frecuentemente en términos de su amplitud cotizando precios altos y bajos de acciones durante un periodo de tiempo.

Page 2: Material Unidad IV

Unidad Académica del Norte Estadística

Ejemplo:Encontrar el recorrido de los valores:1, 4, 8, 9, 10R = 10 – 1 = 9

DESVIACIÓN MEDIA (D. M.)

La desviación media también llamada promedio de desviación, es la media aritmética de los valores absolutos de las desviaciones respecto a la media ó de la mediana. La mediana se usa a veces para calcular la desviación media (que en este caso se llama desviación mediana), porque la suma de los valores absolutos de las desviaciones respecto de la mediana es menor que las de las desviaciones respecto de cualquier otro valor, pero en la practica la media aritmética es la que se emplea generalmente.

El recorrido es una medida de dispersión. Esta basada en la posición de ciertos elementos en una distribución. La desviación media (D.M.) y la desviación estándar (s) están basadas en todos los elementos y están diseñadas para medir las dispersiones alrededor de un promedio.

Desviación Media Para Datos No Agrupados:1. Ordenar los datos en orden creciente ó decreciente de magnitud.2. Calcular la media aritmética (x).3. Encontrar el valor absoluto de las desviaciones de cada valor con respecto a la media aritmética

(xi – x).4. Encontrar la suma de los valores absolutos de las desviaciones (xi – x).5. Dividir esta suma por el número de valores (N).

D.M. = (xi – x ) NEjemplo: Obtener la D.M. de la siguiente serie de números: 68,72,78,84,87,91 x = 68+72+78+84+87+91 = 80 6 D.M. = 68-80 + 72-80 + 78-80 + 84-80 + 87-80 + 91-80 6 D.M. = 12+8+2+4+7+11 = 44 6 6D.M = 7.33

Desviación Media Para Datos Agrupados:Si los datos (x1, x2, ..., xn) se presentan con frecuencias (f1,f2, ..., fn) o sea agrupados en una tabla de

frecuencias, la desviación media puede obtenerse realizando lo siguiente:1. Encontrar la media aritmética de los datos ( x ).2. Encontrar el valor absoluto de las desviaciones entre las marcas de clase (x) y la media

aritmética ( x ) . (x – x ).3. Multiplicar cada una de las desviaciones por la frecuencia correspondiente a su clase f(x - x).4. Sumar los resultados del producto obtenido f(x – x ).5. Dividir la suma obtenida entre el número de valores de la distribución para encontrar la

desviación media.La formula es la siguiente:

D.M. = f (xi – x ) NEjemplo:

M.A.C Ing. Josué Salvador Sánchez Rodríguez 2

x = fx = 60 = 6 n 10 x = 6 D.M. = 18 = 1.8 10D.M. = 1.8

Page 3: Material Unidad IV

Unidad Académica del Norte Estadística

x F fx (x –x) F(x –x)3 2 6 3 65 3 15 1 37 2 14 1 28 2 16 2 49 1 9 3 3

10 60 18

Principales Características de la Desviación Media

1. La D.M. esta basada en cada valor de los datos. Por lo tanto da una mejor descripción de la dispersión que el recorrido.

2. La D.M. se calcula con respecto a un promedio (ejemplo, la media aritmética), por lo tanto mide la dispersión alrededor del promedio, más bien que la dispersión dentro de ciertos valores, como lo hace el recorrido.

3. La D.M. ignora el signo positivo ó negativo de las desviaciones. Esta debilidad crea la demanda por una medida de dispersión más confiable: La Desviación Estándar.

VARIANZA (S2):

Esta es otra medida de dispersión que toma en cuenta todos los datos, y que toma como punto de referencia la media aritmética, y con ella se puede eliminar el problema de los signos de las desviaciones de los números respecto de la media, en vez de no tenerlos en cuenta como en el calculo de la D.M., se eleva al cuadrado las desviaciones y luego se suman los resultados.

Varianza Para datos no Agrupados:S2 = (xi – x ) 2 N

Ejemplo: Se desea conocer cual es la varianza de las edades de los hijos de una familia siendo estas: 3, 4, 6, 8, 9, 12

x x –x (x –x)2

3 -4 164 -3 96 -1 18 1 19 2 4

12 5 25 56

M.A.C Ing. Josué Salvador Sánchez Rodríguez 3

Nota: A veces la desviación típica de los datos de una muestra viene definida con (N-1) en lugar de N en los denominadores, porque el valor resultante representa un estimador mejor de la desviación típica de una población de la que se ha tomado una muestra. Para valores grandes de N (por ejemplo N>30) prácticamente no hay diferencia.

Donde: x = x = 42 = 7 n 6s2 = (x – x ) 2 = 56 N 6s2 = 9.333

Page 4: Material Unidad IV

Unidad Académica del Norte Estadística

Varianza Para Datos Agrupados:

S2 = f(xi – x ) 2 N

1. Obtener la x.2. Restar la x a cada marca de clase (x), obtener su desviación.3. Elevar al cuadrado cada una de estas desviaciones.4. Multiplicar las desviaciones al cuadrado por su respectiva frecuencia.5. Sumar los productos anteriores.6. Dividir la suma entre el número de valores (N), para obtener la varianza.

Ejemplo:Obtener la varianza de las calificaciones de un grupo.

X F Xf x –x (x–x)2 f(x-x)2

59 2 118 -21.3 453.69 907.3868 6 408 -12.3 151.29 907.7477 7 539 -3.3 10.89 76.2386 9 774 5.7 32.49 292.4195 6 570 14.7 216.09 1296.54

385 30 2409 3480.30

x = 2409 = 80.3 s2 = 3480.30 = 116.01 30 30

DESVIACIÓN TÍPICA Ó ESTÁNDAR (S):

Esta es la medida de dispersión más utilizada en estadística socio-económica y es igual a la raíz cuadrada de la varianza, y que a partir de una serie de datos no agrupados se define por la expresión:

s = (x – x ) 2 NSi los datos están agrupados la desviación típica esta dada por:

s = f(x – x ) 2 N

Ejemplo: Encontrar la desviación estándar de los valores: 2, 3, 5, 7 y 10.Valores (x) (x – x) (x – x)2

2 -3.4 11.56

M.A.C Ing. Josué Salvador Sánchez Rodríguez 4

Nota: La varianza tiene una gran aplicación en análisis estadístico avanzado pero tiene el inconveniente de que sus unidades son las mismas que la variable al cuadrado. La varianza determina el porcentaje de las variables que no fueron consideradas, determinando así el grado de variabilidad. Para obtener una medida de dispersión en las unidades originales simplemente se toma la raíz cuadrada de la varianza y al resultado se conoce como desviación estándar.

x = 27 = 5.4 5s2 = 41.20 = 8.24 5 s = 8.24 = 2.87

Page 5: Material Unidad IV

Unidad Académica del Norte Estadística

3 -2.4 5.765 -0.4 0.167 1.6 2.56

10 4.6 21.16 27 41.20

Ejemplo: Obtener “s” de los datos siguientes.

x F fx x – x (x –x)2 f(x – x)2

2 2 4 -2.8 7.84 15.683 2 6 -1.8 3.24 6.484 5 20 -0.8 0.64 3.205 6 30 0.2 0.04 0.246 2 12 1.2 1.44 2.888 3 24 3.2 10.24 30.72

20 96 59.20

Nota: Se propone obtener la desviación típica de la estatura de los 100 estudiantes. x f 61 5 64 18

67 42 S= 2.9197 70 27 73 8

Principales Características de la S:

1. Cuando a cada valor de los datos dados se aumenta (o se disminuye) en un número fijo, la desviación estándar no se afecta. Sin embargo, cuando cada valor de los datos se multiplica (ó divide) por un número fijo, la desviación estándar también se multiplica por el número fijo. Ejemplo:

Dato OriginalValor x x – x (x – x) 2

1 -2 42 -1 16 3 9

9 14 15 14

18 56

x = 9/3 = 3 x = 18/3 = 6 x = 15/3 = 5

s = 14/3 s = 56/3 = 4.14/3 = 2 14/3 s = 14/3 El rango, la desviación media y la desviación estándar, son medidas de dispersión expresadas en

valores absolutos, son convenientes para describir la dispersión de un solo conjunto de valores. Si dos

M.A.C Ing. Josué Salvador Sánchez Rodríguez 5

C/Valor es Multiplicado por 2Valor (2) x – x (x – x)2

2 -4 164 -2 4

12 6 36

x = 96/20 = 4.8

s = 59.2 20 s = 1.72046

Page 6: Material Unidad IV

Unidad Académica del Norte Estadística

conjuntos de valores están siendo comparados, los valores absolutos son convenientes solamente cuando los promedios de los dos conjuntos son iguales. Es obvio que la comparación de dos diferentes unidades, tales como el número de kilómetros comparados con el número de pesos, no tiene sentido.

Cuando los promedios son claramente diferentes, aunque las unidades pueden ser las mismas, la tarea de comparar los grados de dispersión basados en los valores absolutos de los diferentes conjuntos es aun difícil. Ejemplo:

Comparación de Desviaciones Estándar en Valores AbsolutosConjunto 1: Peso de 3 estudiantes universitarios Conjunto 2: Peso de 3 estudiantes de primaria

Peso en libras (x) x – x (x – x)2 Peso en libras (x) x – x (x – x) 2

160 -40 1600 40 -10 100200 0 0 45 -5 25240 40 1600 65 15 225

= 600 = 3200 = 150 = 350 x = 600 = 200 x = 150 = 50

3 3

s = 3200 = 32.66 s = 350 = 10.80 3 3

Las medias de los dos conjuntos son claramente diferentes (200 libras para uno y 50 para otro). No podemos concluir que las más alta desviación estándar (32.66 libras) de el más alto grado de dispersión en los pesos de los estudiantes universitarios. La S es significativa solamente en relación con la media respecto a la cual se calcula.

Una medida de dispersión expresada en un valor relativo es, por lo tanto, requerida para este tipo de comparación.

La medida de dispersión más comúnmente usada expresada en valor relativo es el COEFICIENTE DE VARIACIÓN, representado por “V”. Es el cociente de la desviación estándar dividida por la media aritmética.

CVDE = S X

del ejercicio anterior CVDE = 32.66 = 0.1633 = 16.33 % universitarios 200

CVDE = 10.80 = 0.2160 = 21.60 % primaria 50

Por lo tanto la dispersión relativa de los pesos de estudiantes de la escuela primaria es más grande que la de los pesos de los estudiantes universitarios.

Similarmente, otra medida de dispersión, expresada en valor relativo, es:CVDM = Desviación Media

M.A.C Ing. Josué Salvador Sánchez Rodríguez 6

Nota: El coeficiente es una medida de dispersión relativa de un conjunto de datos, es un índice excento de unidades expresado en porcentajes, sirve para comparar distribuciones y así determinar cual tiene más o menos variabilidad aún cuando las unidades sean diferentes.

Page 7: Material Unidad IV

Unidad Académica del Norte Estadística

x

Obviamente, si una de las medidas de dispersión relativa es usada para describir un conjunto de datos, la misma medida debe ser usada en otro conjunto de datos para comparación.

EJERCICIO DE PRÁCTICA:

En la siguiente tabla se presentan las cantidades de 40 préstamos personales utilizados para financiar la compra de muebles y aparatos eléctricos.

Cantidades de 40 Préstamos personales

$ 932 $1 000 $ 356 $2 227

515 554 1 190 954

452 973 300 2 112

1 900 660 1 610 445

1 200 720 1 525 784

1 278 1 388 1 000 870

2 540 851 1 890 630

586 329 935 3 000

1 650 1 423 592 334

1 219 727 655 1 590

Elabore una distribución de frecuencias con los datos de la tabla.

Calcule la media aritmética.

La media geométrica.

La media armónica.

La moda.

La mediana.

Varianza

Desviación media

Desviación estándar

Coeficientes de variación

ASIMETRÍA Y CURTOSISASIMETRÍA Y CURTOSIS

M.A.C Ing. Josué Salvador Sánchez Rodríguez 7

Page 8: Material Unidad IV

Unidad Académica del Norte Estadística

En el caso de que la distribución sea moderadamente sesgada As ≈ 0, existe una relación aproximada entre las tres medidas de tendencia central:

media – moda = 3 (media – mediana)Es interesante destacar que, en el caso de distribuciones asimétricas con pico muy agudo

(curtosis alta, o sea, una curva leptocúrtica), la mediana constituye la medida de tendencia central más útil y representativa.

La forma de una distribución de frecuencia se puede describir por: (1) su simetría o falta de ella (asimetría) y (2) su agudeza (curtosis), veamos ahora el primero de estos conceptos. En la figura se ilustra la asimetría, o sea el grado de distorsión de una distribución de frecuencia desde la asimetría horizontal. El panel (a) describe la curva normal en forma de campana que tiene asimetría cero debido a que la densidad de frecuencia disminuye por igual en ambas direcciones desde la moda. El panel (b) muestra el caso de asimetría positiva, así llamada porque la densidad de frecuencia disminuye en forma más lenta hacia la derecha de la moda que hacia la izquierda, y porque la cola derecha de la curva de frecuencia apunta a la dirección positiva a lo largo de eje horizontal (hacia los valores más grandes de X). El panel (c), por último, ilustra la asimetría negativa que recibe ese nombre porque la densidad de frecuencia disminuye en forma más lenta hacia la izquierda de la moda que hacia la derecha, y porque la cola izquierda de la curva de frecuencia apunta en la dirección negativa a lo largo del eje horizontal (hacia valore más pequeños de X).

Es interesante ver que el tipo de asimetría tiene ciertas implicaciones para las posiciones de la media, la mediana y la moda. En el caso de asimetría cero, como en el panel (a), la media, la mediana y la moda coinciden. Cuando la distribución de frecuencia exhibe asimetría positiva, como el panel (b), relativamente pocos valores muy grandes elevan la media en forma considerable arriba de la moda; la mediana, que es menos sensible a valores extremos, muchas veces termina entre la media y la moda. Cuando la distribución de frecuencia es de asimetría negativa, como en el panel (c), relativamente pocos valores muy pequeños bajan la media en forma considerable abajo de la moda; la mediana, otra vez, termina muchas veces entre la media y la moda. Por tradición, los expertos en estadística prefieren usar la mediana como medida de tendencia central siempre que la distribución subyacente sea asimétrica.

EL COEFICIENTE DE ASIMETRÍA

Las diferencias entre media, mediana y moda se pueden usar para crear medidas aritméticas de asimetría. De entre las medidas de este tipo que existen, la más útil, quizá, es el coeficiente de asimetría de Pearson, Sk o sk, una medida de asimetría que se concentra en la diferencia entre la moda y la media y luego la relaciona con la desviación estándar, como en las formulas que aparecen abajo. El coeficiente recibe ese nombre en honor de Karl Pearson (1895 – 1980), un estadístico inglés.

Coeficiente de asimetría de PearsonPara una población:

Sk = µ - Mo σPara una muestra: _

sk = X – mo __ sen donde µ o X es la media poblacional o muestral, en tanto que Mo o mo la moda de población o muestra y σ la desviación estándar de la población o muestra.

Forma de una curva de frecuencia: asimetría

M.A.C Ing. Josué Salvador Sánchez Rodríguez 8

Page 9: Material Unidad IV

Unidad Académica del Norte Estadística

Estas gráficas ilustran los tres tipos de asimetría. Nótese sus implicaciones para las posiciones de la media, la mediana y la moda. Mientras estas medidas de tendencia central coinciden en el caso de asimetría cero, la media es atraída hacia los valores extremos en el caso de asimetría positiva o negativa. Alejarse desde la cola, y justo como en el diccionario, la media es seguida por la mediana y la moda. Al igual que el diccionario, la mediana está por lo general más cerca de la media que la moda; para distribuciones moderadamente asimétricas, la mediana está como a un tercio de distancia entre la media y la moda.

(a) Distribución simétrica: cero asimetría

Densidad de frecuencias relativa

XMedia

MedianaModa

(b) Distribución positivamente asimétricaDensidad de frecuencias relativa

X X Moda Media Media Moda

Mediana Mediana

Como indica el panel (a) de la figura, la media es igual a la moda para una distribución simétrica, así, el coeficiente de asimetría de Pearson es igual a cero porque µ - Mo = 0. Como muestra el panel (b), la media excede a la moda para una distribución asimétrica positivamente, por ello, el coeficiente de asimetría termina positivo, µ > Mo. Del mismo modo, como se muestra en el panel (c), la media está abajo de la moda de distribuciones asimétricas negativamente, el coeficiente de asimetría es, en consecuencia, negativo porque µ < Mo.

M.A.C Ing. Josué Salvador Sánchez Rodríguez 9

(c) Distribución negativamente asimétricaDensidad de frecuencias relativa

Page 10: Material Unidad IV

Unidad Académica del Norte Estadística

CUIDADOA veces la diferencia, multiplicada por tres, entre la media y la mediana es sustituida en las

fórmulas anteriores por la diferencia entre la media. Para distribuciones moderadamente asimétricas, esta sustitución dará casi el mismo resultado que las fórmulas anteriores porque, como muestra la figura la distancia entre media y mediana es igual entonces a casi un tercio de la que hay entre media y moda. Por lo tanto, para la población de las cantidades de utilidad de la tabla 2.2, el coeficiente de asimetría pudiera calcularse como

Sk = 3(786.62 – 533.5) = 759.36 = .90 millones de dólares. 839.29 839.29

El resultado indica asimetría positiva.

MEDIDAS DE FORMA: CURTOSIS

El grado de agudeza de una curva de frecuencia, o curtosis, se ilustra en la siguiente figura y se mide por el coeficiente de curtosis, descrito a continuación.

Coeficiente de curtosis

De datos no agrupados

Para una población:

Σ (X - µ) 4 K = N___ σ4

Para una muestra: __ Σ (X - X) 4

K = n___ s4

en donde Xs son los valores de muestra o de población observados ( con µ siendo la media poblacional y X la media muestral), mientras que N es el tamaño poblacional, n el tamaño muestral, σ 4 el cuadrado de la varianza poblacional y s4 el cuadrado de la varianza muestral.

De datos agrupados

Sustituir numeradores por Σ f(X - µ) 4 o Σ f(X - X) 4 , respectivamente, en donde X y f representan puntos

Σf Σfmedios de clase y frecuencias de clase.

La figura ilustra tipos de curtosis. Las curvas de frecuencias con una curtosis de tres se denominan mesocúrticas, las de valores más grandes son más agudas y se llaman leptocúrticas, las de valores más pequeños son más planas y se denominan platicúrticas. Si se aproxima el valor de K desde los datos de utilidad agrupados en la tabla 3.6 el resultado es 7.51, lo que sugiere una distribución leptocúrtica, como confirma el panel (b) de la figura 2.3. Igual que el coeficiente de variación, tanto el coeficiente de asimetría como el de curtosis se expresan como números puros, en consecuencia, se pueden comparar con facilidad distribuciones diferentes con respecto a su grado de asimetría o curtosis.

M.A.C Ing. Josué Salvador Sánchez Rodríguez 10

Page 11: Material Unidad IV

Unidad Académica del Norte Estadística

Forma de una curva de frecuencias: Curtosis

Esta gráfica ilustra tres tipos básicos de curtosis.

Densidad de frecuencias relativa

Leptocúrtica

Mesocúrtica

Platicúrtica

XMedia

MedianaModa

RELACIÓN ENTRE MEDIA Y MEDIANA

En toda distribución simétrica, media, mediana y moda coinciden en valor (véase figura a). En una distribución asimétrica positiva, la media siempre es mayor que la mediana (véase figura b). En una distribución asimétrica negativa, la media siempre es menor que la mediana (véase figura c). Estas dos últimas relaciones son siempre verdaderas, independientemente de que la distribución sea unimodal o no. Una medida de asimetría en estadística, basada en la diferencia entre los valores de la media y la mediana de un grupo de valores, es el coeficiente de asimetría de Pearson.

f f f Moda Media Mediana Moda Mediana Media Mediana Moda Media

M.A.C Ing. Josué Salvador Sánchez Rodríguez 11

Page 12: Material Unidad IV

Unidad Académica del Norte Estadística

x x x

a) Simétrica b) Asimétrica positiva c)Asimétrica negativa

COEFICIENTE DE ASIMETRÍA DE PEARSON

El coeficiente de asimetría de Pearson mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo de medidas. Las fórmulas son:

Asimetría de la población = 3( μ – Med) σ

_Asimetría de la muestra = 3(X – Med)

s

En una distribución simétrica, el valor del coeficiente de asimetría será siempre de cero, porque la media y la mediana son iguales entre sí en valor. En una distribución asimétrica positiva, la media siempre es mayor que la mediana; en consecuencia, el valor del coeficiente es positivo. En una distribución asimétrica negativa, la media siempre es menor que la mediana; por lo tanto, el valor del coeficiente es negativo.

EJEMPLO:En relación con los datos de ventas de equipos de aire acondicionado

presentados en el ejemplo 2, la media es 10.5 unidades, la mediana 11.0 unidades y la desviación estándar 3.3 unidades.El coeficiente de asimetría es

Asimetría = 3( μ – Med) = 3(10.5 – 11.0) = - 0.45 σ 3.3

Así, la distribución de cantidades de ventas en cierto modo asimétrica negativa, o sesgada a la izquierda.

M.A.C Ing. Josué Salvador Sánchez Rodríguez 12