Distribución Multimodales

Post on 27-Dec-2015

126 views 0 download

Transcript of Distribución Multimodales

Distribución Multimodales

¿Qué sucede cuando tenemos dos valores diferentes y cada uno parece ser el mayor numero de veces que aparece un valor en

un conjunto de datos?

Errores de facturación por día en un periodo de 20 días 0 2 6 9

0 4 6 9

1 4 7 10

1 4 8 12

1 5 8 12

Tiene 2 modas que son los dos puntos mas altos se le llama distribución bimodal

0 1 2 3 4 5 6 7 8 9 10 11 120

0.51

1.52

2.53

3.5

Distribución Bimodal con Dos Modas Diferentes

Característica Principal de la Moda los valores extremos no afectan indebidamente a la moda

Comparación de la Media, Mediana y Moda

¿Qué tipo de medida utilizo media, mediana o moda?

Distribuciones Simétricas

Para estas distribuciones que solo contienen una sola moda siempre tienen el mismo valor para la media, mediana y la moda.En estos casos, no es necesario escoger la medida de tendencia central pues ya esta esta hecha la selección.

Distribución con Sesgo Positivo

Distribución con Sesgo Positivo

¿Cual escogemos?

Cuando la población esta sesgada negativa o positivamente, la mediana suele ser la mejor medida de posición, debido a que siempre esta entre la moda y la media.Al intentar decidir los usos de la media, la mediana y la moda, debe pensarse en situaciones practicas en las que cada una de ellas tiene mas sentido.

Dispersión

La media de las tres curvas es la misma, pero la curva A tiene menor separación(o variabilidad) que la curva B, y esta tiene menor variabilidad que la C.

¿Por que es Importante?

Debemos medir también su dispersión, separación o variabilidad.1.- Nos proporciona información adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia central.2.- Existen problemas característicos por datos muy dispersos, debemos ser capaces de reconocer esa dispersión amplia para poder abordar ese problemas.

Rango

Es la diferencia entre el mas alto y el mas pequeño de los valores observados.

Pagos Anuales hechos por Blue Cross-Blue Shield(miles) Cumberland 863 903 957 1041 1138 1204

1354 1624 1698 1745 1802 1883

Valley Falls 490 540 560 570 590 600

610 620 630 660 670 690

Rango

El Rango de Cumberland $1,883,000 - $ 863,000= $ 1,020,000El Rango de Cumberland $690,000 - $ 490,000= $ 200,000Pero su utilidad es limitada, debido a que solo mide dos valores.

Rango Interfractil

En una distribución de frecuencias, una fracción o proporción dada de los datos caen en un fractil o debajo de este por ejemplo la mediana es el fractil 0.5 por que la mitad del conjunto de datos es igual o menor a este valor.

Estos son parecidos a los porcentajes, en una distribución cualquiera, 25% de los datos están en el fractil 0.25 o debajo de este.

Rango Interfractil

Es una medida de la dispersión entre dos fractiles de una distribución de frecuencias, es decir, la diferencia entre los valores de los dos fractiles.Suponga que deseamos encontrar el rango interfractil entre el primer y segundo tercio de los donativos recibidos por Cumberland.Empezamos a dividir las observaciones en tercios.

Rango InterfractilPagos anuales de la Blue Cross-Blue Shield al Hospital Cumberland (miles)

Primer tercio

Segundo Tercero

863 1,138 1,698

903 1,204 1,745

957 1,354 1,802

1,041 1/3 Fractil 1,624 2/3 Fractil 1,883

Cada tercio cuatro observaciones (0.33% ) del total de los 12 elementos. Entonces el 33.33% de los elementos esta en $1,041,00 o debajo de este valor, y 66.66% es menor o igual que $ 1,624,000.Ahora podemos calcular el rango interfractil entre los fractiles .33 y .66 restando $1,014,000 – $1,624,000. Esta diferencia es de $583,00 es la dispersión entre el valor mas alto de primer tercio y el valor mas alto del segundo tercio.

Rango Interfractil

Los fractiles tienen nombres especiales, dependiendo del numero de partes iguales en que se dividen datos.Por ejemploSe dividen 10 partes – decilesSe dividen 4 partes – cuartilesSe dividen 100 partes - percentiles

Rango intercuartil

Mide aproximadamente que tan lejos de la mediana debemos ir en cualquiera de las dos direcciones antes de recorrer una mitad de valores.Para calcular este rango:Dividimos nuestros datos en cuatro partes, cada una de los cuales tiene el 25% de los elementos de la distribución.Los cuartiles son, entonces, los valores mas altos de cada una de estas cuatro partes y el rango intercuartil es la diferencia entre los valores del primero y tercer cuartiles.

Rango intercuartil

Los anchos de los cuatro cuartiles no necesariamente son los mismos.Si los datos se dispersan muchos, será riesgoso apostar al promedio sin considerar la dispersión.

EjerciciosEjercicio 3.11Se presentan las calificaciones de un examen de historia. Encuentre el percentil 80.

95 81 59 68 100 92 75 67 85 79

71 88 100 94 87 65 93 72 83 91

Se ordenan los datos de orden ascendente

59 65 67 68 71 72 75 79 81 83

85 87 88 91 92 93 94 95 100 100

El dato 16 (es decir 93) es el percentil 80.

Ejercicios

Rango = 20,300 – 3,600 = 16,700Rango Intercuartil = Q3 – Q1= 12,700 – 8,100 = 4,600 millas

Ejercicios