Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

29
UNIDAD 3 Muestro, medias de tendencia central y medidas de dispersión

Transcript of Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Page 1: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

UNIDAD 3

Muestro, medias de tendencia central y medidas de dispersión

Page 2: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

IntroducciónPara cualquier conjunto de datos estudiados es importante tener información resumida de sus características. Esta información nos indica cómo se comporta la población de datos que tenemos. Para resumir la información se utilizan dos tipos de valores que en lugar de representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que nos muestran hacia qué valores se agrupan o acumulan los datos, y las medidas de dispersión, que, de forma contraria a las anteriores, muestran cómo se dispersan o separan los datos.

Las medias de tendencia central son los valores que representan un conjunto de datos de forma tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. Las medias de tendencia central más comunes son: la media aritmética, comúnmente conocida como media o promedio, la mediana y la moda.

3.2. Medias de tendencia central

Page 3: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.1.1 MediaLa media aritmética o, simplemente, media, se denota por o por la letra μ según se calcule en una muestra o en la población, respectivamente. La media es resultado de dividir la suma de todos los valores (xi) entre el número total de datos (N).La fórmula para calcular la media de una distribución de datos, varía de acuerdo a la manera cómo los tenemos organizados.

3.2.1 Medias de tendencia central con datos no agrupados

Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir, cada valor se representa de manera individual. Las fórmulas para calcular la media es:

Población Muestra

Page 4: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Ejemplos : Todos los estudiantes en la materia Investigación de Mercados del grupo 411 son una población. Sus calificaciones en la materia fueron 92, 96, 61, 86, 79 y 84. Calcular la media aritmética.Fórmula:

3.2.1 Medias de tendencia central con datos no agrupados

Page 5: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Datos:N = 6 (Usamos la N mayúscula por que estamos hablando de una población y además tenemos 6 Calificaciones)X= 92, 96, 61, 86, 79, 84Cálculo: = ( 92 + 96 + 61+ 86 + 79 + 84 ) / 6 = 83  Conclusión: Se puede observar que la calificación promedio de la materia de investigación de mercado es de 83.

3.2.1 Medias de tendencia central con datos no agrupados

Page 6: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.1.1 MedianaLa mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el número de datos que queda a la izquierda de la mediana es igual al número de datos que queda a la derecha.

Si n es impar hay un dato que queda en medio de todos, éste será igual a la mediana. Si n es par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de esos dos datos, es decir, su suma dividida entre dos.

3.2.1 Medias de tendencia central con datos no agrupados

Page 7: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Para cuando la cantidad de valores de la distribución es impar:1. Ordenamos los valores de menor a mayor. 2. Buscamos el valor del centro. Posición = (n+1) / 2, n = numero

total de observaciones.

Por ejemplo:Supongamos que tenemos los siguientes valores:2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

3. Ordenamos: 0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

4. Calculamos la posición = ( 13 + 1 )/ 2 = 7, por lo tanto el valor en la posición 7 es 4, entonces tenemos que la Me: 4

3.2.1 Medias de tendencia central con datos no agrupados

Page 8: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Para cuando la cantidad de valores es impar:1. Ordenamos los valores de menor a mayor. 2. Buscamos los valores del centro es decir la posición de la

mediana, identificamos e numero de elementos (n): (posición = (n+1)/2 )

3. Promediamos los valores del centro.

Por ejemplo : Supongamos que tenemos los siguientes valores:5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2

4. Ordenamos: 1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 92. Buscamos los datos del centro: n= 14 observaciones, y

obtnemos lo siguiente: posición = (14 + 1) / 2 = 7.5 , por lo tanto la mediana se encuentra entre los valores 4, 5

3. Promediamos: (4+5) /2 = 4.5 por lo tanto Me: 4.5

3.2.1 Medias de tendencia central con datos no agrupados

Page 9: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.1.3 ModaPara el caso de la moda (Mo), es el valor que más se repite. Pude ver una moda, dos, tres, etc. o ninguna. Ejemplo: Supongamos que tenemos los siguientes datos: 1,1,2,2,3,3,4,4,4,4,5,5,6,6,7,8,9,9,9.La moda es 4.

3.2.1 Medias de tendencia central con datos no agrupados

Page 10: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Fórmula para calcular la media en datos agrupados por frecuencias simplesLos datos agrupados en frecuencias son aquellos que organizamos en una tabla de frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable (x) y, en otra columna, la frecuencia (fi) o el número de veces que se repite cada valor en una serie de datos.

3.2.2 Medias de tendencia central con datos agrupados

Page 11: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.2 Medias de tendencia central con datos agrupados

Las fórmulas para calcular la media con los datos organizados de esta manera son:

Page 12: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Fórmula para calcular la media para datos agrupados por clases o intervalosSe utilizará la misma fórmula del tema “Fórmula para calcular la media en datos agrupados por frecuencias simples” sólo que primero hay que obtener la marca de clase que se obtiene = (Li + Ls ) / 2 de cada calase y posteriormente se multiplica por la frecuencia absoluta.

3.2.2 Medias de tendencia central con datos agrupados

Page 13: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Ejemplos:La siguiente tabla presenta la cantidad de minutos que un grupo de ejecutivos de la industria automotriz invierte para ir de casa al trabajo.

Fórmula:

3.2.2 Medias de tendencia central con datos agrupados

Page 14: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Primero debemos organizar la

información en una tabla Ordenamos los datos de menor

a mayor, los datos quedan ordenados de la siguiente manera:

Hora colocamos los valores de menor a mayor una sola vez y contamos cuantas veces se repite la variable, la tabla queda de la siguiente manera:

Page 15: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Ahora multiplicamos cada valor de la variable por la frecuencia absoluta.Calculamos

Conclusiones: Podemos observar que el grupo de ejecutivos invierte en promedio 30.72 minutos de su casa a trabajo.

3.2.2 Medias de tendencia central con datos agrupados

Page 16: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Cálculo de la media con datos agrupados

con clases o intervalosRetomamos nuestro problema de la unidad dos “La información siguiente ofrece las cantidades invertidas cada semana en abarrotes en una muestra de 45 familias.” Fórmula:

3.2.2 Medias de tendencia central con datos agrupados

Page 17: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Retomamos nuestra distribución de frecuencias y al final de la tabla calculamos primero punto medio o marca de clase (mc = (Li + Ls / 2) La tabla queda de la siguiente manera:

3.2.2 Medias de tendencia central con datos agrupados

Page 18: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Ahora procederemos a multiplicar marca de clase por la

frecuencia absoluta:

Page 19: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Calculamos:

Conclusiones: En promedio las familias invierten en abarrotes 249.38 pesos

3.2.2 Medias de tendencia central con datos agrupados

Page 20: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.2.2 MedianaCuando se quiere calcula la mediana en datos agrupados por intervalos se tiene que buscar el intervalo donde la frecuencias acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentra n +1/2, para lo cual se utiliza la siguiente fórmula:

3.2.2 Medias de tendencia central con datos agrupados

Li = Límite inferior del renglón en donde debe estar la mediana F = Frecuencia acumulada anterior al renglón de la clase mediana fm = frecuencia del renglón de la medianaw = tamaño del intervalo.

Page 21: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Ejemplo: Seguiremos con nuestro problema de la unidad dos “La información siguiente ofrece las cantidades invertidas cada semana en abarrotes en una muestra de 45 familias.” Pero ahora calcularemos la mediana con datos agrupados.Primero paso es encontrar nuestra clase median cm = (n+1) /2 , una vez encontrada la marcamos.cm = ( 45 +1 ) / 2 = 23Nos vamos a nuestra tabla y en la columna de frecuencia absoluta acumulada buscamos el valor que cumple con 23, se puede llegar a pasar más no faltar, ver la siguiente imagen:

3.2.2 Medias de tendencia central con datos agrupados

Page 22: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15
Page 23: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Nuestra Clase mediana se encuentra en el rango de clases 203 y 283, de ahí partimos para sacar los datos para la fórmula:Datosn = 45F = 15fm = 13w = 81Li = 203Como puedes observar una vez identificada nuestra clase mediana, los datos se obtienen de la tabla.

Page 24: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Calculamos

Resultado

Como lo habíamos dicho con anterioridad la mediana es el valor que se encuentra la mitad de las observaciones, para nuestro ejemplo el valor es 252.85

3.2.2 Medias de tendencia central con datos agrupados

Page 25: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.2.2 ModaLa moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único, es decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta, siendo ésta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras bimodales si existen dos modas o multimodales si existen más de dos. Para calcular la moda con datos agrupados usaremos la siguiente fórmula:

3.2.2 Medias de tendencia central con datos agrupados

Page 26: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Seguiremos con nuestro ejemplo “La información siguiente ofrece las cantidades invertidas cada semana en abarrotes en una muestra de 45 familias.” Primero localizamos el intervalo que tiene mayor frecuencia absoluta.

3.2.2 Medias de tendencia central con datos agrupados

Li = Límite inferior del renglón en donde debe estar la moda d1 = fi con mayor valor menos la fi que se encuentra por encima de la frecuencia con mayor valor localizadod2 = fi con mayor valor menos fi que se encuentra de bajo de la frecuencia con mayor valorw = tamaño del intervalo

Page 27: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

3.2.2 Medias de tendencia central con datos agrupados

Como podemos observar sigue siendo la clase de intervalo de 203 y 283, sin embargo tenemos dos valores iguales fi = 13, significa que tenemos dos modas. Para nuestros efectos de ejemplo tomaremos los valores del renglón marcado con amarillo

Page 28: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Datos:d1 = 13 – 10 = 3d2 = 13 -13 = 0w = 81Li = 203 Calculamos

3.2.2 Medias de tendencia central con datos agrupados

Como podemos ver el valor que más se repite es 203. Nota: Cuando existen valores en la frecuencia absoluta los más grandes y estos se repiten se deben de calcular las dos modas.

Page 29: Muestro, medias de tendencia central y medidas de dispersio n 13_14_15

Montgomery, Douglas C. y George C. Runger

(1996). Probabilidad y Estadística aplicadas a la ingeniería. Cuarta edición. México: McGraw-Hill.

Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para Ingeniería y ciencias. Octava edición. México: Pearson Educación.

Estadística y probabilidad. Consultado 5 de Diciembre del 2014 en: http://www.vitutor.com/estadistica.html

Referencia bibliográfica