Unidad 3

20
Unidad 3. Medidas de tendencia central y dispersión Presentación de la unidad Para cualquier conjunto de datos estudiados es importante tener un resumen de la información y sus características. Esta información indica cómo se comporta la población de datos que tienes. Para resumir la información se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que muestran hacia qué valores se agrupan o acumulan los datos; y las medidas de dispersión, que de forma contraria a las anteriores, muestran cómo se dispersan o separan los datos. Propósito de la unidad En esta unidad: Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos agrupados y no agrupados. Competencia específica Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos mediante la representación numérica y gráfica de la información obtenida en una muestra o población. 3.1. Medidas de tendencia central Las medidas de tendencia central Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te ayudan a saber dónde están acumulados los datos sin indicar cómo se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central

Transcript of Unidad 3

Page 1: Unidad 3

Unidad 3. Medidas de tendencia central y dispersión

Presentación de la unidad

Para cualquier conjunto de datos estudiados es importante tener un resumen de la información y sus características. Esta información indica cómo se comporta la población de datos que tienes. Para resumir la información se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que muestran hacia qué valores se agrupan o acumulan los datos; y las medidas de dispersión, que de forma contraria a las anteriores, muestran cómo se dispersan o separan los datos.

Propósito de la unidad

En esta unidad:

Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos agrupados y no agrupados.

Competencia específica

Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos mediante la representación numérica y gráfica de la información obtenida en una muestra o población.

3.1. Medidas de tendencia central

Las medidas de tendencia central

Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te ayudan a saber dónde están acumulados los datos sin indicar cómo se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central más comunes son: la media aritmética (conocida como media o promedio), la mediana y la moda.

3.1.1. Media

Media aritmética

La media aritmética o, simplemente, media, se denota por x la letra μ según se calcule en una muestra o en la población, respectivamente.  La media  es resultado de dividir la suma de todos los valores de los datos entre el número total de datos.

La manera como se organizan los datos: no agrupados y agrupados (por frecuencias o intervalos),determina la expresión de la fórmula para calcular la media.

Page 2: Unidad 3

Fórmula para datos no agrupados

Los datos no agrupados son aquellos datos que se organizan en una tabla de datos, es decir, cada valor se representa de manera individual. Las fórmulas para calcular la media son:

En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra N y el total de la muestra se representa con la letra n.

Fórmula para datos agrupados en frecuencias

Los datos agrupados en frecuencias son aquellos que se organizan en una tabla de frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable y, en otra columna, la frecuencia o el número de veces que se repite cada valor en una serie de datos.

Las fórmulas para calcular la media con los datos organizados de esta manera son:

Fórmula para datos agrupados en intervalos

Los datos agrupados en intervalos son los que se organizan dentro de un rango establecido entre un límite inferior y un límite superior. Recuerda que las tablas de

Page 3: Unidad 3

intervalos muestran el número de datos que abarca cada intervalo (frecuencia por intervalo). Las fórmulas para calcular la media con los datos organizados de esta manera son:

Los suguientes documentos te ayudarán a comprender cómo se usan las fórmulas,da clic en los iconos para descargarlos.

 

Reglas de las sumatorias  

Ejemplo de media en datos no agrupados   Ejemplo de media en datos agrupados

por frecuencias   Ejemplo de media en datos agrupados por intervalos  

Actividad 1: Medidas de tendencia central. Media

Para realizar las actividades de esta unidad, utilizarás los problemas que resolviste en la Actividad 2: Frecuencias de la Unidad 2. Lo recomendable es que trabajes con las tablas que ya habías elaborado, si no tienes el archivo puedes descargarlo a continuación.

Da clic en el icono para descargar el documento Frecuencias.

Page 4: Unidad 3

Con los datos de este problema, tendrás que obtener las medidas de tendencia central y dispersión que revisarás a lo largo de la unidad, por lo tanto, esta actividad está dividida en seis momentos.

Es importante que la actividad la realices paso a paso, ya que si tienes dudas sobre el uso de las fórmulas, puedes consultarlas a tiempo con tu Facilitador(a); además, tendrás que entregar tu trabajo al final del tema.

1. Analiza el problema y selecciona la fórmula adecuada para obtener la media aritmética.

2. Si tienes dudas sobre el uso de la fórmula que seleccionaste, puedes consultar a tus compañeros(as) y/o a tu Facilitador(a). Para ello, utiliza el foro Medidas de tendencia central, donde puedes publicar todas tus inquietudes sobre el tema y comentar las de tus compañeros(as).

3. Guarda tu documento como EB_U3_MTC_XXYZ, en formato Word 97-2003. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.

Aún no debes enviar tu documento, recuerda tenerlo a la mano para realizar la Actividad 2. No olvides incluir la fórmula y las operaciones que realices.

Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic enEstadística. Se enlistarán las actividades, da clic en Foro: Medidas de tendencia central.

Page 5: Unidad 3

3.1.2. Mediana

Mediana

La segunda medida de tendencia central es la mediana, esta se define como:

 El valor que divide en dos partes iguales una serie de datos, es decir, la cantidad de datos que quedan a la derecha de la mediana es igual a la cantidad de datos que quedan a la izquierda. Se representa por Me.

Para calcular la mediana, debes hacer lo siguiente:

Para cuando la cantidad de valores es impar

 

Para cuando la cantidad de valores es par

Ordena los valores de menor a mayor ybusca el valor del centro.

Por ejemplo:

1. Supón que tienes los siguientes valores: 2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

2. Ordena:

0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 93. El dato que divide a la mitad es:

4, por lo tanto Me: 4

Ordena los valores de menor a mayor,busca y promedia los valores del centro.

Por ejemplo:

1. Supón que tienes los siguientes valores:5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2

2. Ordena:

1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

3. Busca y promedia los datos del centro

4+5=9/2= 4.5, por lo tanto Me: 4.5

Mediana en datos agrupados por intervalos

Cuando quieres calcular la mediana en datos agrupados por intervalos, tienes que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre N/2, para ello utiliza la siguiente fórmula: 

  Donde:

Lies el límite inferior del intervalo donde se encuentra la mediana.es la división de las frecuencias absolutas entre 2.

Fi-1es la frecuencia acumulada anterior al intervalo de la mediana.

fies la frecuencia absoluta del intervalo donde se encuentra la mediana.

ai es la amplitud del intervalo.

Page 6: Unidad 3

Lee el documento Mediana por intervalos.

 Ejemplo de mediana por intervalos

Actividad 2: Medidas de tendencia central. Mediana

1. Retoma el problema que utilizaste en la actividad anterior para obtener la media aritmética.

2. Con los datos obtenidos, calcula la mediana, incluyendo fórmula y las operaciones que realices.

3. Recuerda  que en el foro Medidas de tendencia central, puedes plantear tus dudas sobre el tema.

4. La nomenclatura que debe tener tu archivo es la misma que se definió en la actividad anterior, EB_U3_MTC_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.

Nota: Todavía no debes enviar tu documento, consérvalo.

3.1.3. ModaLa tercera medida de tendencia central es la moda.

La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valor que se repite más veces en una serie de datos. La moda se denota por Mo. 

Page 7: Unidad 3

Cuando todos los valores de la distribución de datos tienen igual número de frecuencia, se dice que no hay moda.

Moda en datos agrupados por intervalos

Cuando la distribución de datos es por intervalos de clase, primero se localiza el intervalo que tiene mayor frecuencia absoluta utilizando la siguiente fórmula para calcular la moda:   

Donde:Li es el límite inferior del intervalo modal.fi es la frecuencia absoluta del intervalo modal.fi—1 es la frecuencia absoluta del intervalo anterior al intervalo modal.fi-+1 es la frecuencia absoluta del intervalo siguiente al intervalo modal.ai es la amplitud del intervalo.

 

Lee el documento Moda por intervalos de clase.

Ejemplo de moda por intervalos

Actividad 3: Medidas de tendencia central. Moda

1. Calcula la moda en el problema Frecuencias. Recuerda que ya debiste haber obtenido la media y la mediana.

2. Si tienes dudas, plantéalas en el foro Medidas de tendencia central, para que sean resueltas de manera grupal.

3. Conserva el nombre que ya le habías dado a tu documento, EB_U3_MTC_XXYZ. Súbelo a la base de datos para que tus compañeros(as) y tu Facilitador(a) lo revisen y te retroalimenten. Recuerda que tu archivo no debe pesar más de 4 MB.

4. Revisa los trabajos de tus compañeros(as) y coméntalos.

Para subir tu documento: En la ruta(parte superior izquierda del aula) da clic enEstadística. Se enlistarán las actividades, da clic en Actividad 3: Medidas de tendencia central.

3.2. Medidas de dispersión

Page 8: Unidad 3

A diferencia de las medidas de tendencia central, que miden acumulaciones en un solo punto, las medidas de dispersión miden el grado de separación o alejamiento que tiene una variable estadística con respecto a una medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida de posición con respecto al conjunto total de datos. A mayor dispersión, menor representatividad de la medida de posición y viceversa.

3.2.1. Recorrido

El recorrido representa la diferencia que hay entre el primero y el último valor de la variable, también se le conoce como rango y se denota por Re.

La fórmula para calcularlo es:

Donde:

máx xi es el valor máximo de la variablemin xi es el valor mínimo de la variable

Por ejemplo:

Si tienes la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74, 69, 52, 76, calcula el rango, sustituyendo los valores Re=78-52=26

Actividad 4: Medidas de tendencia central. Recorrido

Las actividades de este tema se desarrollarán de manera similar que las actividades del tema anterior. En esta actividad también está disponible un espacio para que plantees tus dudas sobre le tema y el uso de las fórmulas, este foro se titula Medidas de dispersión.

1. Con los datos del problema Frecuencias (el cual trabajaste en actividades anteriores), calcula el recorrido de la distribución.

2. Guarda tu documento como EB_U3_MD_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que el peso de tu archivo no debe ser mayor a 4 MB.

3. Conserva tu archivo porque lo utilizarás en las Actividades 5 y 6. No olvides incluir las fórmulas y las operaciones que realizas.

Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades, da clic en Foro: Medidas de tendencia central.

3.2.2. Varianza

Page 9: Unidad 3

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmética de éstos.

La fórmula de la varianza para datos no agrupados es:

Para calcularla en una población:

Donde

es la suma de los cuadrados de los valores de X menos la media

Para calcularla en una muestra: N, n

es el número total de datos.

 

Lee el archivo Varianza para datos no agrupados.

Ejemplo de varianza para datos no agrupados

Varianza para datos agrupados por intervalos

La fórmula para calcular la varianza en datos agrupados por intervalos es la siguiente: 

Para calcularla en una población:

Donde:

Fies la frecuencia del intervalo.

Mcies la marca de clase del intervalo.

Para calcularla en una muestra:

es la media de la distribución de datos.

N, nes el número total de datos de la distribución.

  

Para ver un ejemplo, lee el documento Varianza en datos agrupados por intervalos.

Ejemplo de varianza en datos agrupados por intervalos.

Actividad 5: Medidas de dispersión. Varianza

1. Ya que obtuviste el recorrido de la distribución de datos del problema Frecuencias, calcula la varianza, incluyendo la fórmula y las operaciones.

Page 10: Unidad 3

2. Conserva tu archivo como EB_U3_MD_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno.

3. Recuerda, si tienes dudas puedes comentarlas en el foro Medidas de dispersión.

Nota: Aún no envíes tu tarea. Hace falta trabajar una medida más.

Para ingresar al foro: En la ruta (parte superior izquierda del aula) da clic enEstadística. Se enlistarán las actividades, da clic en Foro: Medidas de dispersión.

3.2.3. Desviación típica

La desviación típica o estándar muestra qué tan alejado está un dato del valor de la media aritmética, es decir, la diferencia que hay entre un dato y la media aritmética.

Se denota como S o

según se calcule en una muestra o en toda la población, respectivamente.

Se define como la raíz cuadrada positiva de la varianza. Se expresa mediante las siguientes fórmulas:

En datos no agrupados

  Para una población   Para una muestra  

     

En datos agrupados agrupados por intervalos

     

Para ver un ejemplo de la aplicación de la fórmula, descarga los documentos Desviación estándar en datos no agrupados y Desviación estándar en datos agrupados por intervalos.

  Ejemplo de desviación estándar en datos no agrupados Ejemplo de desviación estándar en datos agrupados por intervalos

Actividad 6: Medidas de dispersión. Desviación típica

Page 11: Unidad 3

1. Con los datos de la varianza que obtuviste en la actividad anterior, calcula la desviación típica en el mismo problema.

2. Conserva el nombre que ya le habías dado a tu documento (EB_U3_MD_XXYZ) y compártelo en la base de datos para que tus compañeros(as) y tu Facilitador(a) lo revisen y te retroalimenten.

3. Revisa los trabajos de tus compañeros(as) y coméntalos.

Recuerda que tu documento debe incluir las fórmulas y operaciones correspondientes a cada medida. 

Para subir tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadística. Se enlistarán las actividades de la unidad, da clic en la Actividad 6: Medidas de dispersión.

Actividad 7: Problemas

1. Descarga el documento Problemas y elabora lo que se te pide.2. Guarda tu documento como EB_U3_PR_XXYZ, en formato Word 97-2003, y

envíaselo al (a la) Facilitador(a). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Recuerda que tu archivo no debe pesar más de 4 MB.

No olvides incluir en tu documento las fórmulas que utilices y las operaciones que realizaste para resolver los problemas, al igual que las tablas de frecuencias, si es el caso.

Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic enEstadística. Se enlistarán las actividades, da clic en la Actividad 7: Problemas.

Da clic en el icono para descargar el documento Problemas.

Autoevaluación

Autoevaluación

Has llegado al final de la unidad, ahora resuelve el ejercicio de autoevaluación.

Para resolver la autoevaluación: En la ruta (parte superior izquierda del aula) da clic enEstadística. Se enlistarán las actividades, da clic en la Autoevaluación.

Evidencia de aprendizaje: Medidas de tendencia central y dispersión

Para elaborar la evidencia de esta unidad, realiza lo siguiente:

1. Retoma el trabajo que entregaste como evidencia en la Unidad 2.

Page 12: Unidad 3

2. Para la variable edad y la variable carrera, obtén las medidas de tendencia central y dispersión. Para la variable carrera, debes obtener las medidas por carrera, del mismo modo como elaboraste las tablas de frecuencias.

3. Describe brevemente qué significa cada una de las medidas.4. Al final de tu trabajo incluye, a manera de conclusión, una reflexión sobre lo

siguiente:

¿Qué tipo de información obtuviste con el análisis de los datos? Si fueras director del campus virtual ¿para qué podrías utilizar esta

información? Describe, de manera breve, algunos ejemplos. ¿Cuál es la utilidad de la estadística en tu formación académica, tus

actividades profesionales y tu vida personal?

5. Entrega tu trabajo organizado del mismo modo que lo entregaste en la Unidad 2, es decir:

Incluye una presentación donde describas de dónde se obtuvieron los datos y la finalidad del análisis de los mismos.

El procedimiento que seguiste para obtener la muestra. Las tablas, las gráficas, las medidas de tendencia central y dispersión con una

descripción. Agrega tu conclusión.

6. Envía tu trabajo como EB_U3_EA_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que tu documento no pese más de 4 MB.

Recuerda que una vez que recibas las observaciones, puedes enviar una segunda versión de tu trabajo con las adecuaciones necesarias.

7. Consulta la escala de evaluación de esta evidencia de aprendizaje.

  Da clic en el icono para descargar la Escala de evaluación. 

Cierre

Has concluido la Unidad 3 y con ella la asignatura Estadística básica.

En esta unidad revisaste qué son y cómo se calculan la medidas de tendencia central y dispersión.

Page 13: Unidad 3

Recuerda que las medidas de tendencia central son la media, la mediana y la moda y que las medidas de dispersión son el recorrido, la varianza y la desviación típica. Estos datos se utilizan para resumir la información que se está estudiando.

En esta asignatura viste los conceptos básicos de la estadística descriptiva y revisaste algunas de sus aplicaciones, esperamos que te sea de utilidad.

Para saber más

En la siguiente dirección electrónica puedes encontrar explicaciones, ejemplos y ejercicios sobre los temas que se abordaron en esta unidad: http://www.vitutor.com/estadistica.html

Fuentes de consulta

Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadística aplicadas a la ingeniería (4ª ed.). McGraw-Hill, México. 

Walpole, Ronald E., Myers Raymond H., et al. (2007). Probabilidad y Estadística para Ingeniería y ciencias (8ª ed.). México: Pearson Educación.

Medidas de tendencia central y dispersión. Consultado el 27 de abril de 2010 en: 

http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescriptivavariables2.pdf 

http://www.vitutor.com.estadistica.html

Page 14: Unidad 3

Comenzado el viernes, 26 de octubre de 2012, 16:45

Completado el viernes, 26 de octubre de 2012, 16:46

Tiempo empleado 37 segundos

Calificación 10 de un máximo de 10 (100%)

Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.

En una colonia de la Ciudad de México se obtuvo una muestra aleatoria del monto del consumo mensual de energía eléctrica. Los datos obtenidos en pesos son los siguientes:

20, 30, 39, 45, 55, 21, 31, 40, 46, 65, 74, 68, 82, 108, 123, 154, 167, 193, 181, 95, 81, 64, 25, 32, 141, 152, 167, 173, 194, 204, 208, 73, 97, 94, 87, 120, 151, 140, 21, 64, 52, 39, 52, 165, 172, 94, 83, 24, 193, 119

Question1Puntos: 2

Media

Respuesta:

 

Retroalimentación

La media o el promedio de los datos es el resultado de la suma de todos los valores entre el número total de datos.

La fórmula para calcularla en datos agrupados por intervalos:  , porque se está calculando en una muestra.

CorrectoPuntos para este envío: 2/2.

Question2Puntos: 2

Mediana

98.3

Page 15: Unidad 3

Respuesta:

 

Retroalimentación

La mediana es el valor que divide a la mitad los datos. La fórmula para calcularla

en datos agrupados por intervalos es: 

CorrectoPuntos para este envío: 2/2.

Question3Puntos: 1

Moda

Respuesta:

 

Retroalimentación

La moda es el valor del dato que se repite más veces. En este caso se ocupa la

siguiente fórmula: 

CorrectoPuntos para este envío: 1/1.

Question4Puntos: 1

Recorrido

Respuesta:

 

Retroalimentación

El rango o recorrido es el resultado de restar el primero y el último valor de la variable. Se calcula con la fórmula: Re = máx xi - min xi

CorrectoPuntos para este envío: 1/1.

75.25

41

188

Page 16: Unidad 3

Question5Puntos: 2

Varianza

Respuesta:

 

Retroalimentación

La varianza siempre es mayor o igual a cero y está dada por la media de los cuadrados de las diferencias del valor de los datos, menos la media aritmética de éstos.

La fórmula para calcularla es  , porque se calcula en una muestra.

CorrectoPuntos para este envío: 2/2.

Question6Puntos: 2

Desviación típica

Respuesta:

 

Retroalimentación

La desviación típica o estándar muestra qué tan alejado está un dato de la media.

La fórmula para calcularla es  , porque se está calculando en una muestra.

CorrectoPuntos para este envío: 2/2.

3391.0109

58.2323

Page 17: Unidad 3