resumen estadistica

13

Click here to load reader

Transcript of resumen estadistica

Page 1: resumen estadistica

Estadisticas I

Medidas tendencia central: Media Mediana Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir los datos (“Punto central”) Estas medidas aplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población. Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda. las Medidas de tendencia central, nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar

La mediaLa media se define como la suma de todos los valores observados, dividido por el número total de observaciones. 

La mediana Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula

MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nos indica el valor que más se repite dentro de los datos

Medidas de Dispersión - Varianza y Desviación las Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir, nos indican cuanto se desvían las observaciones alrededor de su

1

Page 2: resumen estadistica

Estadisticas I

promedio aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas son la Varianza y la Desviación estándar (o Típica).

. VARIANZA

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería: 

Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media poblacional y (N) es el número de observaciones ó tamaño de la población

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor.  Re = xmax - xmin

Desviación estándar o Típica

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería: 

Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco

2

Page 3: resumen estadistica

Estadisticas I

unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.  Por lo que su media es: 

 La varianza sería: 

 Por lo tanto la desviación estándar sería: 

 Escalas de Medida

 Para realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadísticos. La clasificación más convencional de las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervalo y Razón. 

1. NOMINAL

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarle un valor a los hombres y otro diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro. 

2. ORDINAL

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico.

3

Page 4: resumen estadistica

Estadisticas I

Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible. 

3. INTERVALO

Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados. 

4. RAZÓN

Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida. 

FRECUENCIAS

Este procedimiento nos permite analizar de forma descriptiva las variables Categóricas o de Escala, mediante la generación de tablas de frecuencia, Gráficos y una amplia gama de estadísticos como las medidas de tendencia central, de Dispersión y de Distribución. Además nos permite organizar los resultados de forma ascendente o descendente ya sea por sus valores o sus frecuencias.

4

Page 5: resumen estadistica

Estadisticas I

 

 Medidas de Posición: Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles y los percentiles.

 u PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%

 u CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son

un caso particular de los percentiles:

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

 u DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles.

Ejemplos:El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.

SOLUCIÓN:

  La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:

5

Page 6: resumen estadistica

Estadisticas I

 La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2=

 La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

 El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

 El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética

CV = 20,67/52,3 = 0,39

Problema #1:

6

Page 7: resumen estadistica

Estadisticas I

Una guardería es una institución elegible para recibir un subsidio destinado a los servicios sociales del corregimiento, a condición de que la edad promedio de sus niños no llegue a 9 años. Si los datos siguientes representan la edad de todos los niños que actualmente asisten a ella:

8 5 9 10 9 12 7 12 13 7 8

a. ¿Llena el requisito para recibir el subsidio?

14,500 15,600 12,500 8.000 7,800

6,500 5,900 10,200 8,800 14,300

13,900

b. La guardería del ejemplo anterior puede continuar siendo subvencionada por la oficina de servicios sociales de la Junta Comunal, mientras el ingreso anual promedio de la familia cuyos asisten a esa institución no llegue a B/.12,500.00. El ingreso familiar de los padres de los niños es;

c. ¿Llena esta institución los requisitos para recibir apoyo financiero de la Junta Comunal del Corregimiento?

d. Si la respuesta a (c) es negativa, ¿cuánto debe disminuir el ingreso familiar para cumplir esa condición?

e. Si la respuesta a (c) es afirmativa, ¿cuánto puede aumentar el ingreso familiar promedio, sin que la institución pierda su elegibilidad para recibir el subsidio?

Problema #2:

Una granja ganadera registro durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente:

22 31 33 34 35 36 37 38 38 39

40 40 40 41 41 42 42 42 42 42

43 43 44 45 46 46 46 46 50  

Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvo la siguiente tabla resultante.

clases fi

21.5 – 26.5 1

26.5 – 31.5 1

31.5 – 36.5 4

7

Page 8: resumen estadistica

Estadisticas I

36.5 – 41.5 9

41.5 – 46.5 13

46.5 – 51.5. 1

Total 29

Calcule en las dos variantes (datos no agrupados y datos agrupados) la media aritmética, la mediana y la moda.

Problema #3:

El peso en kilogramos de un grupo de estudiantes del sexo masculino en un curso de educación física, son los siguientes:

clases fi

52.5 – 57.5 8

57.5 – 62.5 9

62.5 – 67.5 6

67.5 – 72.5 4

72.5 – 77.5 2

77.5 – 82.5. 1

Total 30

Encuentre la media, la mediana y la Moda. Compare los resultados utilizando la fórmula señalada anteriormente en el texto relativa a la correspondencia entre estas tres medidas de tendencia central.

Problema #4:

Un profesor ha decidido utilizar un promedio ponderado al calcular las calificaciones finales de los estudiantes que asistieron a su seminario. El promedio de las tareas hechas en casa representan el 20% de cada calificación, el examen parcial, 25%; el examen final, 35%; el examen trimestral, 10% y los problemas de practica, 10%. Con los datos anexos calcule el promedio final de los cinco estudiantes que asistieron al seminario

Alumno Tarea escolar

Problemas Examen

trimestral

Examen parcial

Examen final

8

Page 9: resumen estadistica

Estadisticas I

1 85 89 94 87 90

2 78 84 88 91 92

3 94 88 95 86 89

4 82 79 83 84 93

5 95 90 92 82 88

Respuestas

I.-

  1) 22

2) 49

3) 179

4) 73

5) 7(88) = 616

6) 12

II-.

1) 30

2) 23

3) 6 + 17 = 23

4) 5(47) = 235

5) 17 + 30 = 47

6) 53

7) 5(8) = 40

8) 1(10) = 10

9