ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y...

97
ESTADÍSTICA DESCRPTIVA ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia

Transcript of ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y...

Page 1: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRPTIVAESTADÍSTICA DESCRPTIVA

Tablas de Frecuencia para Variables Continuas, Representación Gráfica y

Tabla de Contingencia

Page 2: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de frecuencia Variable Continua Si la variable que se esta midiendo es de tipo

continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.

Recorrido: Es el campo de variación de la variable.

Recorrido = X máx – X mín2

Page 3: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de frecuencia Variable Continua El número y tamaño de los intervalos, dependen de la cantidad

de datos de la muestra y de su recorrido.

El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.

Los intervalos puede ser cerrado- cerrado,

cerrado- abierto

3

Page 4: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de frecuencia Variable Continua Definiciones:

1. Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K

2. Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].

3. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.

4

Page 5: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de frecuencia Variable Continua4. Marca de clase: Es el punto medio de las clases, es

decir, la semisuma del Ls y Li.

Las clases deben tener el misma Amplitud.

Amplitud = C = (Máx. - VMín) / K

Donde K es el número de clases

En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturgen.

K = (1 + 3,322 Log n)

5

Page 6: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejemplo Los siguientes datos indican el número de minutos que

ocuparon sus asientos 20 clientes de una cafetería.

Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]

¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?

¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos?

6

Page 7: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Solución

1. 45%

2. 60%7

Page 8: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

1. Histograma Consiste en un conjunto de rectángulos con:

bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.

Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.

8

Page 9: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

9

Page 10: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejemplo Dada la siguiente tabla de distribución, graficar

histograma.

10

Page 11: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

2. Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de

clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.

Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.

11

Page 12: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

12

Page 13: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

3. Ojiva: Al igual que el histograma y el polígono de

frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.

En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor

Limites superiores Ojiva menor

13

Page 14: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representación Gráfica

Ojiva Mayor

14

Ojiva Menor

Page 15: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Representaciones Gráficas

15

Page 16: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de Contingencia 2 x 2 Sirve para analizar la relación de dependencia o

independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.

1. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.

2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio.

16

Page 17: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de Contingencia 2 x 2 Para identificar relaciones de dependencia entre

variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.

17

Page 18: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de Contingencia 2 x 2 Considerando un grado de confianza del 95%, esto

implica un = 0,05.

Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.

H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.

Obtención del grado de libertad para X2 (Chi-cuadrado):

Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1

Valor tabla = 3,84

18

Page 19: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tabla de Contingencia 2 x 2

Si el resultado es menor a 3,84 no se rechaza Ho

Si el resultado es mayor a 3,84 se rechaza Ho

19

Page 20: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos Básicos: Moda, Mediana, Media en Datos no Agrupados

Page 21: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Estadígrafos Básicos

Estadígrafo o estadístico: Es un valor que, calculado sobre la base de los datos observados, sirve para caracterizar la muestra que originó los datos.

Ejemplos: El promedio común y corriente, un tanto por ciento, el rango, el IPC, etc. Todos ellos responden a la idea general de estadígrafo.

1. Es un número real

2. Se calculan con los datos observados

3. Caracterizan la muestra en estudio

Permiten condensar ,el volumen de información, a unos pocos valores que sean indicativos de todo el conjunto.

Page 22: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tipos de Estadígrafos

Page 23: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Tipos de Estadígrafos

1. Estadígrafos de posición: Son aquellos que describen la posición que ocupa la distribución de frecuencias respecto a un valor de variable.

Indican alrededor de cuál valor se agrupan los datos obtenidos.

2. Estadígrafos de dispersión: Cuantifican la variabilidad o dispersión de los datos.

Indican qué tan esparcidos están los datos obtenidos

Page 24: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Moda en datos no agrupados La moda es el valor que

tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Ejemplo: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5

R: Mo = 4

En caso de:1. Si en un grupo hay dos o

varias variables con la misma frecuencia y

2. Esa frecuencia es la máxima

Entonces la distribución es bimodal o multimodal, es decir, tiene varias modas.

Page 25: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Moda en datos no agrupados Ejemplo: Hallar la moda de

la distribución: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

R: Mo = 1, 5, 9

Cuando todos los valores de un grupo tienen la misma frecuencia, no hay moda

Ejemplo: Hallar la moda de la distribución: 2, 2, 3, 3, 6, 6, 9, 9

R: Mo = No hay moda

Page 26: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la moda para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la moda para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la moda para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Page 27: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

4. Calcule la moda de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

1. M0 = 4 personas

2. M0 = 25 minutos

3. M0 = La moda no existe

4. M0 = 4 y 5

Page 28: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética en datos no agrupados La media aritmética o el

promedio es igual a la suma de todos los valores observados, dividida por el número de datos.

Desventaja de la media aritmética:

o Es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribución de valores homogéneos.

Page 29: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética en datos no agrupados Ejemplo: Calcular la media

aritmética de la edad de 5 personas: 23 – 21 – 11 – 8 – 34

R: = (23 + 21 + 11 + 8 + 34) / 5 = 19,4 años.

Ejemplo: Una persona que trabaja en forma independiente gana un mes $100.000, otro mes $300.000 y otro $200.000. ¿Cuanto gana en promedio mensual? Interprete el resultado.

R: = (100.000 + 300.000 + 200.000) / 3

= $200.000

Interpretación: La persona debe esperar ganar cada mes $200.000, por supuesto que abra meses que ganará más y otros menos.

Page 30: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la media aritmética para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la media aritmética para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la media aritmética para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Page 31: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

4. Calcule la media aritmética de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

= 3,3 personas

= 22,67 minutos

= 3,359 Kg

= 4,375

Page 32: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos no agrupados

La Mediana de una serie de datos, es el valor de la variable que, una vez ordenadas las observaciones de menor a mayor, divide la distribución en dos segmentos tales que:

1. A lo menos, el 50% de las observaciones son iguales o menores que la mediana

2. A lo menos, el 50% de las observaciones son iguales o mayores que la mediana.

Page 33: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos no agrupados

1. Ordenar los datos de menor a mayor (recomendado) o de mayor a menor

2. Encontrar la ubicación de la mediana

3. Determinar el valor que se encuentra en el lugar señalado.

Caso en que “n” es impar. Ejemplo: Los siguientes

son el número de menores de edad por familia:

3, 2, 0, 0, 1, 2, 0.

Calcular la mediana.

1. Ordenados:

0, 0, 0, 1, 2, 2, 3

En este caso n = 7

Page 34: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos no agrupados

2. Ubicación: = (7+1)/2

Es la 4º observación o valor.

3. La 4º observación es el valor .

La Me = 1

Caso en que “n” es par. Ejemplo: Los siguientes

son el número de menores de edad por familia:

3, 2, 0, 0, 1, 2, 0, 4

Calcular la mediana.

1. Ordenados:

0, 0, 0, 1, 2, 2, 3, 4

En este caso n = 8

Page 35: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos no agrupados

2. Ubicación: = (8+1)/2

resultado 4,5

La mediana esta entre el 4º y 5º valor.

Es decir entre: 1 y 2

3. La mediana es ( 1 + 2) / 2

Me = 1,5

Page 36: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la mediana para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la mediana para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la mediana para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Page 37: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

4. Calcule la mediana de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

Me = 3,5 personas

Me = 25 minutos

Me = 3,325 Kg

Me= 4,5

Page 38: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos Básicos: Moda, Mediana, Media en Datos Agrupados

Page 39: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Moda en datos agrupados La moda se obtiene por

interpolación, mediante la siguiente formula:

Ejemplo: Calcular la moda para los siguientes datos:

Li: limite inferior de la clase.

C: amplitud del intervaloNk-1: Frecuencia absoluta

del intervalo anterior al modal.

Nk+1: Frecuencia absoluta del intervalo posterior al modal.

Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3

Page 40: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Moda en datos agrupados Intervalo modal: [2 – 4), posee la

mayor frecuencia absoluta. Li: Limite inferior del intervalo =

2 C: amplitud del intervalo modal

=2 Nk-1: Frecuencia absoluta del

intervalo anterior = 6 Nk+1: Frecuencia absoluta del

intervalo posterior = 5

Formula:

M0 = 2,9 Horas

Page 41: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la moda para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.

2. Interprete la moda obtenida en el ejercicio anterior

Page 42: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios Intervalo modal: [6 – 8), posee la mayor frecuencia absoluta.

Li: Limite inferior del intervalo = 6 C: amplitud del intervalo modal =2 Nk-1: Frecuencia absoluta del

intervalo anterior = 17 Nk+1: Frecuencia absoluta del

intervalo posterior = 14

Formula: M0= 6 + 2 ( 14 / (14 + 17))

M0 = 6,9 $ Miles

Interpretación: Lo más frecuente es que haya un gasto de $6.900 pesos mensualmente en combustible para la calefacción.

Page 43: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética en datos agrupados La media aritmética

se obtiene de la siguiente formula:

Ejemplo: Calcular la media aritmética de:

Xmi: El valor de la variable o la marca de clase.

Fi: Frecuencia de absoluta.

Xi

Page 44: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética en datos agrupados

Luego la media aritmética es:

= ( 1.068 / 30) = 35,6

Xi Xi

Page 45: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la media aritmética de los datos que representan las horas que transcurren hasta que un trabajador sufre un accidente.

2. Interprete la media aritmética obtenida en el ejercicio anterior

Page 46: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

Interpretación: En promedio cada 3,9 horas un trabajador sufre un accidente.

Page 47: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos agrupados La mediana se obtiene por

interpolación, mediante la siguiente formula:

Ejemplo: Calcular la mediana para los siguientes datos:

Li: limite inferior de la clase medial.

C: amplitud del intervalo medial

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al medial.

nk: Frecuencia absoluta del intervalo medial

Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3

Page 48: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Mediana en datos agrupados Condición a considera :

El intervalo medial es [2 – 4)

Page 49: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

1. Calcule la mediana para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.

2. Interprete la moda obtenida en el ejercicio anterior

Page 50: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicios

Interpretación: El 50% de los casos de consumo mensual destinado a calefacción se encuentra antes de 7,65 $miles y el 50% restante de los consumos mensuales esta sobre los 7,65 $miles.

Nk > n/2 Nk-1 n/2 Nk > 77/2 = 38,5 Nk-1

77/2= 38,5

El intervalo medial es: [6 – 8)

Me = 6 + 2 x (38,5 – 17) / 26 Me = 7,65

Page 51: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética ponderada en datos agrupados La media aritmética

ponderada, se obtiene de la siguiente formula:

Ejemplo: Calcular la media aritmética ponderada de:

Wi: La ponderación de la variable xi

:

ii

iii

nw

nwxwX

Page 52: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Media aritmética ponderada en datos agrupados

Luego la media aritmética PONDERADA es:

= ( 42 / 6) = 7

Page 53: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos de Localización: Cuartil, Decir y Percentil

Page 54: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Los cuartiles son puntos o

medidas que dividen a la muestra ordenada en cuatro grupos de igual tamaño.

Se denota Qi el cuartil i- ésimo con 3,2,1=i

Ejemplo: Calcular el cuartil 1, 2 y 3 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Page 55: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Calculo del 1º cuartil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a Q1 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de n/4

Con n= 27 n/4 = 27/4 = 6,75

La frecuencia absoluta acumulada que supera a 6,75 pertenece al 2º intervalo [2-4)

Page 56: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Calculo del 1º cuartil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del cuartil

C: amplitud del intervalo del cuartil

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil

nk: Frecuencia absoluta del intervalo del cuartil.

Page 57: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Interpretación: El 25% de los accidentes ocurren antes

que el trabajador cumpla 2,14 horas de trabajo y el 75% restante de los accidentes ocurren sobre las 2,14 horas de trabajo.

Calculo del 2º cuartil. El 2º cuartil el cual comprende el

50% de los datos es equivalente a la mediana.

Q2 = Me

Page 58: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Calculo del 3º cuartil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a Q3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de 3n/4

Con n= 27 3n/4 = (3 x 27)/4 = 20,25

La frecuencia absoluta acumulada que supera a 20,25 pertenece al 3º intervalo [4-6)

Page 59: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles Calculo del 3º cuartil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del cuartil.

C: amplitud del intervalo del cuartil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil.

nk: Frecuencia absoluta del intervalo del cuartil.

Page 60: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Cuartiles

Interpretación:

El 75% de los accidentes ocurren antes que el trabajador cumpla 5,3 horas de trabajo y el 25% restante de los accidentes ocurren sobre las 5,3 horas de trabajo.

Page 61: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule cada uno de los cuartiles e interprete su significado, en relación a la tabla de distribución

Page 62: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Diagrama de Caja Es una representación

semigráfica de una distribución constante.

Se utiliza cuando la muestra no es muy grande.

Construcción de una diagrama de caja:

1. Se ordenan los datos de la muestra, identificando el valor mínimo y el máximo, luego se obtiene el recorrido y los tres cuartiles.

2. Se dibuja un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, mediante un segmento de recta vertical.

Así, dentro de la caja queda representado el 50% central de la información contenida en los datos.

Page 63: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Diagrama de Caja La tabla de distribución de

frecuencias adjunta indica el número de años de experiencia de una muestra de expertos en el área de administración de empresas.

Con esta información construya un diagrama de cajas

Page 64: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Diagrama de Caja SOLUCIÓN:

Xmin = 0 años.

Xmáx = 15 años.

Q1 = 3,7 años

Q2 = Me = 5,4 años

Q3 = 7,9 años.

Page 65: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio Observe el siguiente diagrama de caja, el cual

representa la Deuda morosa de 5.400 clientes de la empresa CONAFE residentes en la comuna de Viña del Mar (Miles de $)

Realice 5 afirmaciones

Page 66: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio1. El 25% de los deudores, deben

entre 10 y 20 mil pesos.

2. De los deudores, el 50% adeuda, cuando más, $35.000.

3. El 75% de los deudores, deben más de 20 mil pesos.

4. El 25% de los deudores, deben a lo menos $40 mil a CONAFE.

5. El 50% de los deudores, deben entre 20 y 40 mil pesos.

Page 67: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Deciles Los deciles son puntos o

medidas que dividen a la muestra ordenada en diez grupos de igual tamaño.

Se denota Di el decil i- ésimo con i = 1,2,3,...,9

Ejemplo: Calcular el decil 3 y 7 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Page 68: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Deciles Calculo del 3º decil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a D3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de

(3n)/10

Con n= 27 3n/10 = 3x27/10 = 8,1

La frecuencia absoluta acumulada que supera a 8,1 pertenece al 2º intervalo [2-4)

Page 69: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Deciles Calculo del 3º decil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del decil

C: amplitud del intervalo del decil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del decil.

nk: Frecuencia absoluta del intervalo del decil.

Di: Número del decil.

Page 70: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Deciles

Interpretación:

El 30% de los accidentes ocurren antes que el trabajador cumpla 2,38 horas de trabajo y el 70% restante de los accidentes ocurren sobre las 2,38 horas de trabajo.

Page 71: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Deciles Calculo del 7º decil.

Con n= 27 7n/10 = 7x27/10 = 18,9

El intervalo del 7º decil es [4 – 6)

Reemplazando:

D7 = 4 + 2 x [ (18,9 – 17)/5 ]

D7 = 4,76 Horas

Interpretación: El 70% de los accidentes ocurren antes que el trabajador cumpla 4,76 horas de trabajo y el 30% restante de los accidentes ocurren sobre las 4,76 horas de trabajo.

Page 72: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule el 4º decil e interprete

Page 73: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Percentiles Los percentiles son

puntos o medidas que dividen a la muestra ordenada en cien grupos de igual tamaño.

Se denota Pi el perceptili- ésimo con i = 1,2,3,...,99

Ejemplo: Calcular el percentil 10 y 95 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Page 74: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Percentiles Calculo del 10º percentil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a P10 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de

(10n)/100

Con n= 27 10n/100 = 10x27/100 = 2,7

La frecuencia absoluta acumulada que supera a 2,7 pertenece al 1º intervalo [0-2)

Page 75: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Percentiles Calculo del 10º percentil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del percentil.

C: amplitud del intervalo del percentil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del percentil.

nk: Frecuencia absoluta del intervalo del percentil.

Pi: Número del percentil.

Page 76: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Percentiles

Interpretación:

El 10% de los accidentes ocurren antes que el trabajador cumpla 0,9 horas de trabajo y el 90% restante de los accidentes ocurren sobre las 0,9 horas de trabajo.

Page 77: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Percentiles Calculo del percentil 95

Con n= 27 95n/100 = 95x27/100 = 25,65

El intervalo del percentil 95 es [8 – 10]

Reemplazando: P95 = 8 + 3 x [ (25,65 – 24)/3 ] P95 = 9,65 Horas

Interpretación: El 95% de los accidentes ocurren antes que el trabajador cumpla 9,65 horas de trabajo y el 5% restante de los accidentes ocurren sobre las 9,65 horas de trabajo.

Page 78: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule el percentil 75 e interprete

Page 79: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos de Dispersión: Varianza, desviación Estándar

y Coeficiente de Variación

Page 80: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Estadígrafos de dispersión

Por si solas las Medidas de Posición no permiten caracterizar de cómo es una distribución.

Las Medidas de Dispersión, indican como se distribuyen las observaciones, generalmente con respecto a la media.

La dispersión se relaciona con la mayor o menor concentración de datos en torno a un valor central generalmente el promedio o media.

Page 81: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Varianza y Desviación Estándar Ambos estadígrafos están

relacionados.

La varianza se define, en datos no agrupados, como:

También se le define como:

La varianza se define, en datos agrupados, como:

n: Números de elementos de lamuestra.

: Media aritmética o promedio.

Xi: Valor de la variable.

ni: Frecuencia absoluta de la variable.

Page 82: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Varianza y Desviación Estándar

La Desviación Estándar o Desviación Típica es la raíz cuadrada de la varianza.

Para los datos no agrupados.

Para los datos agrupados.

Page 83: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio Se dispone de la siguiente información sobre el consumo de

un producto envasado en latas.

Se encuestó a un grupo de 20 familias y se interrogó: ¿cuántas unidades de este producto, mensualmente consume su grupo familiar?

Calcule: Media Aritmética, Varianza y Desviación Estándar

Page 84: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio RESULTADO: Media Aritmética: 2,3 unidades. Varianza: 2,61 unidades Desviación Estándar: 1,62 unidades.

Se clasifican los ingresos mensuales de los trabajadores, de una empresa (en miles de pesos), obteniéndose los siguientes resultados.

Calcule: Varianza y Desviación Estándar

Page 85: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio

RESULTADO:

Media Aritmética: 675,93 pesos.

Varianza: 7150,62 pesos

Desviación Estándar: 84,30 pesos

Page 86: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Coeficiente de Variación

El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).

Formula:

Page 87: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio La siguiente tabla muestra las horas de trabajo

transcurridas hasta que un trabajador sufre un accidente de trabajo, investigación realizada a una muestra de 27 accidentes de trabajo.

Calcule el coeficiente de variación e interprete.

Page 88: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio

La media aritmética y la desviación estándar es:

El cálculo de coeficiente de variación:

Esto significa que existe una dispersión de un 62,98% en relación a la media.

Page 89: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio

Se conoce la información respecto de los ingresos de los trabajadores de dos secciones de una empresa, A y B.

El ingreso promedio de los trabajadores de la sección A es de $950.000 con una desviación típica de $98.000.

Los trabajadores de la sección B tienen un ingreso promedio de $1.2000.000 con una desviación típica de $180.000

¿En cual de las dos secciones existe una dispersión relativa mayor? Justifique su respuesta.

Page 90: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Ejercicio

Dispersión relativa mayor en la sección B.

Page 91: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Asimetría Esta medida nos permite identificar si los datos se

distribuyen de forma uniforme alrededor del punto central (Media aritmética).

La asimetría presenta tres estados diferentes Se dice que la asimetría es positiva cuando la

mayoría de los datos se encuentran por encima del valor de la media aritmética,

La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la curva.

Page 92: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Asimetría

La asimetría negativa es cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Page 93: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Asimetría

(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).

(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.

Page 94: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Asimetría

(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.

Entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

Page 95: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Curtosis Esta medida determina el grado de concentración que

presentan los valores en la región central de la distribución.

Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Page 96: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

Curtosis (g2 = 0): la distribución es Mesocúrtica: Al igual

que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).

(g2 > 0): la distribución es Leptocúrtica

(g2 < 0): la distribución es Platicúrtica

Page 97: ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia.

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA