Post on 03-Feb-2016
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Estadística
Ing. Iliana Rosero
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Definiciones
• Los datos son observaciones recolectadas.
• La Estadística es el conjunto de métodos para planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Definiciones
• La población es el conjunto completo de todos los elementos que se va a estudiar.
• El censo es el conjunto de datos de cada uno de los miembros de la población.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Definiciones
• Una muestra es un subconjunto de miembros de la población.
• La muestra debe ser seleccionada aleatoriamente y representativa de la población
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ramas de la Estadística
• Estadística Descriptiva
• Recolección,
• Resumen
• Presentación
de datos.
• Estadística
Inferencial • Obtiene conclusiones
acerca de una población a partir de una muestra.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Fuente de Datos
Fuentes SecundariasCompilación de datos
Observación
Experimentación
Impreso o eletrónico
Encuesta
Fuentes PrimariasColección de datos
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Un parámetro es una medición numérica que describe alguna característica de la población.– En la ciudad de Guayaquil, están ubicados 10000
semáforos. – Existen 2000 buses de transporte interprovincial de
los cuales el 40% son nuevas unidades.
• Un estadístico es una medición numérica que describe alguna característica de la muestra.– Al entrevistar a 30 transeúntes se encontró que el
30% tiene mas de dos hijos.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
• De acuerdo con una encuesta de Goldman, cerca del 4% de los hogares estadounidense utilizan servicios bancarios online. Una encuesta realizada por Cyber Dialogue investigó las razones por las que la gente abandona esta opción . A continuación se ofrece los resultados obtenidos:
¿Por qué abandonó el banco online?Demasiado tiempo... 40%No lo necesita ..........30%No confía en el sistema..20%.Demasiado costoso........10%
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Describa la población de la encuesta Goldman
• Describa la población de la encuesta Cyber Dialogue.
• El 40% de quienes respondieron indicaron que el banco en línea era demasiado complicado .¿Es esto un parámetro o un estadístico?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Tipo de datos
Datos cualitativos: se dividen en categorías que se distinguen por características no numéricas.
• Ej: Estatus Marital, Color de ojos
Datos cuantitativos: consisten en números que representan conteos o mediciones.– Datos discretos: Respuesta numéricas que resultan de un
conteo.
• Ej. Número de Hijos, defectos por hora– Datos contínuos : Respuesta numérica que resulta de un
medición. • Ej. Peso, Estatura
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio1
• Para cada una de las láminas indique tres datos: cualitativo, cuantitativo discreto y cuantitativo continuo.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Niveles de Medición
• Nominal: Nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas– Ej: Tipo de bebida que prefiere
• Ordinal: Clasifican observaciones en categorías con un orden significativo pero no es posible determinar la diferencia numérica entre los valores.– Ej: Riesgo: alto medio bajo
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Niveles de Medición
• De intervalo: Nivel ordinal donde podemos determinar magnitudes de diferencia entre los datos. El cero no indica ausencia de valor.– Ej: Temperatura, Años
• De razón: Nivel de intervalo modificado para que el cero indique un punto de partida– Ej: Peso de equipaje, estatura de un niño
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
Indique el nivel de medición utilizado:• Preferencia de vehículo según su estilo:camion, van,etc.• Temperatura corporal de una muestra de clientes
enojados.• Numero de cédula.• Contenido de nicotina (mg) de un cigarrillo.• Calificación de una cita a ciegas : sobresaliente, común
y horrible.• Ingreso anual de los gerentes en una compañía.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
Indique el nivel de medición utilizado:• Años en que ha ocurrido el Fenómeno “EL niño”• Calificaciones finales : MB, B, R, P• Automóviles descritos como subcompactos, compactos,
medianos o grandes.• Temperatura del ambiente en el aula.• Edad de los clientes.• Año de nacimiento de sus padres
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Usos y abusos de la Estadística
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Errores comunes
• Muestra autoseleccionada: Los propios sujetos deciden ser incluidos. Encuestas por:– Internet, – Correo– Teléfono.
• Muestras pequeñas
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Errores comunes
• Gráficas engañosas
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Errores comunes
• Pictogramas:
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Preguntas predispuestas:
– Ej: ¿Debería el presidente utilizar su poder de veto para eliminar los desperdicios? …………………… 97% si
– ¿Debería utilizar el presidente su poder de veto? 57% si
Orden de preguntas:◦ Ej: ¿Cree usted que el tránsito vehicular contribuye a la contaminación mas
o menos que la industria? 47% tránsito◦ ¿Cree usted que la industria contribuye a la contaminación mas o menos
que el tránsito vehicular ? 24% tránsito
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Correlación y causalidad: Correlación indica que dos variables están relacionadas. Sin embargo correlación no implica causalidad.
• Estudios para el propio beneficio.
• Imágenes parciales :– Ej. “El 90% de todos nuestros automóvi-
les vendidos en este país en los últimos
10 años continua circulando”
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Números precisos: – Ej. En la actualidad existen 103´215.027
hogares estadounidenses.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Pensamiento Crítico
• Un estudio reveló que en cierta ciudad se expiden más multas por exceso de velocidad a los individuos de grupos minoritarios. Conclusión : En la ciudad los individuos de grupos minoritarios exceden la velocidad límite mas que los blancos.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• En un estudio sobre los síntomas del resfriado, se encontró que todos los sujetos que estaban resfriados mejoraron dos semanas después de tomar píldoras de jengibre. Conclusión: Las píldoras de jengibre curan el resfriado.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Usted planea realizar una encuesta para conocer el porcentaje de personas que están de acuerdo con cierta nueva ley. Usted obtiene direcciones y teléfonos del directorio telefónico y envía una encuesta a 850 personas elegidas al azar. ¿Por qué no es correcto utilizar el directorio telefónico como fuente de los sujetos para las encuestas?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• El Senado de Hawai entro en audiencia para considerar una ley que obligaba a los motociclistas a usar casco. Algunos motociclistas testificaron que habían participado en choques donde los cascos resultaron inútiles. ¿Qué importante grupo no fue capaz de testificar?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Usted necesita hacer un estudio para determinar el tamaño promedio de una familia en la ciudad donde vive. Para esto reúne datos que consisten en el número de hermanos y hermanas de los estudiantes de su universidad. ¿Cuáles son los problemas de su investigación?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
RESUMEN Y GRÁFICAS DE DATOS
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Características importantes de los datos
• Centro
• Variación
• Distribución
• Valores Extremos
• Tiempo
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Distribuciones de Frecuencia
• Concepto: Lista valores de datos junto con su frecuencia.
• Ej: Edad
ActricesFrecuencia
[20-30) 28
[30-40) 30
[40-50) 12
[50-60) 2
[60-70) 2
[70-80) 2
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Distribuciones de frecuencia
• Limites de clase Inferior :Cifras más pequeñas que pueden pertenecer a las clases.
• Limites de clase Superior :Cifras más grande que pueden pertenecer a las clases.
• Ancho de clase: Diferencia entre dos límites de clases inferiores consecutivos.
• Marca de Clase: Punto medio de la clase (Lim Inf + Lim sup)/2
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Procedimiento para construir una distribución de frecuencias
• Decidir el número de clases K=1+3,32 log(n) (entre 5 y 20)
• Calcular el ancho de clase=(Valor máximo-Valor mínimo)/número de clases.
• Establecer el punto de partida como límite inferior de la primera clase y sumar el ancho de clase para encontrar el límite superior.
• Completar todos las clases
• Tabular los datos que se encuentren en cada clase.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicios
• Se tienen 50 valores, ¿Cuál es el número de clases sugerido?
• Un conjunto de datos contiene 100 valores, el mayor es 315 y el menor 56. Especifique los limites de las clases en la tabla de distribución de frecuencia.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
• Cierto fabricante selecciona aleatoriamente 20 días de invierno y toma la temperatura °C con los siguientes resultados :
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
• Realice la tabla de distribución de frecuencia
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Desarrolle la tabla de distribución de frecuencia a partir de los siguientes datos que corresponden a ingresos de 30 ejecutivos expresado en miles $.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Distribución de frecuencias relativas
• Se obtiene dividiendo cada frecuencia de clase en el total de frecuencias. Las frecuencias relativas en
ocasiones se expresan como porcentaje.
Frecuencia relativa= frecuencia de clase suma de todas las frecuenciasFrecuencia relativa= frecuencia de clase suma de todas las frecuencias
Edad Actrices Frec. Relativa
[20-30) 37%
[30-40) 39%
[40-50) 16%
[50-60) 3%
[60-70) 3%
[70-80) 3%
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Distribución de frecuencias acumuladas
• La frecuencia acumulada de una clase es la frecuencia de esa clase y de todas las anteriores.
Edad Actrices Frec. Acumulada
[20-30) 28
[30-40) 58
[40-50) 70
[50-60) 72
[60-70) 74
[70-80) 76
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• En cierto país se desea investigar el crecimiento de los jóvenes y se seleccionó una muestra aleatoria de 25 jóvenes y se los midió.
Construya la tabla de distribución de frecuencia absoluta,
relativa y acumulada.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Exploración de datos en tablas de frecuencia
• Distribución Normal• Gráfica de campana• Al inicio las frecuencias son bajas, después se
incrementan hasta un punto máximo y luego disminuyen.
• Distribución aproximadamente simétrica y las frecuencias tienden a distribuirse de manera uniforme a ambos lados
• Ej. Las frecuencias:1,5,6,10,7,4,1 son aprox normal
1,5,50,25,20,15,10,5,3,2 no se aprox normal.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejemplo• Se seleccionaron a 1000 mujeres al azar y
se midieron sus estaturas. Tienen una distribución normal?
Estaturas (pulg) Frecuencia
[56-58) 10
[58-60) 64
[60-62) 178
[62-64) 324
[64-66) 251
[66-68) 135
[68-70) 32
[70-72) 6
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicios de aplicación
La siguiente tabla corresponde a la frecuencia de los pesos (gramos) de monedas de un centavo elegidas al azar. ¿Cuáles son sus conclusiones?
Pesos (gramos) Frecuencia
[2,4-2,5) 18
[2,5-2,6) 19
[2,6-2,7) 0
[2,7-2,8) 0
[2,8-2,9) 2
[3,0-3,1) 25
[3,1-3,1) 8
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicios de aplicación
• Remítase a siguiente tabla de distribución. ¿Cuáles son sus conclusiones?
Estatura hombres (pulg)
Frecuencia
[60-65) 4
[65-70) 25
[70-75) 9
[75-80) 0
[80-85) 0
[85-90) 0
[90-95) 0
[95-100) 0
[100-105) 1
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Una persona taladró un hoyo en un dado, lo rellenó de plomo y lo lanzó 180 veces. Los resultados se presentan en la distribución de frecuencias siguiente. Construya la distribución de frecuencias relativas para los resultados que esperaría de un dado perfectamente legal ¿Existen diferencias en los resultados de los dos dados?
Resultado Frecuencia
1 24
2 28
3 39
4 37
5 25
6 27
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
GRÁFICOS
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Histograma
• Es una gráfica de barra donde la escala horizontal representa clases de valores ( marca de clase y la escala vertical representa frecuencias. Las barras se dibujan sin espacios entre sí.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• Ejemplo:
Realice el histograma a partir de la siguiente tabla:
Estaturas (pulg) Frecuencia
[56-58) 10
[58-60) 64
[60-62) 178
[62-64) 324
[64-66) 251
[66-68) 135
[68-70) 32
[70-72) 6
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• A partir del siguiente histograma que muestra las calificaciones de un examen de Estadística responda :
• ¿Cuántos estudiantes hicieron el examen?,
• ¿Cuál es la mínima calificación posible?
• ¿Cuál es la calificación más frecuente?
• ¿Cuál es el ancho de clase? • Y el número de clases?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Polígono de frecuencia• Concepto: Gráfico que utiliza segmentos
lineales conectados a puntos que se localizan directamente por encima de los valores de la marca de clase.
• Las alturas de los puntos corresponden a la frecuencia de clase.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ojiva• Gráfica lineal que representa frecuencias acumuladas.
En el eje horizontal se muestran el límite superior de cada clase.
Temperatura FrecFrec
Acum%
Acum
[0 - 10) 0 0 0%
[10 - 20) 3 3 15%
[20 - 30) 6 9 45%
[30 – 40) 5 14 70%
[40-50) 4 18 90%
[50 – 60) 2 20 100%
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ojiva: Temperatura diaria
0
2
4
6
8
10
12
14
16
18
20
10 20 30 40 50 60
Límite de Clase
Fre
c. A
cum
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
% A
cum
.
a) ¿Cuántos dias se investigaron?
a) El 60% de los dias registraron temperaturas inferiores a ….
a) ¿Cuantos días se registraron temperaturas menores a 45° ?
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• A 40 estudiantes en la cafetería se les pidió que estimaran el número de horas que habían dedicado a estudiar en la semana anterior. El registro de respuestas aparece en la tabla. Construya la ojiva
Tiempo de estudio semanal en horas Frecuencia
10 y menos que 20 6
20 y menos que 30 11
30 y menos que 40 9
40 y menos que 50 7
50 y menos que 60 4
60 y menos que 70 2
70 y menos que 80 1
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Diagrama tallo hojas• Permite ver cómo se distribuyen y donde
están las concentraciones de datos.
• Se organiza los datos en grupos (llamados tallos), para que los valores dentro de cada grupo (las hojas) ramifiquen hacia la derecha de cada fila.
• Ej: 12,13,25,28,47, 48,49,49,65,66,1101 2 3
2 5 8
4 7 8 9 9
6 5 6
11 0
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Efectúe el diagrama de tallo hoja para los siguientes conjuntos de datos 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
613, 632, 658, 717,722, 750, 776, 827,841, 859, 863, 891,894, 906, 928, 933,955, 982, 1034, 1047,1056, 1140, 1169, 1224
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Gráfico de Pareto• Es un gráfico de barras ordenadas para datos
cualitativos. Esta gráfica enfoca la atención a las categorías más importantes donde se cumpla el 80-20.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Gráficos de Pastel
• Presenta datos cualitativos como si fueran parte de un pastel.
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Diagramas de dispersión
• Gráficas de datos pareados (x,y).• El patrón de puntos puede indicarnos que existe
alguna relación entre las variables
0
50
100
150
200
250
300
350
0 50 100 150Variable A
Var
iabl
e B
0
20
40
60
80
100
120
140
160
0 50 100 150Variable A
Var
iabl
e B
Relación creciente o positiva
Relación decreciente o negativa
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
• No existe relación entre x y
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejemplo
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
• Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la tabla se describen el nº de errores que corresponden a los intentos realizados. Realice el diagrama de dispersión.
Número de
intentos
Número de errores
1 15
2 12
3 10
4 8
5 7
6 5
7 5
8 2
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Ejercicio
UN
IVE
RS
IDA
D T
EC
NO
LÓ
GIC
A E
CO
TE
C. IS
O 9001:2008
Gráficas de serie de tiempo
• Se usa para estudiar patrones de las variables a través del tiempo .