Post on 30-Jan-2016
description
1
UNIVERSIDAD TÉCNICA DE AMBATO
FACULTAD DE INGENIERÍA CIVIL Y MECÁNICA
CARRERA DE INGENIERÍA CIVIL
PORTAFOLIO DEL MODULO FORMATIVO
“ESTADÍSTICA”
Tercer Semestre
DOCENTE:
M. Sc. Ing. Fernando Durán
ALUMNO:
Andrés Abril Camino
AMBATO – ECUADOR
Semestre Abril 2015 – Septiembre 2015
2
Contenido CONSULTAS Y DEBERES ..................................................................................................... 3
TABLAS ESTADÍSTICAS ..................................................................................................... 25
CONSULTAS Y MATERIA DOCUMENTADA..................................................................... 30
3
CONSULTAS Y DEBERES
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
TABLAS ESTADÍSTICAS
26
27
28
29
MANUAL BÁSICO PARA EL ESTUDIO
30
CONSULTAS Y MATERIA DOCUMENTADA
EJEMPLO
31
1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar
cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500,
510, 515 y 520) gramos respectivamente.
Por lo que su media es:
MÉTODO DE REGRESIÓN R2
El procedimiento para obtener valores de “a” y “b” para una serie de pares de datos de “x”
y de “y” (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:
Paso 1 Calcule, para cada par de valores de “x” e “y”, las cantidades “x²”, “y²”, y
“x.y”.
Paso 2 Obtenga las sumas (∑) de estos valores para todos los pares de datos de “x” e
“y”, así como las sumas del total de los valores de “x” e “y”. Los resultados de
los Pasos 1 y 2 aparecerán en forma similar a la siguiente:
Número de pares de datos x x² y y² x.y
1 … … … … …
2 … … … … …
3 … … … … …
·
·
·
n … … … … …
Monto de las sumas ∑x ∑x² ∑y ∑y² ∑x·y
Paso 3 Estime la pendiente (b) por medio de la relación:
Paso 4 Estime el intercepto (a) por medio de la relación:
32
A partir de esos valores de “a” y de “b” obtenidos mediante las Ecuaciones 2 y 3, es
posible trazar a lo largo de los puntos dispersos de un gráfico la línea recta mejor ajustada
a los mismos, y verificar visualmente si tales puntos están bien “expresados” por la línea
(Figura 1b).
Correlación
El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión
y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.
La correlación entre dos variables es - otra vez puesto en los términos más simples - el
grado de asociación entre las mismas. Este es expresado por un único valor llamado
coeficiente de correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando
“r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando
la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor
negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto
significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un
valor positivo de “b” en el análisis de regresión).
Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de
“x” e “y”, utilizando la misma table y montos que se indican en el Paso 2 de la sección
“regresión” de este capítulo. De este modo “r” puede ser obtenido - indirectamente - a partir
de la relación:
COEFICIENTE DE REGRESIÓN R2
Para la regresión lineal
Para la regresión basta con hacer el cuadrado del coeficiente de correlación de Pearson.
Donde:
es la covarianza de
es la desviación típica de la variable
es la desviación típica de la variable
33
Desviación Estándar.-
Es un cálculo empleado en la estadística por la letra griega σ su cálculo se puede dar por
una tabla de distribución estadística con intervalos o también de un conjunto de datos
dados.
Su cálculo esta dado de forma general para el cálculo de un conjunto de datos de la
siguiente manera:
La raíz cuadrada de la sumatoria de cada uno de los términos restando a la media
aritmética elevando está última resta de cada término al cuadrado todo esto dividido para
el número de datos o muestras existentes
Para una comprensión más objetiva se realizara un ejemplo.
Del siguiente conjunto de datos determine la desviación estándar:
5 9 6 7 5
X = 6.4
Desviación estándar en la tabla de distribución estadística
Dada una tabla de distribución estadística
Se obtiene una media aritmética única para la desviación estándar dada del producto entre
la sumatoria total del número de variables existentes en cada intervalo (Fo) y La
sumatoria de la media aritmética de cada intervalo Mc.
La desviación estándar está dada por la raíz cuadrada de la división la sumatoria total de
media aritmética de cada intervalo elevado al cuadrado Mc2
por cada uno del número de
variables existentes en cada intervalo entre la sumatoria total de Mc. Sumado la media
aritmética única de la desviación estándar elevado al cuadrado.
X = 472/84
X = 5.62
√
Coef iciente de regresión R2
Esta dada por una ecuación pre establecida que los datos estadísticos deberán dar para
poder efectuar su cálculo
Intervalos Fo Mc Mc*Fo Mc²*Fo
(17-19) 9 18 162 2916
(19-21) 5 20 100 2000
(21-23) 3 22 66 1452
(23-25) 6 24 144 3456
84 472 9824
34
Cualquiera de las dos ecuaciones es válida y no afectará el resultado dado que se tomara
Se determinará también el coeficiente de regresión R2 ajustado que está dado por la
siguiente ecuación y esta parte de la Regresión R2
De igual forma se dará una ecuación preestablecida de la siguiente manera:
Donde
n = número total de datos o de muestra
R2 = Coeficiente de regresión
P = frecuencia nula de una variación de datos
K= el número de parámetros que se utiliza para la determinar el coeficiente de regresión.
Ejemplo:
Calcúlese el coeficiente de regresión R2 y R
2 Ajustado si se tiene la varianza explicada
como 3024.4 y la varianza total 3092.6 y se tiene dos parámetros de muestra entre 7 datos
Regresión R2
Regresión R
2 ajustada
(
)
La media aritmética es el valor obtenido al sumar todos
los datos y dividir el resultado entre el número total dedatos .
es el símbolo de la media aritmética .
35
Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el
peso medio.
MEDIA GEOMÉTRICA a media geométrica (MG) de un conjunto de números estrictamente
positivos (X1, X2,…,XN) es la raíz N-ésima del producto de
los N elementos.
Todos los elementos del conjunto tienen que ser mayores que cero.
Si algún elemento fuese cero (Xi=0), entonces la MG sería 0 aunque
todos los demás valores estuviesen alejados del cero.
La media geométrica es útil para calcular medias de porcentajes,
tantos por uno, puntuaciones o índices. Tiene la ventaja de que no es tan
sensible como la media a los valores extremos.
Ejemplo
En una empresa quieren saber la proporción media de mujeres en
los diferentes departamentos. Para ello, se recoge el porcentaje de
mujeres en los cinco principales departamentos.
36
Como es la media de porcentajes, calculamos la media
geométrica que es más representativa.
Media geométrica
La media geométrica (MG), de un conjunto de números positivos se define como
la n- del producto de los números. Por tanto, la fórmula para la
media geométrica es dada por
Existen dos usos principales de la media geométrica:
1. Para promediar porcentajes, indices y cifras relativas y
2. Para determinar el incremento porcentual promedio en ventas, producción u
otras actividades o series económicas de un periodo a otro.
37
Ejemplo
Supongase que las utilidades obtenidas por una compañía constructora en cuatro
proyectos fueron de 3, 2, 4 y 6%, respectivamente. ¿ Cúal es la media geométrica
de las ganancias?.
En este ejemplo y asi la media geométrica es determinada por
y así la media geométrica de las utilidades es el 3.46%.
La media aritmética de los valores anteriores es 3.75%. Aunque el valor 6% no es
muy grande, hace que la media aritmética se incline hacia valores elevados. La
media geométrica no se ve tan afectada por valores extremos.
Media armónica
La media armónica se define como el recíproco de la media aritmética de los
recíprocos:
Este valor se emplea para promediar variaciones con respecto al tiempo.
Observaciones sobre la media Geométrica y la media Armónica
El empleo de la media geométrica o de la armónica equivale a una transformación
de la variable en log ó , respectivamente, y el cálculo de la media
aritmética de la nueva variable; por ejemplo, si la variable abarca un campo de
variación muy grande, tal como el porcentaje de impureza de un producto químico,
por lo general alrededor del 0.1%, pero que en ocaciones llega incluso al 1% o
más, puede ser ventajoso el empleo de log en lugar de para obtener una
distribución más simétrica y que se aproxime más a una distribución normal. La
media aritmética de log es el logaritmo de la media geométrica de , de forma
que la media empleada es equivalente al empleo de la media geométrica como
valor medio de .
1. Construya la columna con los datos en Excel.
38
2. Ingrese a f y seleccione estadísticas y luego active MEDIA. GEOM o
MEDIA. ARMO, entonces aparecerá una ventana en la que se le pide
Número 1: ingrese el rango de los datos
Número 2: ingrese el rando de otro conjunto de datos
Ejemplo Supongase que una familia realiza un viaje en automóvil a un ciudad y cubre los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en esas condiciones, la velocidad media realizada.
<Medidas de dispersión - rango, varianza, desviación típica y coeficiente
de variación
Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o
menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las
siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre
el valor más elevado y el valor más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido
se divide por el tamaño de la muestra.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.
3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.
39
4.- Coeficiente de varización de Pearson: se calcula como cociente entre la desviación típica y la media.
Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase
(lección 2ª) y vamos a calcular sus medidas de dispersión.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20).
Luego el rango de esta muestra es 10 cm.
2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la
fórmula:
Por lo tanto, la varianza es 0,0010
3.- Desviación típica: es la raíz cuadrada de la varianza.
40
Luego:
4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación
típica y la media de la muestra.
Luego,
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el
nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene
expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los
alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las
desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus
coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
PERMUTACIONES
Una permutación es una combinación en donde el orden es importante. La notación para
permutaciones es P(n,r) que es la cantidad de permutaciones de “n” elementos si solamente
se seleccionan “r”.
Cv = 0,0320 / 1,253
Cv = 0,0255
41
Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda calificación más alta
podría ser obtenida por uno de los 8 restantes. La tercera calificación podría ser obtenida
por uno de los 7 restantes.
La cantidad de permutaciones posibles sería: P(9,3) = 9*8*7 = 504 combinaciones posibles
de las tres calificaciones más altas
Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m
elementos de forma que:
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos.
Ejemplos:
1. Calcular las permutaciones de 6 elementos.
P6 = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720
2. ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5?
m = 5 n = 5
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.
3. ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?
Sí entran todos los elementos. Tienen que sentarse las 8 personas.
Sí importa el orden.
42
No se repiten los elementos. Una persona no se puede repetir.
Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m
elementos de forma que:
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos.
Ejemplos
1. Calcular las permutaciones de 6 elementos.
P6 = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720
2. ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5.
m = 5 n = 5
Sí entran todos los elementos. De 5 dígitos entran sólo 3.
Sí importa el orden. Son números distintos el 123, 231, 321.
No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.
3. ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?
Sí entran todos los elementos. Tienen que sentarse las 8 personas.
Sí importa el orden.
No se repiten los elementos. Una persona no se puede repetir.
43
Permutaciones circulares
Es un caso particular de las permutaciones.
Se utilizan cuando los elementos se han de ordenar "en círculo", (por ejemplo, los
comensales en una mesa), de modo que el primer elemento que "se sitúe" en la muestra
determina el principio y el final de muestra.
Ejemplos
1. Calcular las permutaciones circulares de 7 elementos.
PC7= (7 − 1)! = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720
2. ¿De cuántas formas distintas pueden sentarse ocho personas alrededor de una mesa redonda?
Permutaciones con repetición
Permutaciones con repetición de m elementos donde el primer elemento se repite a veces
, el segundo b veces , el tercero c veces, ...(m = a + b + c + ... = n) son los distintos grupos
que pueden formarse con esos m elementos de forma que :
Sí entran todos los elementos.
Sí importa el orden.
Sí se repiten los elementos.
Ejemplos
44
Calcular las permutaciones con repetición de: .
2. Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; ¿cuántos números de nueve cifras se pueden
formar?
m = 9 a = 3 b = 4 c = 2 a + b + c = 9
Sí entran todos los elementos.
Sí importa el orden.
Sí se repiten los elementos.
3. En el palo de señales de un barco se pueden izar tres banderas rojas, dos azules y cuatro verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las nueve
banderas?
Sí entran todos los elementos.
Sí importa el orden.
Sí se repiten los elementos.