Estadistica

18
1 Escuela Politécnica Del Ejército Ingeniería Electromecánica Estadística-Proyecto Chilig Edwin Sancho David Farinango Wilmer Byron Barros 2013 Estadísca

description

Regresion LinealRegresion LogaritmicaRegresion Exponencial

Transcript of Estadistica

Page 1: Estadistica

1

Escuela Politécnica Del Ejército

Ingeniería Electromecánica

Estadística-Proyecto

Chilig Edwin

Sancho David

Farinango Wilmer

Byron Barros

2013

Page 2: Estadistica

2

INDICE

PROYECTO FINAL DE ESTADISTICA

1.-TEMA:...................................................................................................................................3

2.-OBJETIVOS............................................................................................................................3

OBJETIVO GENERAL...........................................................................................................3

OBJETIVO ESPECÍFICOS.....................................................................................................3

3.-MATERIALES.........................................................................................................................3

4.-MARCO TEÓRICO.................................................................................................................3

Excel....................................................................................................................................3

Regresión Lineal.................................................................................................................3

Regresión Exponencial.......................................................................................................6

Regresión Logarítmica.......................................................................................................6

5.-PROCEDIMIENTO.....................................................................................................................7

6.-ANALISIS DE RESULTADOS.................................................................................................13

7.-CONCLUSIONES......................................................................................................................13

8.- RECOMENDACIONES.............................................................................................................13

9.-BIBLIOGRAFIA.........................................................................................................................14

PROYECTO FINAL DE ESTADISTICA

Page 3: Estadistica

3

1.-TEMA: Planteamiento de un problema con datos reales para realizar el analisis de regresión lineal, exponencial y logarítmica.

2.-OBJETIVOSOBJETIVO GENERAL

Desarrollar la tendencia de la regresión lineal, exponencial y logarítmica mediante

el programa Excel.

OBJETIVO ESPECÍFICOS Obtener los datos de temperatura ya sea calentando o enfriando un metal.

Realizar la tendencia de la regresión lineal, exponencial y logarítmica mediante los

datos obtenidos del calentamiento o enfriamiento del metal.

3.-MATERIALES Lata de Tool metálico

Combustible GLP (gas licuado de petróleo) para el encendido de la llama

Programa Excel

Termómetro de mercurio

Computador personal

4.-MARCO TEÓRICOExcelExcel permite a los usuarios elaborar tablas y formatos que incluyan cálculos matemáticos

mediante fórmulas; las cuales pueden usar “operadores matemáticos” como son: (suma),

(resta), (multiplicación), (división) y (exponenciación); además de poder utilizar

elementos denominados “funciones” (especie de fórmulas, pre-configuradas) como por

ejemplo: Suma (), Promedio (), Buscar (), etc. Así mismo Excel es útil para gestionar

“Listas” o “Bases de Datos”; es decir agrupar, ordenar y filtrar la información.

Regresión LinealAbordaremos en esta página las distribuciones bidimensionales. Las observaciones se dispondrán en dos columnas, de modo que en cada fila figuren la abscisa x y su correspondiente ordenada y. La importancia de las distribuciones bidimensionales radica en investigar cómo influye una variable sobre la otra. Esta puede ser una dependencia causa efecto, por ejemplo, la cantidad de lluvia (causa), da lugar a un aumento de la producción agrícola (efecto). O bien, el aumento del precio de un bien, da lugar a una disminución de la cantidad demandada del mismo.

Si utilizamos un sistema de coordenadas cartesianas para representar la distribución bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersión, cuyo análisis permite estudiar cualitativamente, la relación entre ambas variables tal como se ve en la figura. El siguiente paso, es la determinación de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribución bidimensional. Se denomina regresión lineal cuando la función es lineal, es decir, requiere

Page 4: Estadistica

4

la determinación de dos parámetros: la pendiente y la ordenada en el origen de la recta de regresión, y=ax+b.

La regresión nos permite además, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendría para un valor x que no esté en la distribución.

Vamos a determinar la ecuación de la recta que mejor ajusta a los datos representados en la figura. Se denomina error ei a la diferencia yi-y, entre el valor observado yi, y el valor ajustado y= axi+b, tal como se ve en la figura inferior. El criterio de ajuste se toma como aquél en el que la desviación cuadrática media sea mínima, es decir, debe de ser mínima la suma.

El extremo de una función: máximo o mínimo se obtiene cuando las derivadas de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos ecuaciones con dos incógnitas del que se despeja a y b.

Page 5: Estadistica

5

El coeficiente de correlación es otra técnica de estudiar la distribución bidimensional, que nos indica la intensidad o grado de dependencia entre las variables X e Y. El coeficiente de correlación r es un número que se obtiene mediante la fórmula.

El numerador es el producto de las desviaciones de los valores X e Y respecto de sus valores medios. En el denominador tenemos las desviaciones cuadráticas medias de X y de Y.

El coeficiente de correlación puede valer cualquier número comprendido entre -1 y +1.

Cuando r=1, la correlación lineal es perfecta, directa. Cuando r=-1, la correlación lineal es perfecta, inversa Cuando r=0, no existe correlación alguna, independencia total de los valores X e Y

R2 El coeficiente de determinación. Compara los valores “y” estimados y reales, y os rangos con valor de 0 a 1. Si es 1, hay una correlación perfecta en la muestra, es decir, no hay diferencia entre el valor y estimado y el valor y real.

Aplicaciones de regresión lineal

Líneas de tendencia

Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo período. Este tipo de líneas puede decir si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado período. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.

Medicina

En Medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.

En el caso del Tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.

En el ejemplo del tabaquismo, un hipotético gen podría aumentar la Mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco.

Industria

En la industria tiene aplicación para investigar la relación entre el rendimiento de la producción y uno o más factores del (o de los) que depende, como la Temperatura, la

Page 6: Estadistica

6

humedad ambiental, la presión, la cantidad de insumos, etc; con base en este análisis se puede pronosticar el comportamiento de una variable que se desea estimar.

Regresión ExponencialFue Francis Galton (1822-1911) quien utilizó por primera vez el término regresión para indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos "regresaba" a la media general.

La regresión examina la relación entre dos variables, pero restringiendo una de ellas con el objeto de estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la regresión es un método que se emplea para predecir el valor de una variable en función de valores dados a la otra variable.En todos los casos de regresión existe una dependencia funcional entre las variables. En el caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de regresión de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresión de la altura de los árboles sobre su diámetro, lo cual significa que midiendo el diámetro (variable independiente) y reemplazando su valor en una relación definida según la clase de árbol se obtiene la altura, y aun sin necesidad de cálculos aprecian la altura utilizando gráficas de la función de dependencia, altura = función del diámetro.

Cuando la curva de regresión de y sobre x es exponencial, es decir para cualquier x considerada, la media de la distribución está dada por la siguiente ecuación predictora:

Tomando logaritmos en ambos lados tenemos:

Regresión LogarítmicaEn estadística, la regresión no lineal es un problema de inferencia para un modelo tipo:

y = f (x, ) + θ ε

Basado en datos multidimensionales x, y donde f es alguna función no lineal respecto a algunos parámetros desconocidos . Como mínimo, se pretende obtener los valores de losθ parámetros asociados con la mejor curva de ajuste (habitualmente, con el método de los mínimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia estadística tales como intervalos de confianza para los parámetros así como pruebas de bondad de ajuste.

La curva logarítmica y=a ln x+b es también una recta, pero en lugar de estar referida a las variables originales x e y , está referida a ln x y a Y .

5.-PROCEDIMIENTO

5.1._ Primeramente procedemos a colocar el tool metálico en un lugar apropiado para no

tener ningún inconveniente al momento de proceder a calentarlo.

Page 7: Estadistica

7

5.2._Luego procedemos a calentar el tool metálico, por medio de una llama que se le

observa en la figura1.

Figura 1

5.3._ Seguidamente procedemos a medir la temperatura del tool ya calentado mediante un

termómetro a base de mercurio como se los observa en la siguiente figura.

5.4._ luego anotamos los datos medidos como se observa en la tabla 1.

TOMA DE DATOS MEDIDOS DEL TOL METÁLICO CALENTADO.

Page 8: Estadistica

8

Tabla 1.

NOTA: La realización de toma de datos se lo realizo en un calefón industrial avícola de fabricación artesanal con la utilización de tool galvanizado 0.45.

Y como combustible GLP (gas licuado de petróleo) y un termómetro a base de mercurio por lo delgado de la lámina de tool el calentamiento de la superficie medida en acelerado.

5.5._A continuación procedemos abrir Excel, donde vamos a dar doble click en el icono.

5.6._A continuación se nos visualiza una pantalla de Excel, en donde vamos a proceder a

digitalizar los datos.

Tiempo (seg) Temperatura (°C)

10 5

20 10

30 19

40 25

50 35

60 47

70 59

80 78

90 95

100 120

Page 9: Estadistica

9

5.7._ Seguidamente procedemos a digitalizar todos los valores medidos en Excel 2010.

5.8._Procedemos a realizar la gráfica de dispersión según los datos tomados del tool

metálico caliente.

5.9._ Luego damos click en cualquier punto de la curva para realizar una línea de

tendencia.

Page 10: Estadistica

10

5.10._ Se nos visualiza una pantalla donde damos click en el icono lineal con su respectiva

ecuación.

5.11._ Visualizamos la línea de tendencia la cual va ser lineal con su ecuación.

Page 11: Estadistica

11

5.12._ Repetimos los pasos (5.9), (5.10), pero en este caso damos click en el icono

exponencial con su respectiva ecuación.

5.13._ Visualizamos la línea de tendencia la cual va ser exponencial con su ecuación.

Page 12: Estadistica

12

5.14._ Repetimos los pasos (5.9), (5.10), pero en este caso damos click en el icono

logarítmica con su respectiva ecuación.

5.15._ Visualizamos la línea de tendencia la cual va ser logarítmica con su ecuación.

Page 13: Estadistica

13

5.16._ Repetimos los pasos (5.9), (5.10), pero en este caso damos click en el icono

polinomica con su respectiva ecuación.

5.17._ Visualizamos la línea de tendencia la cual va ser logarítmica con su ecuación.

Page 14: Estadistica

14

6.-ANALISIS DE RESULTADOS

La regresión exponencial tiene el coeficiente de determinación que más se aproxima a

1, hay una correlación perfecta en la muestra.

7.-CONCLUSIONES Cuando se aplica la regresión lineal es necesario identificar las variables x, y, que

para nuestro caso (x) es la variable del tiempo y (y) es la variable de la temperatura.

Se debe considerar el tiempo como variable dependiente (x) y a la temperatura como variable dependiente (y), dado que la temperatura siempre va a variar conforme varía el tiempo y no viceversa.

8.- RECOMENDACIONES Se recomienda tomar los datos de tiempo y temperatura lo más acertadamente,

para de esta manera poder obtener un resultado óptimo en la solución del problema planteado.

Se recomienda hacer varias mediciones para de esta forma minimizar el error de lectura, para nuestro caso el tiempo y la temperatura.

Usar los materiales necesarios para la realización de la práctica, como elementos de seguridad, ya que vamos a trabajar con temperaturas que superan los 100 grados centígrados.

9.-BIBLIOGRAFIA

http://es.wikipedia.org/wiki/Microsoft_Excel http://www.ecured.cu/index.php/Regresi%C3%B3n_lineal

Page 15: Estadistica

15

http://www.slideshare.net/albertojeca/problemas-de-regresion-lineal http://www.monografias.com/trabajos89/regresion-exponencial-metodo-

minimos-cuadrados/regresion-exponencial-metodo-minimos-cuadrados.shtml http://www.slideshare.net/adangraus/regresion-lineal-simple-13381573 http://www.youtube.com/watch?v=jqub1i15B0Q https://www.youtube.com/watch?v=0dq3Hok7e-M

Regresión Lineal

Formulas

Y=BX+C

Page 16: Estadistica

16

Cálculos

Regresión Exponencial

Formulas

B=∑ XY−n X Y

∑ X2−n X2

C=Y−B X

R=¿¿¿

B=(37310 )−[ (10 )( 55010 )( 49310 )]

(38500 )−[ (10 )( 55010 )2

]=1,2358

C=49310

−[ (1,2358 )( 55010 )]=−18,669

R=[ (10 ) (37310 )−(550 ) (493 ) ]

√ [ (10 ) (38500 )− (550 )2 ][ (10 ) (37535 )−(493)2]=0,9758

R2=0,97582=0,9521

Y=1,2358 X−18,669

Y=A eBX

n=10lnY=lnA eBX

lnY=lnA+ln eBX

lnY=lnA+BX lne

Y '=A'+BX

Page 17: Estadistica

17

Cálculos

R2=0,95

Regresión Logarítmica

Formulas

B=n (∑ XY ')−(∑ X )(Y ')

n(∑ X2 )−(∑ X )2

A'=Y '−B X

B=[ (10 ) (2210,57 ) ]−[(550)(35,25)]

[ (10 ) (38500 ) ]−[(550)2]=¿0,0329

A '=¿ 35,256410

−¿0329)(55010

¿

A=¿ e1,7139=¿5,56

Y=5,56 e0,0329 X

Y=A+B ln XY=A+BX '

Page 18: Estadistica

18

Cálculos

R2=0,758

B=n (∑ X 'Y )−(∑ X ')(∑ Y )

n (∑ X '2 )−(∑ X ')2

A¿Y−B X '

n=10

B=[ (10 ) (2100,2316 ) ]−[(38,1302)(493)]

[ (10 ) (150,2276 ) ]−[(38,1302)2]=45,57

A=49310

−(45,57 )( 38,130210 )=−124,45

Y=¿45,57 ln X - 124,45