Regresion Lineal y Multiple
-
Upload
edgar-jamanca-antonio -
Category
Documents
-
view
276 -
download
13
Transcript of Regresion Lineal y Multiple
“AÑO DEL CENTENARIO DE MACHU PICCHU PARA EL MUNDO”
ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA QUÍMICA
ASIGNATURA: Ingeniería de la Producción
TEMA: Regresión Lineal y Múltiple
DOCENTE: Ing. José Soto La Rosa.
CICLO: X
ALUMNOS: Espíritu Vergara, Daniel Freddy.
Jamanca Antonio, Edgar Martin
Macarlupú Chávez, Anthony Junior.
Silvestre Quispe, Christian Jesús.
Urbano Ortiz Pedro Alexander
Vílchez Carbajal Maribel Giovanna
HUACHO - PERÚ
2011
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 2
PRACTICA DIRIGIDA Nª 02
Problema Nª 01:
Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos
años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.
Año x Demanda de Soda Caustica miles de litros (y)
2001 1 6.5
2002 2 8.1
2003 3 9.8
2004 4 15.1
2005 5 19.2
2006 6 23.5
2007 7 28.7
2008 8 33.5
2009 9 34.9
2010 10 43.7
Hallar:
A. Parámetros de regresión a y b.
B. Coeficiente de correlación.
C. Desviación estándar.
D. Limites de control y demanda futura.
Solución:
A. Parámetros de regresión a y b.
El modelo a utilizar es de la correlación Lineal, utilizamos el modelo:
𝑦 = 𝑎 + 𝑏𝑥
Entonces hallamos las siguientes variables en el siguiente cuadro:
Año x y xy x2 y2
2001 1 6,5 6,5 1 42,25
2002 2 8,1 16,2 4 65,61
2003 3 9,8 29,4 9 96,04
2004 4 15,1 60,4 16 228,01
2005 5 19,2 96 25 368,64
2006 6 23,5 141 36 552,25
2007 7 28,7 200,9 49 823,69
2008 8 33,5 268 64 1122,25
2009 9 34,9 314,1 81 1218,01
2010 10 43,5 435 100 1892,25
∑ 𝒊 55 222,8 1567,5 385 6409
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 3
Como los parámetros a y b están dadas por las fórmulas:
∑ 𝑦 = 𝑎 ∗ 𝑛 + 𝑏 ∗ ∑ 𝑥 … 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 𝑁º01
∑ 𝑥𝑦 = 𝑎 ∗ ∑ 𝑥 + 𝑏 ∗ ∑ 𝑥2 … 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 𝑁º02
Donde:
𝑏 =10 ∗ (1567.5) − 55 ∗ (222.8)
10 ∗ 385 − (55)2= 4.146666667
𝑎 =222.8 − 4.15 ∗ 55
10= −0.52667
El modelo obtenido a través de la correlación es:
𝑦 = −0.52667 + 4.146666667 ∗ 𝑥
B. Coeficiente de correlación:
Esta dada por la siguiente formula:
𝑟 = 𝑏 ∗ √𝑛 ∗ ∑ 𝑥2 − (∑ 𝑥)2
𝑛 ∗ ∑ 𝑦2 − (∑ 𝑦)2
Donde:
𝑟 = 4.146666667 ∗ √10 ∗ 385 − 552
10 ∗ 6409 − 222.82= 0.9908
𝑟2 = 0.9817
Interpretación:
Significa que el 99% de los datos estimados se encuentran alrededor o cerca de los datos reales.
El 98% significa que de los datos estimados coinciden con los datos reales por tanto es una
correlación alta positiva y entonces el pronostico es confiable.
C. Desviación estándar:
Esta dada por la siguiente formula.
𝐷𝑦 = √∑(𝑦 − �̅�)2
𝑛 − 1
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 4
Año 𝒙 𝒚 �̅� 𝒚 − �̅� (𝒚 − �̅�)𝟐
2001 1 6,5 3,62 2,88 8,2944
2002 2 8,1 7,766666667 0,333333333 0,111111
2003 3 9,8 11,91333333 -2,113333333 4,466178
2004 4 15,1 16,06 -0,96 0,9216
2005 5 19,2 20,20666667 -1,006666667 1,013378
2006 6 23,5 24,35333333 -0,853333333 0,728178
2007 7 28,7 28,5 0,2 0,04
2008 8 33,5 32,64666667 0,853333333 0,728178
2009 9 34,9 36,79333333 -1,893333333 3,584711
2010 10 43,5 40,94 2,56 6,5536
∑ 𝒊 55 222,8 222,8 -2,84217E-14 26,44133
Calculamos:
𝐷𝑦 = √26.44133
9= 1.714037901
D. Limites de control:
Esta compuesta por:
Limites de control superior
Esta dada por la siguiente ecuación:
𝑦 = −0.52667 + 4.146666667 ∗ 𝑥 + 1.96 ∗ 1.71
Así podemos visualizarla en la siguiente tabla:
𝒙 𝒚
1 6,979514286
2 11,12618095
3 15,27284762
4 19,41951429
5 23,56618095
6 27,71284762
7 31,85951429
8 36,00618095
9 40,15284762
10 44,29951429
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 5
Limites de control inferior
Esta dada por la siguiente ecuación:
𝑦 = −0.52667 + 4.146666667 ∗ 𝑥 − 1.96 ∗ 1.71
Así podemos visualizarla en la siguiente tabla:
𝒙 𝒚
1 0,260485714
2 4,407152381
3 8,553819047
4 12,70048571
5 16,84715238
6 20,99381905
7 25,14048571
8 29,28715238
9 33,43381905
10 37,58048571
Aquí se puede visualizar con la grafica:
0.5
5.5
10.5
15.5
20.5
25.5
30.5
35.5
40.5
0 2 4 6 8 10
mile
s d
e li
tro
s (Y
)
X
MODELOPRONOSTICO
LCS
LCI
Y ESTIMADO
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 6
Problema Nª 02:
Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos
años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.
Año x Demanda de Soda Caustica miles de litros (y)
2003 1 9.8
2004 2 15.1
2005 3 19.2
2006 4 23.5
2007 5 28.7
2008 6 33.5
2009 7 34.9
2010 8 43.7
Hallar:
E. Parámetros de regresión a y b.
F. Coeficiente de correlación.
G. Desviación estándar.
H. Limites de control y demanda futura.
Solución:
A. Parámetros de regresión a y b.
El modelo a utilizar es de la correlación no Lineal, utilizamos el modelo:
𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥2
Entonces hallamos las siguientes variables en el siguiente cuadro:
𝑵 𝒙 𝒚 𝒙𝒚 𝒙𝟐 𝒚𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟐𝒚
1 1 9,8 9,8 1 96,04 1 1 9,8
2 2 15,1 30,2 4 228,01 8 16 60,4
3 3 19,2 57,6 9 368,64 27 81 172,8
4 4 23,5 94 16 552,25 64 256 376
5 5 28,7 143,5 25 823,69 125 625 717,5
6 6 33,5 201 36 1122,25 216 1296 1206
7 7 34,9 244,3 49 1218,01 343 2401 1710,1
8 8 43,5 348 64 1892,25 512 4096 2784
∑ 𝒊 36 208,2 1128,4 204 6301,14 1296 8772 7036,6
Como los parámetros a ,b y c están dadas por las fórmulas:
∑ 𝑦 = 𝑎 ∗ 𝑛 + 𝑏 ∗ ∑ 𝑥 + 𝑐 ∗ ∑ 𝑥2
∑ 𝑥𝑦 = 𝑎 ∗ ∑ 𝑥 + 𝑏 ∗ ∑ 𝑥2 + 𝑐 ∗ ∑ 𝑥3
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 7
∑ 𝑥2𝑦 = 𝑎 ∗ ∑ 𝑥2 + 𝑏 ∗ ∑ 𝑥3 + 𝑐 ∗ ∑ 𝑥4
Esto se resuelve por matrices como:
𝑎 =
|
∑ 𝑦 ∑ 𝑥 ∑ 𝑥2
∑ 𝑥𝑦 ∑ 𝑥2 ∑ 𝑥3
∑ 𝑥2𝑦 ∑ 𝑥3 ∑ 𝑥4
|
|𝑛 ∑ 𝑥 ∑ 𝑥2
∑ 𝑥 ∑ 𝑥2 ∑ 𝑥3
∑ 𝑥2 ∑ 𝑥3 ∑ 𝑥4
| = 𝑇
𝑏 =
|
𝑛 ∑ 𝑦 ∑ 𝑥2
∑ 𝑥 ∑ 𝑥𝑦 ∑ 𝑥3
∑ 𝑥2 ∑ 𝑥2𝑦 ∑ 𝑥4
|
𝑇
𝑐 =
|
𝑛 ∑ 𝑥 ∑ 𝑥2
∑ 𝑥 ∑ 𝑥2 ∑ 𝑥𝑦
∑ 𝑥2 ∑ 𝑥3 ∑ 𝑥2𝑦
|
𝑇
Entonces reemplazando y hallando la determínate se obtiene:
𝑎 =
|208.2 36 204
1128.4 204 12967036.6 1296 8772
|
|8 36 204
36 204 1296204 1296 8772
|
=331027.2
56448= 5.8643
𝑏 =
|8 208.2 204
36 1128.4 1296204 7036.6 8772
|
56448=
245280
56448= 4.3452
𝑐 =
|8 36 208.2
36 204 1128.4204 1296 7036.6
|
56448=
1344
56448= 0.0238
El modelo obtenido a través de la correlación es:
𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2
B. Coeficiente de correlación:
Esta dada por la siguiente formula:
�̅� =∑ 𝑦
𝑛
𝑟 = √𝑎 ∗ ∑ 𝑦 + ∑ 𝑥𝑦 + 𝑐 ∗ ∑ 𝑥2𝑦 − 𝑛 ∗ �̅�2
∑ 𝑦 − 𝑛 ∗ �̅�2
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 8
Donde:
�̅�2 = (208.2
8)
2
= 677.3
𝑟 = √5.86 ∗ 208.2 + 4.55 ∗ 1128.4 + 0.024 ∗ 7036.6 − 8 ∗ 677.3
6301.1 − 8 ∗ 677.3= 0.99
𝑟2 = 0.98
Interpretación:
Significa que el 99% de los datos estimados se encuentran alrededor o cerca de los datos reales.
El 98% significa que de los datos estimados coinciden con los datos reales por tanto es una
correlación alta positiva y entonces el pronostico es confiable.
C. Desviación estándar:
Esta dada por la siguiente formula.
𝐷𝑦 = √∑(𝑦 − �̅�)2
𝑛 − 1
Año 𝒙 𝒚 �̅� (𝒚 − �̅�) (𝒚 − �̅�)𝟐
2003 1 9,8 10,23 -0,43 0,19
2004 2 15,1 14,65 0,45 0,20
2005 3 19,2 19,11 0,09 0,01
2006 4 23,5 23,63 -0,13 0,02
2007 5 28,7 28,19 0,51 0,26
2008 6 33,5 32,79 0,71 0,50
2009 7 34,9 37,45 -2,55 6,49
2010 8 43,5 42,15 1,35 1,82
∑ 𝒊 36 208,2 208,2 0,00 9,49
Calculamos:
𝐷𝑦 = √9.49
8= 1.16
D. Limites de control:
Esta compuesta por:
Limites de control superior
Esta dada por la siguiente ecuación:
𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 + 1.96 ∗ 1.16
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 9
Así podemos visualizarla en la siguiente tabla:
x LCS
1 12,5069
2 16,9235
3 21,3877
4 25,8995
5 30,4589
6 35,0659
7 39,7205
8 44,4227
Limites de control inferior
Esta dada por la siguiente ecuación:
𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 − 1.96 ∗ 1.16
Así podemos visualizarla en la siguiente tabla:
x LCI
1 7,9597
2 12,3763
3 16,8405
4 21,3523
5 25,9117
6 30,5187
7 35,1733
8 39,8755
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 10
Aquí se puede visualizar con la grafica:
8
18
28
38
48
58
1 2 3 4 5 6 7 8
Y
X
Modelo Real
Y ESTIMADO
LCS
LCI
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 11
Problema Nª 03:
Una empresa química produce sosa caustica, lo que se quiere determinar la demanda para los próximos
años, sabiendo los datos reales que se encuentran considerados en el presente cuadro histórico.
Año x Demanda de Soda Caustica miles de litros (y)
2003 1 9.8
2004 2 15.1
2005 3 19.2
2006 4 23.5
2007 5 28.7
2008 6 33.5
2009 7 34.9
2010 8 43.7
Hallar:
I. Parámetros de regresión a y b.
J. Coeficiente de correlación.
K. Desviación estándar.
L. Limites de control y demanda futura.
Solución:
E. Parámetros de regresión a y b.
El modelo a utilizar es de la correlación no Lineal, utilizamos el modelo:
𝑦 = 𝑎 ∗ 𝑏𝑥
Propiedad de logaritmo:
𝑙𝑛 𝑦 = 𝑙𝑛 𝑎 + 𝑙𝑛 𝑏 ∗ 𝑥
𝑦′ = 𝑎′ + 𝑏′ ∗ 𝑥′
Entonces hallamos las siguientes variables en el siguiente cuadro:
N 𝒙 𝒚 𝑳𝒐𝒈𝑿 𝑳𝒐𝒈𝒀 𝑳𝒐𝒈𝑿𝑳𝒐𝒈𝒀 𝑳𝒐𝒈𝑿𝟐 𝑳𝒐𝒈𝒀𝟐 𝑿𝑳𝒐𝒈𝒀 𝑿𝟐
1 1 9,8 1 0,9912 0,9912 1 0,9825 0,9912 1
2 2 15,1 2 1,1790 2,3580 4 1,3900 2,3580 4
3 3 19,2 3 1,2833 3,8499 9 1,6469 3,8499 9
4 4 23,5 4 1,3711 5,4843 16 1,8798 5,4843 16
5 5 28,7 5 1,4579 7,2894 25 2,1254 7,2894 25
6 6 33,5 6 1,5250 9,1503 36 2,3258 9,1503 36
7 7 34,9 7 1,5428 10,7998 49 2,3803 10,7998 49
8 8 43,5 8 1,6385 13,1079 64 2,6846 13,1079 64
∑ 𝒊 36 208,2 36 10,989 53,031 204 15,415 53,031 204
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 12
Como los parámetros a y b están dadas por las fórmulas:
∑ 𝑙𝑜𝑔 𝑦 = 𝑙𝑜𝑔 𝑎 ∗ 𝑛 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥
∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦 = 𝑙𝑜𝑔 𝑎 ∗ ∑ 𝑥 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥2
Esto se resuelve por matrices como:
𝑎′ =
|∑ 𝑙𝑜𝑔 𝑦 ∑ 𝑥
∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦 ∑ 𝑥2|
|𝑛 ∑ 𝑥
∑ 𝑥 ∑ 𝑥2| = 𝑇′
𝑏′ =
|𝑛 ∑ 𝑙𝑜𝑔 𝑦
∑ 𝑥 ∑ 𝑥 ∗ 𝑙𝑜𝑔 𝑦|
𝑇′
Entonces reemplazando y hallando la determínate se obtiene:
𝑎′ =|10.989 3653.03 204
|
|8 10.989
36 204|
=332.61
336= 0.9899
Donde:
𝑎′ = 𝑙𝑜𝑔 𝑎
𝑎 = 10𝑎′ = 100.9899 = 9.77
𝑏′ =|
8 10.98936 53.01
|
336=
28.6485
336= 0.0852
Donde:
𝑏′ = 𝑙𝑜𝑔 𝑏
𝑏 = 10𝑏′ = 100.0852 = 1.217
El modelo obtenido a través de la correlación es:
𝑦 = 9.77 ∗ (1.2172)𝑥
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 13
F. Coeficiente de correlación:
Esta dada por la siguiente formula:
𝑙𝑜𝑔 �̅� =∑ 𝑙𝑜𝑔 𝑦
𝑛
𝑙𝑜𝑔 �̅�2 = (∑ 𝑙𝑜𝑔 𝑦
𝑛)
2
𝑟 = √𝑙𝑜𝑔 𝑎 ∗ ∑ 𝑙𝑜𝑔 𝑦 + 𝑙𝑜𝑔 𝑏 ∗ ∑ 𝑥 𝑙𝑜𝑔 𝑦 − 𝑛 ∗ 𝑙𝑜𝑔 �̅�2
∑ 𝑙𝑜𝑔 𝑦2 − 𝑛 ∗ 𝑙𝑜𝑔 �̅�2
Donde:
𝑙𝑜𝑔 �̅�2 = (10.989
8)
2
= 677.3
𝑟 = √9.77 ∗ 10.989 + 1.2172 ∗ 53.031 − 8 ∗ 677.3
21.97 − 8 ∗ 677.3= 1
𝑟2 = 1.0021
G. Desviación estándar:
Esta dada por la siguiente formula.
𝐷𝑦 = √∑(𝑦 − �̅�)2
𝑛 − 1
Año 𝒙 𝒚 �̅� 𝒚 − �̅� (𝒚 − �̅�)𝟐
2003 1 9,8 11,889939 -2,08993904 4,36784517
2004 2 15,1 14,4691518 0,63084818 0,39796943
2005 3 19,2 17,6078577 1,59214232 2,53491718
2006 4 23,5 21,4274241 2,07257593 4,29557097
2007 5 28,7 26,075546 2,62445402 6,88775893
2008 6 33,5 31,7319569 1,76804306 3,12597628
2009 7 34,9 38,615379 -3,71537902 13,8040413
2010 8 43,5 46,9919803 -3,49198035 12,1939268
∑ 𝒊 36 208,2 208,809235 -0,60923488 47,608006
Calculamos:
𝐷𝑦 = √47.6
8= 2.6079
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 14
H. Limites de control:
Esta compuesta por:
Limites de control superior
Esta dada por la siguiente ecuación:
𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 + 1.96 ∗
Así podemos visualizarla en la siguiente tabla:
x y LCS
1 9,8 17,0014235
2 15,1 19,5806363
3 19,2 22,7193422
4 23,5 26,5389086
5 28,7 31,1870305
6 33,5 36,8434414
7 34,9 43,7268635
8 43,5 52,1034648
Limites de control inferior
Esta dada por la siguiente ecuación:
𝑦 = 5.8643 + 4.3452 ∗ 𝑥 + 0.0238 ∗ 𝑥2 − 1.96 ∗ 𝑥
Así podemos visualizarla en la siguiente tabla:
x LCI
1 6,77845455
2 9,35766733
3 12,4963732
4 16,3159396
5 20,9640615
6 26,6204724
7 33,5038945
8 41,8804959
Facultad de Ingeniería Química, Metalurgia y Ambiental
Ingeniería de la Producción Página 15
Aquí se puede visualizar con la grafica:
6
11
16
21
26
31
36
41
46
51
1 2 3 4 5 6 7 8
Y
X
MODELOREAL
Y ESTIMADO
LCS
LCI