8 Regrecion y Correlacion2009

63
Regresión y correlación

Transcript of 8 Regrecion y Correlacion2009

Page 1: 8 Regrecion y Correlacion2009

Regresión y correlación

Page 2: 8 Regrecion y Correlacion2009

1.1 Introducción

La regresión y La correlación.

Analizan las relaciones entre dos variables para predecir eventos futuros. que se pueden utilizar para solucionar problemas comunes en los negocios.

Y depende de X En el modelo de regresión.

Y es una función de X Y = f(X) [1.1]

Se lee “Y es función de X”

Page 3: 8 Regrecion y Correlacion2009

Variable dependiente Y.

Es la variable que se desea explicar o predecir, variable de respuesta. La variable que se pronostica o estima.

La variable independiente X.

También se le denomina variable explicativa Proporciona la base para estimación. Es la variable preeditora .se utiliza para explicar Y.

Diagrama de dispersión:gráfica que describe la relación entre las dos variables de interés.

Page 4: 8 Regrecion y Correlacion2009

Cuál es la variable dependiente y cuál es la variable independiente en el modelo de regresión

Esto depende de la lógica y de lo que el estadístico intente medir.

Se desea analizar la relación entre las notas de los estudiantes y el tiempo que pasan estudiando.

Se recolectaron datos sobre ambas variables.

Es lógico presumir que las notas dependen de la cantidad de tiempo que los estudiantes pasan estudiando.

Por tanto, “notas” es la variable dependiente “tiempo” es la variable independiente.

Page 5: 8 Regrecion y Correlacion2009

La regresión simple se representa

Y = f(X) [1.1]Se le denomina regresión bivariada porque sólo hay dos variables, una dependiente y una independiente,

El modelo de regresión múltiple

Y es una función de dos o más variables independientes. Y es una función de dos o más variables independientes.

En un modelo de regresión múltiple con k variables En un modelo de regresión múltiple con k variables independientes independientes

Y = f ( X1, X2, X3, …., Xk ) Y = f ( X1, X2, X3, …., Xk ) [1.2][1.2]

En donde (X1, X2, X3, …., Xk son variables independientes que En donde (X1, X2, X3, …., Xk son variables independientes que permiten explicar Y. permiten explicar Y.

Page 6: 8 Regrecion y Correlacion2009

Diagramas de dispersión

Los diagramas de dispersión ayudan a ilustrar lo que muestran los datos sin procesar.

• Muestran la apariencia de una relación entre X y Y

•Diferentes patrones de diagramas de dispersión:

• Lineal, positiva, perfecta

• Lineal, negativa, perfecta

• Lineal, positiva, imperfecta

• Lineal, negativa, imperfecta

• Curva

• Sin relación

Page 7: 8 Regrecion y Correlacion2009

Relación lineal negativa perfecta

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Page 8: 8 Regrecion y Correlacion2009

Relación positiva perfecta

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Page 9: 8 Regrecion y Correlacion2009

Relación positiva fuerte

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Page 10: 8 Regrecion y Correlacion2009

Relación negativa fuerte

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Page 11: 8 Regrecion y Correlacion2009

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Relación Curvilínea

Page 12: 8 Regrecion y Correlacion2009

Sin Relación

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

Page 13: 8 Regrecion y Correlacion2009

Relaciones lineales y curvilíneas.

Si X y Y se relacionan en forma lineal, entonces a medida que X cambia, Y cambia en una cantidad constante.

Si existe una relación curvilínea,. Y cambiara en una cantidad diferente a medida que X cambia.

Page 14: 8 Regrecion y Correlacion2009

1.2 Determinación del modelo Regresión lineal simple

Ecuación de la recta Y = b0 + b1X [1.3]

En donde b0 es el intercepto y b1 es la pendiente de la recta.

Una relación como esta es una descripción inadecuada de la realidad. Es decir no cabe esperar una relación lineal perfecta entre las variables X e Y,

por lo que introducimos una variable aleatoria (la letra griega epsilon)

[1. 4]

Ello modificación la naturaleza del modelo Por tanto mientras que Y = b0+ 1 X era determinista

El modelo (1.4) es de naturaleza probabilística

XY 10

Page 15: 8 Regrecion y Correlacion2009

Los parámetros 0 y 1, permanecerán desconocidos

y se pueden estimar sólo con los datos muéstrales.

Un modelo lineal con base en datos muestrales

Y = b0 + b1 X + [1.5]

Si conociéramos , podría calcular el valor Y.

Sin embargo, debido a que es aleatoria.

¨ Y ¨sólo puede estimarse.

El modelo de regresión estimada toma la forma

= b0 + b1 X [1.6]

y

Y

(que se lee como Y sombrero)

Page 16: 8 Regrecion y Correlacion2009

Y1.3 Mínimos cuadrados ordinarios:

La recta de mejor ajusteEl propósito del análisis de regresión es determinar una recta

que se ajuste a los datos muestrales mejor que cualquier otra

Se recolecta datos sobre los gastos publicitarios y los

ingresos por ventas de 5 meses,.

Mes Mes VentasVentas

(X US $ 1000)(X US $ 1000)

PublicidadPublicidad

(X US $ 100)(X US $ 100)

11

22

33

44

55

Us $450Us $450

380380

540540

500500

420420

US $50US $50

4040

6565

5555

4545

Tabla 1.1

Datos de ventas Publicidad .

Page 17: 8 Regrecion y Correlacion2009

Los valores se obtienen mediante la recta de regresión y representan el estimado de las ventas.

Esta recta está determinada mediante la estimación de b0 y b1. un procedimiento matemático utilizado para estimar esos valores se denomina mínimos cuadrados ordinarios (MCO),

Y

Figura 1.1

Page 18: 8 Regrecion y Correlacion2009

Error = ( Yi - i ) [1.7]Y

Y

Debido a que algunos errores son negativos y positivos.

MCO producirá una recta tal que la suma de errores sea cero:

0YY ii )ˆ(

La diferencia entre lo que Y era realmente, Yi

y lo que se estima que es i, es el error.

Page 19: 8 Regrecion y Correlacion2009

Y

Es decir, MCO minimizará la suma de los errores al cuadrado.

Es por esto que se denomina mínimos cuadrados ordinarios;

produce una recta tal que la suma de los errores al cuadrado

es menor de lo que sería con cualquier otra recta.

iY

min)ˆ( 2ii YYLa suma de errores al

cuadrado se minimiza [1.8]

MCO también asegurará que se minimice la suma de

estos errores al cuadrado.

Page 20: 8 Regrecion y Correlacion2009

El método MCO utiliza varias formas de calculo

que llegan a los mismos resultados

La pendiente b1 de la recta de regresión, llamada

el coeficiente de regresión y el intercepto b0,

Utilizaremos el método Suma de cuadrados ordinario

XyY ˆˆ

Page 21: 8 Regrecion y Correlacion2009

Los parámetros 0 y 1,son desconocidos por lo tanto

son los que se van a estimar con los datos muéstrales.

Utilizaremos el método Suma de cuadrados ordinario

Sumas de cuadrados y los productos cruzadosLa pendiente de la

recta de regresión [1.9]

SCx

SCxyb1

El intercepto de

la recta de regresión [1.10]XbYb 10 Estos cálculos son extremadamente sensibles a la aproximación.

Por tanto, se aconseja en aras de la exactitud a efectuar los cálculos hasta

con cinco o seis cifras decimales.

Page 22: 8 Regrecion y Correlacion2009

Para determinar esta recta de mejor ajuste

MCO requiere calcular la suma de cuadrados y productos cruzados.

Suma de los cuadrados de X

[1.11]

Suma de los cuadrados de Y

[1.12]

Suma de los productos

cruzados de X y Y

[1.13]

n

XX

XXSCx i

22

2

)(

)(

n

YY

YYSCy i

22

2

)(

)(

n

YXXY

YYXXSCxy ii

))((

))((

Page 23: 8 Regrecion y Correlacion2009

Las primeras porciones de cada una de estas fórmulas.

))((

)(

)(2

2

YYXXSCxy

YYSCy

XXSCx

ii

i

i

Ilustran cómo la recta MCO realmente se basa en las

desviaciones de las observaciones a partir de su media.

Se utilizará la segunda versión al hacer los cálculos.

Page 24: 8 Regrecion y Correlacion2009

1.4 Ejemplo utilizando MCO Una empresa de trasporte Aéreo, considera que existe una relación

directa entre los gastos publicitarios y el número de pasajeros.

Se recolectaron los valores mensuales por gastos de publicidad y

número de pasajeros para los n = 15 meses más recientes.

Los datos aparecen en la tabla 1.2,

Determinar el modelo de regresión por MCO para ver si esta relación

existe

Coeficiente de regresión y el intercepto

XbbY 10 ˆ

Page 25: 8 Regrecion y Correlacion2009

225225

289289

169169

529529

256256

441441

196196

400400

576576

289289

256256

324324

529529

225225

256256

4.9604.960

100100

144144

6565

289289

100100

225225

100100

196196

361361

100100

121121

169169

256256

100100

144144

2.4692.469

150150

204204

104104

391391

160160

315315

140140

280280

456456

170170

176176

234234

368368

150150

192192

3.4903.490

1515

1717

1313

2323

1616

2121

1414

2020

2424

1717

1616

1818

2323

1515

1616

268268

1010

1212

88

1717

1010

1515

1010

1414

1919

1010

1111

1313

1616

1010

1212

187187

11

22

33

44

55

66

77

88

99

1010

1111

1212

1313

1414

1515

YY22XX22XyXyPasajeros Pasajeros (en 1.000`s) (en 1.000`s)

(Y)(Y)

Publicidad Publicidad (en US$1.000`s) (en US$1.000`s)

(X)(X)

Observación Observación (mes) (mes)

Tabla 1.2 Datos de regresión para la Aerolínea

Page 26: 8 Regrecion y Correlacion2009

Las sumas de los cuadrados y de los productos cruzados son:

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

148.933333 15

(187)(268) - 3.490

)Y)(X(-XYSCxy

n

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

Page 27: 8 Regrecion y Correlacion2009

Con Formulas (1.9) establecer el coeficiente de regresión así :y con(1.10 el intercepto )

86667.1715

268

n

YY

46667.1215

187

n

XX

4.40 o 4.3865

)46667.12(08.1866667.17

XbYb 10

ii X08.140.4Y El modelo de regresión

1.08 ņ 1.0813166

148.933333

733333.137

SCx

SCxyb 1

Page 28: 8 Regrecion y Correlacion2009

Así, si el valor ¨X¨ = 10 , es 15.200 valor que predice el modelo

es el Nº personas decidirán volar en nuestra empresa

Tanto X como Y están expresadas en miles

El coeficiente de 1.08 significa que por cada incremento de una

unidad en X,Y aumentará en 1.08 unidades. 1.080 pasajeros más

abordarán aviones

2.15)10(08.140.4Yi

28.16)11(08.140.4Yi

Y

Figura 1.2

Page 29: 8 Regrecion y Correlacion2009

1.-El centro de ubicación laboral en una universidad desea determinar si los

promedios puntuales en notas de los estudiantes puede explicar el número

de ofertas laborales que ellos reciben después de graduarse.

Los datos siguientes corresponden a los 10 recién graduados.

a. Haga un diagrama de dispersión para los datos.

b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo

sobre la relación entre promedios los y las ofertas de trabajo?

c. Si Carlos tiene un promedios de 3.22, ¿cuántas ofertas laborales

pronostica usted que él recibirá?

Estudiante 1 2 3 4 5 6 7 8 9 10

Promedios 3.25 2.35 1.02 0.36 3.69 2.65 2.15 1.25 3.88 3.37

Ofertas 3 3 1 0 5 4 2 2 6 2

Page 30: 8 Regrecion y Correlacion2009

2.- Un economista del Departamento de Recursos Humanos está preparando

un estudio sobre el comportamiento del consumidor. Él recolectó los datos

que aparecen en miles de dólares para determinar si existe una relación

entre el ingreso del consumidor y los niveles de consumo. Determine cuál es

la variable dependiente.

a. Haga un diagrama de dispersión para los datos.

b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo

sobre la relación entre el consumo y el ingreso? ¿Qué proporción de cada

dólar adicional que se gana se invierte en consumo?

c. ¿Qué consumo pronosticaría el modelo para alguien que gana US$27.500?

Consumidor 1 2 3 4 5 6 7 8 9 10 11 12

Ingreso 24.3 12.5 31.2 28.0 35.1 10.5 23.2 10.0 8.5 15.9 14.7 15

Consumo 16.2 8.5 15 17 24.2 11.2 15 7.1 3.5 11.5 10.7 9.2

Page 31: 8 Regrecion y Correlacion2009

3.- Un banco que se especializa en créditos para vivienda intenta analizar el

mercado de finca raíz, midiendo el poder explicativo que las tasas de interés

tienen sobre el número de casas vendidas en el área. Se compilaron los

datos para un periodo de 10 meses, así:

a. Haga un diagrama de dispersión para los datos.

b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo

sobre la relación entre las tasas de interés y las ventas de vivienda?

c. Si la tasa de interés es del 9.5%, ¿cuántas casas se venderían de acuerdo

con el modelo?

Mes 1 2 3 4 5 6 7 8 9 10

Interés 12.3 10.5 15.6 9.5 10.5 9.3 8.7 14.2 15.2 12

Casas 196 285 125 225 248 303 255 102 105 114

Page 32: 8 Regrecion y Correlacion2009

4.- Una empresa produce partes para camión que se utilizan en los

semirremolques. El jefe de contabilidad desea desarrollar un modelo de

regresión que pueda utilizarse para predecir los costos. El selecciona

unidades de producción fabricadas como una variable de predicción y

recolecta los datos que se observan aquí. Los costos están en miles de

dólares y las unidades en cientos.

a. Haga un diagrama de dispersión para los datos.

b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo

sobre la relación entre producción y costos?

c. Según el modelo, ¿Cuánto costaría producir 750 unidades?

Unidades Unidades 12.312.3 8.38.3 6.56.5 4.84.8 14.614.6 14.614.6 14.614.6 6.56.5

Costo Costo 6.26.2 5.35.3 4.14.1 4.44.4 5.25.2 4.84.8 5.95.9 4.24.2

Page 33: 8 Regrecion y Correlacion2009

5.- El profesor ha anotado que muchos de sus estudiantes se han ausentado

de clase este semestre, considera que puede explicar esta falta de asistencia

por las distancias a las que sus estudiantes viven del campus. Se práctica

una encuesta a once estudiantes sobre cuantas millas deben viajar para

asistir a clase y el número de clases a las que han faltado.

a. Haga un diagrama de dispersión para los datos.

b. Compare e interprete el modelo de regresión ¿Qué determina el profesor?

c. ¿A cuantas clases faltaría usted si viviera a 3.2 millas del campus, según

el modelo?

Millas Millas 55 66 22 00 99 1212 1616 55 77 00 88

Ausencias Ausencias 22 22 44 55 44 22 55 22 33 11 44

Page 34: 8 Regrecion y Correlacion2009

1.5 El error estándar de estimación:

Una medida de bondad de ajuste.

Qué tan bueno es el mejor ajuste en la relación entre X y Y

Por lo menos 2 medidas de bondad de ajuste:

1)El error estándar de estimación

2) El coeficiente de determinación.

Refiriéndonos al primero Mide el grado de dispersión de los valores Yi alrededor de la recta de regresión.

Refleja la tendencia a desviarse del valor real de Y cuando se utiliza el modelo de regresión para fines predicativos.

En este sentido, es una medida del error “típico”.

Page 35: 8 Regrecion y Correlacion2009

Si la recta de regresión pasaría por cada uno de los puntos. No se presentarán errores en los pronósticos, y el error estándar de estimación sería cero

Usualmente habrá alguna dispersión en los datos

El error estándar de estimación mide esta variación promedio de los puntos de datos alrededor de la recta de regresión

Proporciona una medida del error que se presentará en dicha estimación.

iY

Figura 1.7

Diagramas de dispersión posibles

Page 36: 8 Regrecion y Correlacion2009

Uno de los supuestos básicos del modelo MCO es que la varianza en los errores alrededor de la recta de regresión es la misma para todos los valores de X.

Entre menor sea el valor de 2, menor será la dispersión

Debido a que 2 es un parámetro, permanecerá desconocida, y es necesario estimar su valor con los datos muéstrales.

Una estimación insesgada de 2 es el cuadrado medio del error (CME)

:

El error estándar

de estimación

[1.15]2

)ˆ( 2

n

YYSe ii

Page 37: 8 Regrecion y Correlacion2009

En un modelo de regresión simple, se imponen dos restricciones en el conjunto de datos, debido a que se deben estimar dos parámetros, 0 y 1.

Por tanto hay n – 2 grados de libertad y CME es:

La suma de cuadrados

del error

[1.16] SCx

)SCxy(SCySCE

2

Cuadrado medio del error

[1.17]

2

nSCE

CME

El error estándar de estimación es entonces

El error estándar

[1.18]

CMESe

Page 38: 8 Regrecion y Correlacion2009

225225

289289

169169

529529

256256

441441

196196

400400

576576

289289

256256

324324

529529

225225

256256

4.9604.960

100100

144144

6565

289289

100100

225225

100100

196196

361361

100100

121121

169169

256256

100100

144144

2.4692.469

150150

204204

104104

391391

160160

315315

140140

280280

456456

170170

176176

234234

368368

150150

192192

3.4903.490

1515

1717

1313

2323

1616

2121

1414

2020

2424

1717

1616

1818

2323

1515

1616

268268

1010

1212

88

1717

1010

1515

1010

1414

1919

1010

1111

1313

1616

1010

1212

187187

11

22

33

44

55

66

77

88

99

1010

1111

1212

1313

1414

1515

YY22XX22XyXyPasajeros Pasajeros (en 1.000`s) (en 1.000`s)

(Y)(Y)

Publicidad Publicidad (en US$1.000`s) (en US$1.000`s)

(X)(X)

Observación Observación (mes) (mes)

Tabla 1.2 Datos de regresión para la Aerolínea

Page 39: 8 Regrecion y Correlacion2009

Las sumas de los cuadrados y de los productos cruzados son:

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

148.933333 15

(187)(268) - 3.490

)Y)(X(-XYSCxy

n

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

Page 40: 8 Regrecion y Correlacion2009

En el caso de nuestro ejemplo

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCE

x

2

Proporciona una medida cuantificable de que tan bien se ajusta el modelo a los datos que se han recolectado.

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCySCE

x

2xy

Page 41: 8 Regrecion y Correlacion2009

El error estándar siempre se expresa en las mismas unidades que la variable dependiente Y, en este caso miles de pasajeros.

Por tanto, el error estándar de 0.907, o 907 pasajeros mide la variabilidad de los valores Y alrededor de la recta de regresión.

En análisis de regresión se tienen dos variables, X y Y. el error estándar de estimación es una medida de dispersión de los valores Y alrededor de su media, dado un valor X específico.

Como el error estándar de estimación es similar a la desviación estándar para una sola variable, puede interpretarse similarmente.

En el ejemplo actual, en donde X = 10.

2.15)10(08.140.4Yi

Page 42: 8 Regrecion y Correlacion2009

El valor de 15,200 es el valor promedio para Y para X es igual a 10 muchas veces.

El error estándar de estimación, determina un valor de 0.907 por encima y por debajo del valor promedio de 15.2.

Estos puntos son 14.29 (15.2 – 0.907) y 16.11 (15.2 + 0.907).

En este caso, el 68.3% de las veces cuando se invierte US$10.000 en publicidad, el número de pasajeros estará entre 14.290 y 16.110. El 31.7% del tiempo restante, el número de pasajeros excederá de 16.110 o será menor que 14.290.

Figura 1.8

Error estándar de estimación

Y

Page 43: 8 Regrecion y Correlacion2009

1.7 Análisis de correlación

Conjunto de técnicas estadísticas empleadas para medir la intensidad de la asociación entre dos variables.

El objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables

Es decir qué tan bueno es el mejor ajuste.

.

Page 44: 8 Regrecion y Correlacion2009

El coeficiente de correlación (r) Es una medida de la intensidad de la relación

entre dos variables.

•Puede tomar valores entre -1.00 y 1.00.

•Valores de -1.00 o 1.00 indican correlación fuerte y perfecta.

•Valores cercanos a 0.0 indican correlación débil.

•Valores negativos indican una relación inversa y valores positivos indican una relación directa.

Page 45: 8 Regrecion y Correlacion2009

Figura 1.9

Posibles valores para el coeficiente de correlación r

Page 46: 8 Regrecion y Correlacion2009

El coeficiente de correlación se calcula así:

Se observa precisamente lo que r está midiendo.

La porción que está explicada por el modelo de regresión SCR.

Con relación al monto total de la desviación alrededor de , SCT,

Como raíz cuadrada de SCR/SCT, el coeficiente de correlación proporciona una medida relativa

Por ende mide la fuerza de la relación entre Y y la variable explicativa X.

Coeficiente

de correlación

[1.22]

SCTSCR

r total Variación

explicada Variación

Y

Page 47: 8 Regrecion y Correlacion2009

La fórmula (1.22) es difícil de calcular manualmente. Una fórmula más conveniente

En nuestro l caso

Forma de calcular

el coeficiente de correlación

[1.23] )SCy)(SCx(

SCxyr Y

9683.0)7333.171)(7333.137(

93333.148r

Esto indica una relación positiva fuerte entre los pasajeros y la cantidad de dinero invertido en fines publicitarios.

Page 48: 8 Regrecion y Correlacion2009

.

El coeficiente de determinación r2

Es otra medida la más importante de la bondad de ajuste se halla.

Una fórmula más conveniente de cálculo es:

Proporciona una medida de bondad de ajuste porque revela que porcentaje del cambio en Y se explica por un cambio en X.

Coeficiente de

determinación

[1.24] una medida de bondad de ajuste

SCT

SCR

totalDesviación

licadaDesviaciónr

exp2

Fórmula computacional para

[1.25] el coeficiente de determinación ))((

)( 22

SCySCx

SCxyr

Page 49: 8 Regrecion y Correlacion2009

El 94% del cambio en el número de pasajeros se explica mediante un cambio en la publicidad.

Este r2 tiene significado sólo para las relaciones lineales.

Dos variables pueden tener un r2 de cero y sin embargo estar relacionadas en sentido curvilíneo.

Además, no se interpreta este valor como si el 94% del cambio en los pasajeros fuera causado por un cambio en la publicidad.

La correlación no significa causa.

El coeficiente de determinación para nuestro caso

Como se puede esperar, r2 puede determinarse más fácil, simplemente

elevando al cuadrado el coeficiente de correlación r.

r2 = (0.9683)2 = 0.940.94 o 0.93776

)7333.171)(7333.137(

)9333.148(

)((

)(

2

22

22

r

r

SCr

0.94 o 0.93776

)7333.171)(7333.137(

)9333.148(

))((

)(

2

22

22

r

r

SCYSCx

SCxyr

Page 50: 8 Regrecion y Correlacion2009

1.8 Limitaciones del análisis de regresión

Aunque los análisis de regresión y correlación con frecuencia han demostrado ser de utilidad en la toma de decisiones para una gran variedad de negocios y de asuntos económicos, existen ciertas limitaciones en su aplicación e interpretación.

Estos no pueden Determinar relaciones causa-efecto.

Adicionalmente, se debe tener cuidado de no utilizar el modelo de regresión para predecir Y para valores de X que estén fuera del rango del conjunto original de datos.

Figura 1.15

Posible relación X – Y

Page 51: 8 Regrecion y Correlacion2009

Fin del CapituloFin del Capitulo

Page 52: 8 Regrecion y Correlacion2009

0.94 o 0.93776

)7333.171)(7333.137(

)9333.148(

))((

)(

2

22

22

r

r

SCySCx

SCxyr

Page 53: 8 Regrecion y Correlacion2009

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

Page 54: 8 Regrecion y Correlacion2009

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

SCX = Suma de cuadrados de X

Page 55: 8 Regrecion y Correlacion2009

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCySCE

x

2xy

Page 56: 8 Regrecion y Correlacion2009

1.08 ņ 1.0813166

148.933333

733333.137

SCx

SCxyb

1

Page 57: 8 Regrecion y Correlacion2009

Las sumas de los cuadrados y de los productos cruzados son:

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

148.933333 15

(187)(268) - 3.490

)Y)(X(-XYSCxy

n

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

Page 58: 8 Regrecion y Correlacion2009

Las sumas de los cuadrados y de los productos cruzados son:

3137.733333 15

(187)-2.469

)(

2

22

n

XXSCx

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

148.933333 15

(187)(268) - 3.490

)Y)(X(-XYSCxy

n

171.733333 n

(268) - 4.960

)(SCy

2

22

n

YY

Page 59: 8 Regrecion y Correlacion2009

En el caso de nuestro ejemplo

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCE

x

2

Proporciona una medida cuantificable de que tan bien se ajusta el modelo a los datos que se han recolectado.

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCySCE

x

2xy

Page 60: 8 Regrecion y Correlacion2009

En el caso de nuestro ejemplo

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCE

x

2

0.907 o 0.90678

0.82226Se

0.82226 2-15

10.6893CME

10.6893

(148.9333)-171.7333

2

7333.137

SC

)SC(SCySCE

x

2xy

Se = El error estándar de estimación

Page 61: 8 Regrecion y Correlacion2009

Forma de calcular

el coeficiente de correlación

[1.23] )SCy)(SCx(

SCxyr Y

9683.0)7333.71)(7333.137(

93333.148r

Esto indica una relación positiva fuerte entre los pasajeros y la cantidad de dinero invertido en fines publicitarios.

Page 62: 8 Regrecion y Correlacion2009

1.08 ņ 1.0813166

148.933333

733333.137

SCx

SCxyb

1

Page 63: 8 Regrecion y Correlacion2009

Observaciones ( meses )

Publucidad en miles de

$ X

Pasageros en Miles ( Y)

Pronóstico Pasageros en Miles Ŷ

1 10 15 15,199419172 12 17 17,362052273 8 13 13,036786064 17 23 22,768635045 10 16 15,199419176 15 21 20,606001947 10 14 15,199419178 14 20 19,524685389 19 24 24,9312681510 10 17 15,1994191711 11 16 16,2807357212 13 18 18,4433688313 16 23 21,6873184914 10 15 15,1994191715 12 16 17,36205227

Sumatoria 187 268Promedio 12,46666667 17,86666667

ii X08.140.4Y