Unidad5 reglineal
of 30
/30
-
Author
universidad-cesar-vallejo -
Category
Education
-
view
232 -
download
1
Embed Size (px)
Transcript of Unidad5 reglineal
- 1. REGRESIN LINEAL SIMPLE Email:[email protected]
- 2. Objetivos: Al finalizar este capitulo el alumno ser capaz de: Representar la recta que define la relacin lineal entre dos variables Estimar la recta de regresin por el mtodo de mnimos cuadrados e interpretar su ajuste. Realizar inferencia sobre los parmetros de la recta de regresin Construir e interpretar intervalos de confianza e intervalos de prediccin para la variable dependiente Realizar una prueba de hiptesis para determinar si el coeficiente de correlacin es distinto de cero
- 3. USOS DEL ANLISIS DE REGRESIN: Prediccin: razn principal para usar regresin. Descripcin: La idea es establecer una ecuacin que describa la relacin entre la variable dependiente y las variables predictoras. Control: Controlar el comportamiento o variacin de la variable de respuesta. Seleccin de variables
- 4. REPRESENTACION GRAFICA Relacin entre las variables Sugerir modelos posibles Existencia de valores atpicos GRAFICO DE DISPERSION
- 5. EL MODELO DE REGRESIN LINEAL SIMPLE iii eXY ++=
- 6. La variable X es no aleatoria y observada con la mejor precisin posible. Los errores ei son variables aleatorias con media 0 y varianza 2 constantes . Los errores ei y ej (i,j=1,n) son independientes entre si. Es decir, Cov(eiej)=0. Suposiciones del modelo:
- 7. ESTIMACION DE LOS PARAMETROS OBJETIVO: Hallar los estimadores bo y b1 de los parmetros desconocidos o, 1 respectivamente, y obtener la ecuacin de prediccin
- 8. ANALISIS DE VARIANZA Descomposicin de la variacin total
- 9. CUADRO ANOVA Fuentes deVariacin G.L SumadeCuadrados(SC) Cuadrados Medios(CM) Test F Regresin 1 SCReg CMReg=SCReg F=CMReg/CME Error n-2 SCE CME =SCE/n-2 Total n-1 SCY Test de F de la tabla del ANOVA 1 1 : 0 : 0 Ho Ha =
- 10. El coeficiente de determinacin R2 Corresponde a la porcin de la variacin total SCTo, de la variable dependiente que es explicada por el modelo de regresin. 2 ReSC g R SCTo =
- 11. Se han recogido datos de una localidad mediante sendas encuestas sobre el consumo (Y ) de productos de hogar y del ingreso (X) de los consumidores consultados, obtenindose los siguientes resultados: X Y 7.1 54.6 3.4 44.7 5.5 51 4.3 49.7 3.7 47.2 6 55 3.3 42.9 6.7 55.6 5.1 47.6 4.5 49.5 2.7 44.6 5.9 57.2
- 12. Cumple los supuestos de la regresin? Hallar la ecuacin de regresin estimada Hallar el ANOVA Determinar el coeficiente de determinacin Probar si existe relacin lineal entre X e Y. Usar un nivel de significacin del 5 %..
- 13. 3 4 5 6 7 42 47 52 57 X2 Y2 Y2 = 35.1728 + 3.05029 X2 S = 2.11519 R-Sq = 82.2 % R-Sq(adj) = 80.5 % Regression Plot
- 14. Average: -0.0000000 StDev: 2.01676 N: 12 Anderson-Darling Normality Test A-Squared: 0.241 P-Value: 0.713 -3 -2 -1 0 1 2 3 4 .001 .01 .05 .20 .50 .80 .95 .99 .999 Probability RESI3 Normal Probability Plot
- 15. -3 -2 -1 0 1 2 3 4 0 1 2 3 4 Residual Frequency Histogram of Residuals 0 5 10 -5 0 5 Observation Number Residual I Chart of Residuals Mean=-5.9E-16 UCL=5.266 LCL=-5.266 45 50 55 -3 -2 -1 0 1 2 3 4 Fit Residual Residuals vs. Fits -2 -1 0 1 2 -3 -2 -1 0 1 2 3 4 Normal Plot of Residuals Normal Score Residual Residual Model Diagnostics
- 16. The regression equation is Y2 = 35.2 + 3.05 X2 Predictor Coef SE Coef T P Constant 35.173 2.258 15.58 0.000 X2 3.0503 0.4482 6.81 0.000 S = 2.115 R-Sq = 82.2% R-Sq(adj) = 80.5% Analysis of Variance Source DF SS MS F P Regression 1 207.21 207.21 46.31 0.000 Residual Error 10 44.74 4.47 Total 11 251.95
- 17. INTERVALO DE CONFIANZA PARA EL COEFICIENTE DE REGRESIN Supuesto: 1 1 1( , ( ))b N V : Luego, un intervalo de confianza de 100(1-) para 1 est dado por: 1 11 1 1( ) ;b bIC b tS b tS = + 1 ( ) b CME S SC X = (1 , 2) 2 n t t = Donde:
- 18. PRUEBA DE HIPOTESIS PARA 1 1 1 : 0 : 0 Ho Ha = ( ) c b t CME SC X =
- 19. ESTIMACIN DE LA RECTA MEDIA Interesa estimar la respuesta media en funcin de un valor especifico de Xh 2 /( , )hy xY N : 0 1 h hY b b X= +
- 20. Luego, un intervalo de confianza de 100(1-) para Y/X est dado por: / ( ) ; h h Y X h hY Y IC Y tS Y tS = + (1 , 2) 2 n t t = ( ) 2 1 ( )h h Y X X S CME n SC X = + Donde:
- 21. PREDICCION DE UNA NUEVA OBSERVACION Interesa predecir una observacin que se producir para un valor especifico Xp 2 /( , )pp y xY N :
- 22. Luego, un intervalo de confianza de 100(1-) para la nueva observacin Yp est dado por: ( ) ; p p p pY Yp IC Y Y tS Y tS= + Donde: (1 , 2) 2 n t t = ( ) 2 1 1 ( ) p Yp X X S CME n SC X = + +
- 23. COEFICIENTE DE CORRELACION . SPxy r SCx SCy = El anlisis de CORRELACION intenta medir la fuerza de la relacin lineal entre dos variables. cov( ) XY x y XY = Estimado por:
- 24. 1r = + 1r = 0r = 0r =
- 25. PRUEBA DE HIPOTESIS DE LA CORRELACION : 0Ho = : 0Ha 2 1 2 c r t r n =
- 26. Un comerciante al menudeo lleva a cabo un estudio para determinar la relacin entre los gastos semanales de publicidad y las ventas. Se registran los siguientes datos: Costos por Publicidad 40 20 25 20 30 50 40 20 50 40 25 50 Ventas($) 385 400 395 365 475 440 490 420 560 525 480 510 Resolver: 1. Analizar el diagrama de dispersin 2. Ajustar un modelo de regresin lineal simple 3. Determinar si el efecto del monto de las ventas sobre el costo promedio de la publicidad es significativo.
- 27. 4.Calcule el intervalo de confianza del 95% para el parmetro . 5. Podra afirmarse que por cada $10 de aumento en el costo de publicidad, el monto promedio de las ventas aumenta en $35?. 6.Estime el monto promedio de las ventas si en una semana en particular se invierte en publicidad $35. Calcule un intervalo de confianza del 95% para esta estimacin. 7.Suponga que la semana entrante se van a invertir en publicidad un total de $45. Cul ser el monto de las ventas? Encuentre un intervalo de confianza del 95 % para esta prediccin. 8. Anlisis de los supuestos sobre el trmino de error.
- 28. Average: -0.0000000 StDev: 47.8883 N: 12 Anderson-Darling Normality Test A-Squared: 0.281 P-Value: 0.575 -50 0 50 .001 .01 .05 .20 .50 .80 .95 .99 .999Probability RESI5 Normal Probability Plot
- 29. 400 450 500 -2 -1 0 1 Fitted Value StandardizedResidual Residuals Versus the Fitted Values (response is Ventas($) -2 -1 0 1 -2 -1 0 1 2 NormalScore Standardized Residual Normal Probability Plot of the Residuals (response is Ventas($)