Tecnicas de Estadistica - Regresión
-
Upload
renzo-bass -
Category
Documents
-
view
11 -
download
0
Transcript of Tecnicas de Estadistica - Regresión
-
El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta.CURVA DE AJUSTEFrecuentemente encontramos que existe una relacin entre dos o ms variables, y la expresamos por medio de una ecuacin matemtica.
-
Uno de los propsitos principales de la curva de ajuste es estimar una de las variables (la variable dependiente) de la otra (la variable independiente). El proceso de estimacin se conoce como regresin. Si y se va estimar a partir de x por medio de alguna ecuacin la llamamos ecuacin de regresin de y sobre x y a la curva correspondiente curva de regresin de y sobre x.
-
La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que cada relacin est dada por un par de puntos (uno para cada variable). La variable del eje horizontal x normalmente es la variable causa, y la variable del eje vertical y es la variable efecto.
-
MTODO DE MNIMOS CUADRADOSMs de una curva parece ajustar a un conjunto de datos, por lo que se hace necesario obtener la mejor recta o curva de ajuste.
De todas las curvas de aproximacin de un conjunto de puntos de datos dados, la curva que tenga la propiedad de que
Es la mejor curva de ajuste.
-
ANALISIS DE CORRELACION SIMPLEOBJETIVOSMuchas decisiones comerciales dependen de conocer la relacin entre dos o ms variables. El anlisis de correlacin da como resultado un nmero que resume el grado de relacin lineal existente entre dos variables.Utiliza diagramas de dispersin para estimar la relacin entre dos variables.El coeficiente de correlacin expresa el grado de asociacin lineal que existe entre dos variables.
-
COVARIANZA: Estadstica que mide el grado de dispersin conjunta de dos variables x e y. Se define como la media aritmtica de los productos de las diferencias de los datos con respecto a sus medias. Se denota por: Cov(X, Y) SXY
-
Diagrama de dispersin: Llamada tambin nube de puntos, grfica que presenta la relacin entre las dos variables de inters.Anlisis de correlacin: Tcnicas estadsticas empleadas para medir la intensidad de la relacin (correlacin) entre dos variables.Ejemplo: Se est realizando un estudio de mercado para determinar si existe relacin entre la cantidad gastada por semana en alimentos y el tamao de la familia. Se toma una muestra de 10 familias y revel las siguientes cifras:
-
X : 3 6 5 7 4 5 2 5 8 1Y : 90 130 110 140 100 115 80 105 150 70 DIAGRAMA DE DISPERSINX : Tamao de la familia Y : Dinero gastado en alimentos
-
Coeficiente de correlacin: Mide la intensidad de la relacin entre dos variables, se denota por r. Puede tomar cualquier valor entre -1 a +1 inclusive.r = +1,00 Correlacin perfecta positiva.r = - 1,00 Correlacin perfecta negativa.r = 0,00 No existe correlacinLa frmula para el clculo de r es:r recomendable: [ -1; -0,8 ] [ 0,8; 1,0 ]COVARIANZADESVIACIONES ESTNDAR
-
ANALISIS DE REGRESION SIMPLEOBJETIVOS El anlisis de regresin lineal da como resultado una ecuacin matemtica que describe cierta relacin entre dos o ms variables. Utiliza estimacin de mnimos cuadrados para predecir valores futuros de la variable dependiente. Medir el error en el pronstico, error estndar.
-
ECUACION DE REGRESIONExpresin matemtica que define la relacin entre la variable independiente (x) y la variable dependiente (y). La determinacin de la recta de regresin se lleva a cabo mediante el mtodo denominado: Principio de mnimos cuadrados, que proporciona la recta de mejor ajuste.La forma general de la ecuacin de regresin es:Modelo Matemtico Lineal
-
Y : Valor pronosticado de la variable dependiente Y para un valor seleccionado de la variable independiente X. X : Valor seleccionado para la variable X.a : Interseccin con el eje Y. Valor estimado de Y cuando X = 0.b : Pendiente de la recta. Variacin de Y cuando la variable independiente X varia en una unidad.
-
Las frmulas para hallar a y b son:Donde:X : Es el valor de la variable independiente.Y : Es el valor de la variable dependiente.n : Es el nmero de elementos de la muestra.
-
En nuestro ejemplo, la ecuacin de regresin lineal obtenida a travs de Excel es:Su representacin grfica es:http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html
Grfico2
9090.2832448378
130125.3773156342
110113.6792920354
140137.075339233
100101.9812684366
115113.6792920354
8078.5852212389
105113.6792920354
150148.7733628319
7066.8871976401
55.1955.1891740413
Y
Pronstico para Y
Hoja1
390Resumen
6130
5110Estadsticas de la regresin
7140Coeficiente de correlacin mltiple0.99
4100Coeficiente de determinacin R^20.98
5115R^2 ajustado0.97
280Error tpico4.15
5105Observaciones10.00
8150
170ANLISIS DE VARIANZA
055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F
Regresin1.005802.265802.26337.010.00
Residuos8.00137.7417.22
Total9.005940.00
CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin55.193.2117.180.0047.7862.5947.7862.59
Variable X 111.700.6418.360.0010.2313.1710.2313.17
Anlisis de los residuales
ObservacinPronstico para YResiduos
190.28-0.280.08
2125.384.6221.37
3113.68-3.6813.54
4137.082.928.55
5101.98-1.983.92
6113.681.321.74
778.581.422.00
8113.68-8.6875.33
9148.771.231.50
1066.893.119.69
0.00137.74
Syx17.22
4.15
Hoja1
Y
Pronstico para Y
Hoja2
390Resumen
6130
5110Estadsticas de la regresin
7140Coeficiente de correlacin mltiple0.99
4100Coeficiente de determinacin R^20.98
5115R^2 ajustado0.98
280Error tpico3.91
5105Observaciones11.00
8150
170ANLISIS DE VARIANZA
055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F
Regresin1.008434.558434.55551.130.00
Residuos9.00137.7415.30
Total10.008572.29
CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin55.192.3923.050.0049.7760.6149.7760.6057814419
Variable X 111.700.5023.480.0010.5712.8310.5712.825238816
Anlisis de los residuales
ObservacinPronstico para YResiduos
190.28-0.28
2125.384.62
3113.68-3.68
4137.082.92
5101.98-1.98
6113.681.32
778.591.41
8113.68-8.68
9148.771.23
1066.893.11
1155.190.00
Hoja2
Y
Pronstico para Y
Hoja3
-
Coeficiente de determinacin (r2):Mide la proporcin(%) de la variacin total en la variable y que se explica se debe , a la variacin en la variable x.En nuestro ejemplo:r = 0,99 significa que las dos variables tienen una correlacin positiva intensa.r2 = 0,98 significa que el 98% de la variacin total del dinero gastado en alimentos, se debe es explicado por la variacin del tamao de las familias.
-
ERROR ESTANDAR DE ESTIMACIONResume la disparidad entre lo observado y lo estimadoEs un indicador del grado de precisin con que la ecuacin de regresin, describe la relacin entre las dos variables.
Hoja1
390Resumen
6130
5110Estadsticas de la regresin
7140Coeficiente de correlacin mltiple0.99
4100Coeficiente de determinacin R^20.98
5115R^2 ajustado0.97
280Error tpico4.15
5105Observaciones10.00
8150
170ANLISIS DE VARIANZA
055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F
Regresin1.005802.265802.26337.010.00
Residuos8.00137.7417.22
Total9.005940.00
CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin55.193.2117.180.0047.7862.5947.7862.59
Variable X 111.700.6418.360.0010.2313.1710.2313.17
Anlisis de los residuales
YYY - Y
9090.28-0.280.08
130125.384.6221.37
110113.68-3.6813.54
140137.082.928.55
100101.98-1.983.92
115113.681.321.74
8078.581.422.00
105113.68-8.6875.33
150148.771.231.50
7066.893.119.69
0.00137.74
Syx17.22
4.15
Hoja1
9090.2830188679
130125.3773584906
110113.679245283
140137.0754716981
100101.9811320755
115113.679245283
8078.5849056604
105113.679245283
150148.7735849057
7066.8867924528
Y
Pronstico para Y
Hoja2
390Resumen
6130
5110Estadsticas de la regresin
7140Coeficiente de correlacin mltiple0.99
4100Coeficiente de determinacin R^20.98
5115R^2 ajustado0.98
280Error tpico3.91
5105Observaciones11.00
8150
170ANLISIS DE VARIANZA
055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F
Regresin1.008434.558434.55551.130.00
Residuos9.00137.7415.30
Total10.008572.29
CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin55.192.3923.050.0049.7760.6149.7760.6057814419
Variable X 111.700.5023.480.0010.5712.8310.5712.825238816
Anlisis de los residuales
ObservacinPronstico para YResiduos
190.28-0.28
2125.384.62
3113.68-3.68
4137.082.92
5101.98-1.98
6113.681.32
778.591.41
8113.68-8.68
9148.771.23
1066.893.11
1155.190.00
Hoja2
Y
Pronstico para Y
Hoja3
-
Regresin en ExcelLos valores que se presentan a continuacin corresponden a las ventas en unidades de cierto artculo por da.Valores de XValores de YValores de Salida
DaVenta110021503140412551306150714081609180
-
Regresin en ExcelValores de SalidaCoeficiente de CorrelacinCoeficiente de DeterminacinParmetros del modelo:a: Intercepto con el eje Yb: Pendiente (ndice de regresin) SSE