Post on 31-Jul-2015
Regresión Lineal Simple
Capitulo 17
Los temas
• Regresión Lineal
• Comparando ecuaciones lineales
• Bondad de ajuste (Chi square)
• Tabla de contingencia
• The sign test (la prueba de signos)
• The run test (la prueba de corrida)
Regresión vs. correlación
• la relación entre dos variables– la magnitud de una variable (dependiente) se
asume que es determinada por una segunda variable (independiente)
– el termino “dependiente” no implica “causa y efecto”
La edad de los chupacabras
La
inte
lige
nci
a
La edad de los chupacabras
La
inte
lige
nci
aYi X i
La edad de los chupacabras
La
inte
lige
nci
aYi X i i
La edad de los humanos
La
inte
lige
nci
a
La edad de los chupacabras
La
inte
lige
nci
aYi X i i
La edad de los humanos
La
inte
lige
nci
aY
“Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)
(X4,Y4)
La edad de los humanos
La
inte
lige
nci
aY
“Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)
Y2 Y
La edad de los humanos
La
inte
lige
nci
aY
“Best fit” Line, Ajuste Optimo
(X1,Y1)
(X2,Y2)
(X3,Y3)
Y2 Y
Y2 ˆ Y
Minimizar la diferencia entre (Y2 ˆ Y i 1
n
)2
X
Y
X
Y
X
Y
Positiva Negativa
Zero
El largo de las alas de los gorrión pardal de diferente edad
• X (Edad) Y Largo del ala (cm)• 3.0 1.4• 4.0 1.5• 5.0 2.2• 6.0 2.4• 8.0 3.1• 9.0 3.2• 10.0 3.2
El largo de las alas de los gorrón pardal de diferente edad
• X (Edad) Y Largo del ala (cm)• 11.0 3.9• 12.0 4.1• 14.0 4.7• 15.0 4.5• 16.0 5.2• 17.0 5.0•
Calcular la linea
x2 (Xi X)2 Xi2
( Xi )2
n
xy XiYi ( Xi )( Yi )
n
b xyx2
n
X X
X2
x2 b
a Y bX
Y Y
X iYi xy
n 13
X 130.0
X 10.0
X2 1562.0
x2 1562.00 (130.0)2
13262.0
b
a Y bX
Y 44.4
Y 3.415
XY 514.80
xy 514.80 (130.0)(44.4)13
70.80
b xyx2
70.80
262.000.270
a Y bX 3.415 (0.270cm / day)(10.0days)
0.715cm
Y 0.715 0.270X
Assumptions
• 1. Para cada “x” hay una poblacion con distribución normal de “y”
• 2. homogeneidad de varianza
• 3. la relación es lineal
• 4. datos al azar e independientes
• 5. los x’s se obtiene sin error.
La prueba
• Source SS DF MS
• Total n-1
• Linear reg. 1
• Residual (total SS -reg SS) n-2
• F =
y2( xy)2
x2regSS
regDF
resSS
resDF
regMS
resMS
La prueba
• Source SS DF MS
• Total 19.656923 12
• Linear reg.19.132214 1 19.132214
• Residual 0.524709 11 0.047701
•
• F = 401.1
• F0.05(1),1,11= 4.84r2
19.132214
19.6569230.97
Ejercicio• Determinar si el area fotosintetica de una orquidea
esta relacionado con la cantidad de flores producidas.
• Lepanthes rupestris, una orquídea endemic de Puerto Rico
• Trabajo de investigación de Eveneida Rodríguez
Area fotosintética (cm2) # de flores producidas2.644 22
2.709 0
2.759 28
2.598 24
2.718 10
2.262 4
2.520 16
2.826 38
2.559 16
2.395 4
2.160 0
2.830 29
3.097 46
13
0
.806
.650
.618
9.046
Count
Num. Missing
R
R Squared
Adjusted R Squared
RMS Residual
Regression Summary #fl vs. Leaf area
1 1668.190 1668.190 20.386 .0009
11 900.118 81.829
12 2568.308
DF Sum of Squares Mean Square F-Value P-Value
Regression
Residual
Total
ANOVA Table #fl vs. Leaf area
-104.899 27.386 -104.899 -3.830 .0028
46.973 10.403 .806 4.515 .0009
Coefficient Std. Error Std. Coeff. t-Value P-Value
Intercept
Leaf area
Regression Coefficients #fl vs. Leaf area
-505
101520
253035404550
#fl
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2Leaf area
Y = -104.899 + 46.973 * X; R^2 = .65
Regression Plot