COMPENDIOS 8,9,10
-
Upload
jessica-martinez -
Category
Documents
-
view
10 -
download
0
description
Transcript of COMPENDIOS 8,9,10
-
Capitulo VIII. Las regresiones
Ejercicios
1) Para estudiar el efecto de las aguas residuales de las alcantarillas que
afluyen a un lago, se toman medidas de la concentracin de nitrato en el
agua. Para monitorizar la variable se ha utilizado un antiguo mtodo
manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto
una alta correlacin positiva entre las medidas tomadas empleando los
dos mtodos, entonces se har uso habitual del mtodo automtico. Los
datos obtenidos son los siguientes:
Manual = X 25 40 120 75 150 300 270 400 450 575
Automtico = Y 30 80 150 80 200 350 240 320 470 583
Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es
apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la
lectura que se obtendra empleando la tcnica automtica con una muestra de
agua cuya lectura manual es de 100. Realizar el ejercicio en R
SOLUCION
Manual = X Automtico = Y
25 30 625 750
40 80 1600 3200
120 150 14400 18000
75 80 5625 6000
150 200 22500 30000
300 350 90000 105000
270 240 72900 64800
400 320 160000 128000
450 470 202500 211500
575 583 330625 335225
2405 2503 900775 902475
-
> datos=read.table("agua.txt", header=T)
> attach(datos)
> datos
x y 1 25 30
2 40 80
3 120 150 4 75 80
5 150 200
6 300 350 7 270 240
8 400 320
9 450 470 10 575 583 > regresion regresin
Call:
lm(formula = y ~ x, data = datos)
Coefficients:
(Intercept) x
26.1150 0.9322 > summary(regresion)
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max -78.98 -18.57 14.31 23.53 44.24
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x 0.93216 0.07064 13.195 1.04e-06 *** ---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 40.11 on 8 degrees of freedom
Multiple R-squared: 0.9561, Adjusted R-squared: 0.9506
F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06
Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que
entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del
modelo lineal para el problema
bnXmY
Y=0.9(100)+26.11=116.11
-
2) Sobre una hoja de papel cuadriculado dibuje aproximadamente 5
cuadrados de diversos tamaos.
a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?.
Represente esta variable mediante la letra N
b. Cunto mide el lado de cada cuadrado?. Represente esta variable
mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?
Solucin
N L NL
1 1 1 1
4 2 16 8
9 3 81 27
25 5 625 125
36 6 1296 216
75 17 2019 377
>cuadrititos=read.table("cuadras.txt",header=T)
> attach(cuadrititos)
> cuadrititos
N L 1 1 1
2 4 2
3 9 3 4 25 5
5 36 6 > regresion summary(regresion)
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1 2 3 4 5 -0.4895 0.1011 0.4188 0.2353 -0.2658
-
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.35302 0.28808 4.697 0.01826 *
N 0.13647 0.01434 9.519 0.00246 ** ---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 0.4287 on 3 degrees of freedom
Multiple R-squared: 0.968, Adjusted R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459 > plot(cuadrititos)
> abline(lm(L~N))
3) A partir de las siguientes observaciones para 5 aos de las variables X e
Y, ajstese el modelo de regresin de Y en funcin de X ms idneo.
Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo
4) Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y
34 kilogramos respectivamente, entonces una nia de 12 aos pesara
aproximadamente:
A. 45
B. 55
Ao X Y
1995
1996
1997
1998
1999
1
2
3
4
5
1,25
5
11,25
20
30,5
-
C. 15
D. 51
E. 61
5) En el anlisis de Regresin lineal se puede afirmar todo lo siguiente
excepto:
A. Ajusta los datos a una lnea recta
B. Predice valores de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es
ms concreto que el mtodo matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea
recta llamada ecuacin de regresin
6) Dado Los siguientes datos expuestos en la tabla
La frmula de regresin para los datos propuestos est dada por:
A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2
D. y = 14,4x + 47 E. y = 14x + 48,8
7) El Grafico para los puntos dispersos est dado por:
Edad 1 2 3 4 5
Estatura 60 80 100 110 112
0
20
40
60
80
100
120
0 1 2 3 4 50
20
40
60
80
100
120
0 1 2 3 4 5
0
20
40
60
80
100
120
0 1 2 3 4 50
20
40
60
80
100
120
0 1 2 3 4 5
A B
C D
-
8) El diagrama de dispersin para la regresin lineal est dado por
Capitulo IX: Medidas de asimetra y apuntamiento
1) Los siguientes datos corresponden a 100 salarios tomados en una
encuesta aplicada a 380 habitantes de Villavicencio. Determinar en R
el grado de asimetra de los datos. establecer una conclusin.
289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000
289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000
289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000
289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000
310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000
310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000
310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000
320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000
320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000
320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000
>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,
320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759
600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,5667
00,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,102500
0,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,
320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,
859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,
1700100,1750000)
> par(mfrow=c(1,2))
0
20
40
60
80
100
120
0 1 2 3 4 5
0
20
40
60
80
100
120
0 1 2 3 4 5
A B
0
20
40
60
80
100
120
0 1 2 3 4 5
0
20
40
60
80
100
120
0 1 2 3 4 5
C D
-
> f=table(salarios)
> dd barplot(f)
> plot(dd,add=T)
> summary(salarios)
Min. 1st Qu. Median Mean 3rd Qu. Max.
289000 340000 700000 750900 947200 1800000
Esta es una asimetra positiva ya que
2) En una distribucin asimtrica negativa:
A. La moda se encuentra entre la media y la mediana
B. La moda est ubicada a la derecha de la media
C. La media es menor que la desviacin tpica
D. La media es menor que la mediana
E. La moda y la mediana son iguales
3) Los momentos de segundo orden con respecto a la media de dos
distribuciones son 9 y 16, mientras que los momentos de tercer orden
son 8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:
A. La primera porque tiene mayor grado de deformacin
B. La primera porque tiene menor grado de deformacin
C. La segunda porque tiene mayor grado de deformacin
D. La segunda porque tiene menor grado de deformacin
-
4) Uno de los siguientes enunciados es verdadero
A. La media en una muestra de datos agrupados la divide en dos
partes.
B. Una distribucin de datos permite calcular todas las medidas de
tendencia central
C. La moda es un dato que permite analizar un resultado esperado
D. Una medida de dispersin est libre del clculo de la media.
5) En el anlisis de regresin lineal se puede afirmar todo lo siguiente,
excepto
A. Ajusta todos los datos a una lnea recta
B. Predice el valor de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables
D. El mtodo grafico es ms concreto que el mtodo matemtico
E. Una relacin lineal de datos queda representada por una recta.
6) Dado que el grado de asimetra de una distribucin es de 2,27, la
media es de 189,87 y la mediana 189,16, entonces la varianza toma
un valor correspondiente a:
A. 0.93
B. 0.88
C. 0.78
D. 1.88
E. 1.78
7) Tomando una distribucin ligeramente asimtrica, calcular la moda
sabiendo que su media es igual a 3 y que la diferencia entre la media
y la mediana es igual a -2
A. 2.9
B. 0.9
C. 19
D. 9
E. 1/9
8) En la siguiente distribucin de datos el coeficiente de asimetra segn
el coeficiente de Pearson es:
-
Xi 1 2 3 4 5 6
f 2 8 3 5 7 5
A.
B. 2
C. 1/3
D. 3
E. 1
Capitulo X medidas de concentracin
1) Retome los 100 datos y elabore una tabla en R para determinar el
coeficiente de Gini. Utilice la librera ineq, y compare los resultados.
Establezca conclusiones
289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000
289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000
289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000
289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000
310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000
310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000
310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000
320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000
320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000
320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000
> library(ineq)
>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665
500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289
000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,34
0000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,9
42500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,80000
0,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,34
5000,862300,1800000,345000,800000,1700100,1750000)
> g=ineq(salarios,type="Gini")
> g
[1] 0.3122976
> plot(Lc(salarios),col="darkred",lwd=2)