portafolio tercer corte

15
Ejercicio 1 Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del método automático. Los datos obtenidos son los siguientes: Manual = X 25 40 120 75 150 300 270 400 450 57 5 Automático = Y 30 80 150 80 200 350 240 320 470 58 3 Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R SOLUCION Manual = X Automático = Y X 2 XY 25 30 625 750 40 80 1600 3200 120 150 14400 18000 75 80 5625 6000 150 200 22500 30000 300 350 90000 105000 270 240 72900 64800 400 320 160000 128000 450 470 202500 211500 575 583 330625 335225 2405 2503 900775 902475

description

trabajo para obtension de nota

Transcript of portafolio tercer corte

  • Ejercicio 1

    Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen

    a un lago, se toman medidas de la concentracin de nitrato en el agua. Para

    monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un

    nuevo mtodo automtico. Si se pone de manifiesto una alta correlacin

    positiva entre las medidas tomadas empleando los dos mtodos, entonces se

    har uso habitual del mtodo automtico. Los datos obtenidos son los

    siguientes:

    Manual = X 25 40 120 75 150 300 270 400 450 57

    5Automtico = Y 30 80 150 80 200 350 240 320 470 58

    3

    Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es

    apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la

    lectura que se obtendra empleando la tcnica automtica con una muestra de

    agua cuya lectura manual es de 100. Realizar el ejercicio en R

    SOLUCION

    Manual = X Automtico =YX2 XY

    25 30 625 75040 80 1600 3200

    120 150 14400 1800075 80 5625 6000

    150 200 22500 30000300 350 90000 105000270 240 72900 64800400 320 160000 128000450 470 202500 211500575 583 330625 3352252405 2503 900775 902475

  • > datos=read.table("agua.txt", header=T)> attach(datos)> datos

    x y1 25 302 40 803 120 1504 75 805 150 2006 300 3507 270 2408 400 3209 450 47010 575 583

    > regresion regresin

    Call:lm(formula = y ~ x, data = datos)

    Coefficients:(Intercept) x 26.1150 0.9322

    > summary(regresion) Call:lm(formula = y ~ x, data = datos)

    Residuals: Min 1Q Median 3Q Max -78.98 -18.57 14.31 23.53 44.24

    Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 26.11496 21.20188 1.232 0.253 x 0.93216 0.07064 13.195 1.04e-06 ***---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Residual standard error: 40.11 on 8 degrees of freedomMultiple R-squared: 0.9561, Adjusted R-squared: 0.9506 F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06

    Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del modelo lineal para el problema

    bnXmY

    Y=0.9(100)+26.11=116.11

  • Ejercicio 2

    Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de

    diversos tamaos.

    a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?.

    Represente esta variable mediante la letra N

    b. Cunto mide el lado de cada cuadrado?. Represente esta variable

    mediante la letra L

    c. Coleccione su informacin en una tabla de datos.

    d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.

    Represente las parejas (L,N) en un plano cartesiano

    e. Qu clase de curva obtiene?

    Solucin

  • N L N2

    NL

    1 1 1 14 2 16 89 3 81 27

    25 5 625 12536 6 1296 21675 17 2019 377

    > cuadrititos=read.table("cuadras.txt",header=T)> attach(cuadrititos)> cuadrititos

    N L1 1 12 4 23 9 34 25 55 36 6

    > regresion summary(regresion)

    Call:lm(formula = L ~ N, data = cuadrititos)

    Residuals: 1 2 3 4 5 -0.4895 0.1011 0.4188 0.2353 -0.2658

    Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.35302 0.28808 4.697 0.01826 * N 0.13647 0.01434 9.519 0.00246 **---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Residual standard error: 0.4287 on 3 degrees of freedomMultiple R-squared: 0.968, Adjusted R-squared: 0.9573 F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459

    > plot(cuadrititos)> abline(lm(L~N))

    Ejercicio 3

    A partir de las siguientes observaciones para 5 aos de las variables X e Y,

    ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:

  • Y: produccin nacional de un subsector industrial, en millones de toneladas.

    X: tiempo

    Ejercicio 4

    Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34

    kilogramos respectivamente, entonces una nia de 12 aos pesara

    aproximadamente:

    A. 45

    B. 55

    C. 15

    D. 51

    E. 61

    Ejercicio 5

    En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:

    A. Ajusta los datos a una lnea recta

    B. Predice valores de una variable si se conoce el valor de la otra

    C. Establece una relacin cuantitativa entre dos variables relacionadas

    D. El mtodo grfico para determinar la relacin entre dos variables es ms

    concreto que el mtodo matemtico o de mnimos cuadrados

    E. Una relacin lineal entre dos variables queda representada por una lnea

    recta llamada ecuacin de regresin

    Ao X Y1995

    1996

    1997

    1998

    1999

    1

    2

    3

    4

    5

    1,25

    5

    11,25

    20

    30,5

  • Ejercicio 6

    Dado Los siguientes datos expuestos en la tabla

    La frmula de regresin para los datos propuestos est dada por:

    A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2

    D. y = 14,4x + 47 E. y = 14x + 48,8

    Ejercicio 7

    El Grafico para los puntos dispersos est dado por:

    Rta:

    Ejercicio 8

    El diagrama de dispersin para la regresin lineal esta dado por

    A B

    C

    D

    Edad 1 2 3 4 5 Estatura 60 80 100 110 112

  • Rta:

    Ejercicio 9

    Los siguientes datos corresponden a 100 salarios tomados en una encuesta

    aplicada a 380 habitantes de Villavicencio. Determinar en R el grado de

    asimetra de los datos. establecer una conclusin.

    289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

    289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

    289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

    289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

    310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

    310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

    310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

    320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

    320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

    320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

  • >salarios=c(289000,350000,886900,310000,650000,96120

    0,320000,756000,1200000,345000,289000,350000,88900

    0,320000,665500,965000,320000,756000,1300000,32000

    0,289000,350000,890000,320000,689500,996000,320000

    ,759600,1700100,750000,289000,566700,896500,320000

    ,689500,999000,340000,759600,1700100,1120000,31000

    0,566700,900000,320000,690000,1000000,340000,78900

    0,1700100,345000,310000,566700,936200,320000,69000

    0,1025000,340000,789000,1700100,863000,310000,6000

    00,942500,320000,699000,1025000,340000,800000,1700

    100,886000,320000,700000,1096000,320000,699000,106

    3000,340000,800000,1700100,345000,320000,700000,11

    16300,345000,859600,1777000,340000,800000,1700100,

    850000,320000,750000,1120000,345000,862300,180000

    0,345000,800000,1700100,1750000)

    > par(mfrow=c(1,2))

    > f=table(salarios)

    > dd barplot(f)

    > plot(dd,add=T)> summary(salarios) Min. 1st Qu. Median Mean 3rd Qu. Max.

    289000 340000 700000 750900 947200 1800000

    Esta es una asimetra positiva ya que x>Me

    Ejercicio 10

    En una distribucin asimtrica negativa:

    A. La moda se encuentra entre la media y la medianaB. La moda est ubicada a la derecha de la mediaC. La media es menor que la desviacin tpicaD. La media es menor que la medianaE. La moda y la mediana son iguales

    Ejercicio 11

  • Los momentos de segundo orden con respecto a la media de dos

    distribuciones son 9 y 16, mientras que los momentos de tercer orden son 8.1 y

    12. 8 respectivamente. La distribucin ms asimtrica es:

    A. La primera porque tiene mayor grado de deformacin B. La primera porque tiene menor grado de deformacin C. La segunda porque tiene mayor grado de deformacin D. La segunda porque tiene menor grado de deformacin

    Ejercicio 12Uno de los siguientes enunciados es verdadero

    A. La media en una muestra de datos agrupados la divide en dos partes.B. Una distribucin de datos permite calcular todas las medidas de

    tendencia centralC. La moda es un dato que permite analizar un resultado esperadoD. Una medida de dispersin est libre del clculo de la media.

    Ejercicio 13

    En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto

    A. Ajusta todos los datos a una lnea rectaB. Predice el valor de una variable si se conoce el valor de la otraC. Establece una relacin cuantitativa entre dos variablesD. El mtodo grafico es ms concreto que el mtodo matemticoE. Una relacin lineal de datos queda representada por una recta.

    Ejercicio 14

    Dado que el grado de asimetra de una distribucin es de 2,27, la media es de

    189,87 y la mediana 189,16, entonces la varianza toma un valor

    correspondiente a:

  • A. 0.93B. 0.88C. 0.78D. 1.88E. 1.78

    Ejercicio 15

    Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo

    que su media es igual a 3 y que la diferencia entre la media y la mediana es

    igual a -2

    A. 2.9B. 0.9C. 19D. 9E. 1/9

    Ejercicio 16

    En la siguiente distribucin de datos el coeficiente de asimetra segn el coeficiente de Pearson es:

    Xi 1 2 3 4 5 6f 2 8 3 5 7 5

    A. B. 2C. 1/3D. 3E. 1

    Ejercicio 17

    Retome los 100 datos y elabore una tabla en R para determinar el coeficiente

    de Gini. Utilice la librera ineq, y compare los resultados. Establezca

    conclusiones

    289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

    289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

    289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

    289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

    310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

  • 310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

    310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

    320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

    320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

    320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

    > library(ineq)>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,1700100,1750000)> g=ineq(salarios,type="Gini")> g

    [1] 0.3122976

    > plot(Lc(salarios),col="darkred",lwd=2)

    AB

    C D