Solución Compendios

12
SOLUCION COMPENDIOS Ejercicio 1 Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del método automático. Los datos obtenidos son los siguientes: Manual = X 25 40 120 75 150 300 270 400 450 575 Automático = Y 30 80 150 80 200 350 240 320 470 583 Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R SOLUCION Manual = X Automático = Y 25 30 625 750 40 80 1600 3200 120 150 14400 18000 75 80 5625 6000 150 200 22500 30000 300 350 90000 105000 270 240 72900 64800 400 320 160000 128000 450 470 202500 211500

description

Solución Compendios

Transcript of Solución Compendios

  • SOLUCION COMPENDIOS

    Ejercicio 1

    Para estudiar el efecto de las aguas residuales de las alcantarillas que

    afluyen a un lago, se toman medidas de la concentracin de nitrato en el

    agua. Para monitorizar la variable se ha utilizado un antiguo mtodo manual.

    Se idea un nuevo mtodo automtico. Si se pone de manifiesto una alta

    correlacin positiva entre las medidas tomadas empleando los dos mtodos,

    entonces se har uso habitual del mtodo automtico. Los datos obtenidos

    son los siguientes:

    Manual = X 25 40 120 75 150 300 270 400 450 575

    Automtico = Y 30 80 150 80 200 350 240 320 470 583

    Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es

    apropiado, hallar la recta de regresin de Y sobre X y utilizarla para

    predecir la lectura que se obtendra empleando la tcnica automtica con

    una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en

    R

    SOLUCION

    Manual = X Automtico =

    Y

    25 30 625 750

    40 80 1600 3200

    120 150 14400 18000

    75 80 5625 6000

    150 200 22500 30000

    300 350 90000 105000

    270 240 72900 64800

    400 320 160000 128000

    450 470 202500 211500

  • 575 583 330625 335225

    2405 2503 900775 902475

    > datos=read.table("agua.txt", header=T)

    > attach(datos)

    > datos

    x y

    1 25 30

    2 40 80

    3 120 150

    4 75 80

    5 150 200

    6 300 350

    7 270 240

    8 400 320

    9 450 470

    10 575 583

    > regresion regresin

    Call:

    lm(formula = y ~ x, data = datos)

    Coefficients:

    (Intercept) x

    26.1150 0.9322

    > summary(regresion) Call:

    lm(formula = y ~ x, data = datos)

    Residuals:

    Min 1Q Median 3Q Max

    -78.98 -18.57 14.31 23.53 44.24

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 26.11496 21.20188 1.232 0.253

    x 0.93216 0.07064 13.195 1.04e-06 ***

    ---

    Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Residual standard error: 40.11 on 8 degrees of freedom

    Multiple R-squared: 0.9561, Adjusted R-squared: 0.9506

    F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06

    Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que

    entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del

    modelo lineal para el problema

    bnXmY

    Y=0.9(100)+26.11=116.11

  • Ejercicio 2

    Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados

    de diversos tamaos.

    a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?.

    Represente esta variable mediante la letra N

    b. Cunto mide el lado de cada cuadrado?. Represente esta variable

    mediante la letra L

    c. Coleccione su informacin en una tabla de datos.

    d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.

    Represente las parejas (L,N) en un plano cartesiano

    e. Qu clase de curva obtiene?

    SOLUCIN

  • N L NL

    1 1 1 1

    4 2 16 8

    9 3 81 27

    25 5 625 125

    36 6 1296 216

    75 17 2019 377

    >

    cuadrititos=read.table("cuadras.txt",header=T

    )

    > attach(cuadrititos)

    > cuadrititos

    N L

    1 1 1

    2 4 2

    3 9 3

    4 25 5

    5 36 6 > regresion summary(regresion) Call:

    lm(formula = L ~ N, data = cuadrititos)

    Residuals:

    1 2 3 4 5

    -0.4895 0.1011 0.4188 0.2353 -0.2658

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 1.35302 0.28808 4.697 0.01826 *

    N 0.13647 0.01434 9.519 0.00246 **

    ---

    Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Residual standard error: 0.4287 on 3 degrees of freedom

    Multiple R-squared: 0.968, Adjusted R-squared: 0.9573

    F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459 > plot(cuadrititos)

    > abline(lm(L~N))

    Ejercicio 3

  • A partir de las siguientes observaciones para 5 aos de las variables X e Y,

    ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:

    Y: produccin nacional de un subsector industrial, en millones de toneladas.

    X: tiempo

    Ejercicio 4

    Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34

    kilogramos respectivamente, entonces una nia de 12 aos pesara

    aproximadamente:

    A. 45

    B. 55

    C. 15

    D. 51

    E. 61

    Ejercicio 5

    En el anlisis de Regresin lineal se puede afirmar todo lo siguiente

    excepto:

    A. Ajusta los datos a una lnea recta

    Ao X Y

    1995

    1996

    1997

    1998

    1999

    1

    2

    3

    4

    5

    1,25

    5

    11,25

    20

    30,5

  • B. Predice valores de una variable si se conoce el valor de la otra

    C. Establece una relacin cuantitativa entre dos variables relacionadas

    D. El mtodo grfico para determinar la relacin entre dos variables es ms

    concreto que el mtodo matemtico o de mnimos cuadrados

    E. Una relacin lineal entre dos variables queda representada por una lnea

    recta llamada ecuacin de regresin

    Ejercicio 6

    Dado Los siguientes datos expuestos en la tabla

    La frmula de regresin para los datos propuestos est dada por:

    A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2

    D. y = 14,4x + 47 E. y = 14x + 48,8

    Ejercicio 7

    El Grafico para los puntos dispersos est dado por:

    Rta:

    Edad 1 2 3 4 5

    Estatura 60 80 100 110 112

    0

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 50

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 5

    0

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 50

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 5

    A B

    C D

  • Ejercicio 8

    El diagrama de dispersin para la regresin lineal esta dado por

    Rta:

    Ejercicio 9

    Los siguientes datos corresponden a 100 salarios tomados en una encuesta

    aplicada a 380 habitantes de Villavicencio. Determinar en R el grado de

    asimetra de los datos. establecer una conclusin.

    289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

    289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

    289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

    0

    50

    100

    0 1 2 3 4 50

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 5

    A B

    0

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 5

    0

    20

    40

    60

    80

    100

    120

    0 1 2 3 4 5

    C D

  • 289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

    310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

    310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

    310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

    320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

    320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

    320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

    >

    salarios=c(289000,350000,886900,310000,650000,96

    1200,320000,756000,1200000,345000,289000,35000

    0,889000,320000,665500,965000,320000,756000,13

    00000,320000,289000,350000,890000,320000,6895

    00,996000,320000,759600,1700100,750000,289000,

    566700,896500,320000,689500,999000,340000,759

    600,1700100,1120000,310000,566700,900000,320000

    ,690000,1000000,340000,789000,1700100,345000,31

    0000,566700,936200,320000,690000,1025000,3400

    00,789000,1700100,863000,310000,600000,942500,3

    20000,699000,1025000,340000,800000,1700100,886

    000,320000,700000,1096000,320000,699000,106300

    0,340000,800000,1700100,345000,320000,700000,11

    16300,345000,859600,1777000,340000,800000,1700

    100,850000,320000,750000,1120000,345000,862300,

    1800000,345000,800000,1700100,1750000)

    > par(mfrow=c(1,2))

    > f=table(salarios)

    > dd barplot(f)

    > plot(dd,add=T)

    > summary(salarios) Min. 1st Qu. Median Mean 3rd Qu. Max.

    289000 340000 700000 750900 947200 1800000

    Esta es una asimetra positiva ya que

    Ejercicio 10

    En una distribucin asimtrica negativa:

    A. La moda se encuentra entre la media y la mediana

    B. La moda est ubicada a la derecha de la media

  • C. La media es menor que la desviacin tpica

    D. La media es menor que la mediana

    E. La moda y la mediana son iguales

    Ejercicio 11

    Los momentos de segundo orden con respecto a la media de dos

    distribuciones son 9 y 16, mientras que los momentos de tercer orden son

    8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:

    A. La primera porque tiene mayor grado de deformacin

    B. La primera porque tiene menor grado de deformacin

    C. La segunda porque tiene mayor grado de deformacin

    D. La segunda porque tiene menor grado de deformacin

    Ejercicio 12

    Uno de los siguientes enunciados es verdadero

    A. La media en una muestra de datos agrupados la divide en dos partes.

    B. Una distribucin de datos permite calcular todas las medidas de

    tendencia central

    C. La moda es un dato que permite analizar un resultado esperado

    D. Una medida de dispersin est libre del clculo de la media.

    Ejercicio 13

    En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto

    A. Ajusta todos los datos a una lnea recta

    B. Predice el valor de una variable si se conoce el valor de la otra

    C. Establece una relacin cuantitativa entre dos variables

    D. El mtodo grafico es ms concreto que el mtodo matemtico

  • E. Una relacin lineal de datos queda representada por una recta.

    Ejercicio 14

    Dado que el grado de asimetra de una distribucin es de 2,27, la media es

    de 189,87 y la mediana 189,16, entonces la varianza toma un valor

    correspondiente a:

    A. 0.93

    B. 0.88

    C. 0.78

    D. 1.88

    E. 1.78

    Ejercicio 15

    Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo

    que su media es igual a 3 y que la diferencia entre la media y la mediana es

    igual a -2

    A. 2.9

    B. 0.9

    C. 19

    D. 9

    E. 1/9

    Ejercicio 16

    En la siguiente distribucin de datos el coeficiente de asimetra segn el

    coeficiente de Pearson es:

    Xi 1 2 3 4 5 6

    f 2 8 3 5 7 5

    A.

    B. 2

    C. 1/3

    D. 3

  • E. 1

    Ejercicio 17

    Retome los 100 datos y elabore una tabla en R para determinar el

    coeficiente de Gini. Utilice la librera ineq, y compare los resultados.

    Establezca conclusiones

    289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

    289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

    289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

    289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

    310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

    310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

    310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

    320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

    320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

    320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

    > library(ineq)

    >salarios=c(289000,350000,886900,310000,65

    0000,961200,320000,756000,1200000,34500

    0,289000,350000,889000,320000,665500,96

    5000,320000,756000,1300000,320000,28900

    0,350000,890000,320000,689500,996000,32

    0000,759600,1700100,750000,289000,56670

    0,896500,320000,689500,999000,340000,75

    9600,1700100,1120000,310000,566700,90000

    0,320000,690000,1000000,340000,789000,17

    00100,345000,310000,566700,936200,32000

    0,690000,1025000,340000,789000,1700100,8

    63000,310000,600000,942500,320000,69900

    0,1025000,340000,800000,1700100,886000,3

    20000,700000,1096000,320000,699000,1063

    000,340000,800000,1700100,345000,320000,

    700000,1116300,345000,859600,1777000,340

    000,800000,1700100,850000,320000,750000,

    1120000,345000,862300,1800000,345000,800

    000,1700100,1750000)

    > g=ineq(salarios,type="Gini")

    > g

    [1] 0.3122976

  • > plot(Lc(salarios),col="darkred",lwd=2)