Ejercicios compendio 7 y 8 (1)

41
EJERICIOS COMPENDIO 7 Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del método automático. Los datos obtenidos son los siguientes: Manual = X 2 5 4 0 12 0 7 5 15 0 30 0 27 0 40 0 45 0 57 5 Automático = Y 3 0 8 0 15 0 8 0 20 0 35 0 24 0 32 0 47 0 58 3 Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R

Transcript of Ejercicios compendio 7 y 8 (1)

EJERICIOS COMPENDIO 7

Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a

un lago, se toman medidas de la concentración de nitrato en el agua. Para

monitorizar la variable se ha utilizado un antiguo método manual. Se idea un

nuevo método automático. Si se pone de manifiesto una alta correlación positiva

entre las medidas tomadas empleando los dos métodos, entonces se hará uso

habitual del método automático. Los datos obtenidos son los siguientes:

Manual = X 25 40 120 75 150 300 270 400 450 575

Automático = Y 30 80 150 80 200 350 240 320 470 583

Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado,

hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se

obtendría empleando la técnica automática con una muestra de agua cuya lectura

manual es de 100. Realizar el ejercicio en R

Y=0.93+26.11p-valor= 1.04*10^-6p-valor= 0,00000104

Y=0,0002(100)^2+0,8339(100)+33,97Y= 119,36

Rta: con una muestra de agua cuya lectura manual es de 100 y empleando la

técnica automática se obtendrá una lectura de 119,36

Ejercicio 2

Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de

diversos tamaños.

a. ¿Cuántos cuadritos encierra cada uno de los cuadrados dibujados?.

Represente esta variable mediante la letra N

b. ¿Cuánto mide el lado de cada cuadrado?. Represente esta variable mediante

la letra L

c. Coleccione su información en una tabla de datos.

d. ¿Existe alguna relación entre una y otra variable?. Detalle su respuesta.

Represente las parejas (L,N) en un plano cartesiano

Cuadros L N

1 2 4

2 3 9

3 4 16

4 5 25

5 6 36

Rta d: la relación que existe es que la L es la raíz cuadrada de la variable N

e. ¿Qué clase de curva obtiene?

Rta: la curva que se obtiene es una curva potencial.

Ejercicio 3

A partir de las siguientes observaciones para 5 años de las variables X e Y,

ajústese el modelo de regresión de Y en función de X más idóneo. Donde:

Y: producción nacional de un subsector industrial, en millones de toneladas.

X: tiempo

Año X Y

1995

1996

1997

1998

1999

1

2

3

4

5

1,25

5

11,25

20

30,5

Y=7,35x-8,45

Ejercicio 4

Cinco niñas de 2,4, 6,7 y 8 años pesan respectivamente 15, 19, 25, 38, y 34

kilogramos respectivamente, entonces una niña de 12 años pesara

aproximadamente:

A. 45

B. 55

C. 15

D. 51

E. 61

Y=0,219(12)^2+1,557(12)+10,387Rta: Y=61

Ejercicio 5

En el análisis de Regresión lineal se puede afirmar todo lo siguiente excepto:

A. Ajusta los datos a una línea recta

B. Predice valores de una variable si se conoce el valor de la otra

C. Establece una relación cuantitativa entre dos variables relacionadas

D. El método gráfico para determinar la relación entre dos variables es más

concreto que el método matemático o de mínimos cuadrados

E. Una relación lineal entre dos variables queda representada por una línea recta

llamada ecuación de regresión

Ejercicio 6

Dado Los siguientes datos expuestos en la tabla

Edad 1 2 3 4 5

Estatura 60 80 100 110 112

La fórmula de regresión para los datos propuestos está dada por:

A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2

D. y = 14,4x + 47 E. y = 14x + 48,8

Y= 13,4x+52,2

Ejercicio 7

El Grafico para los puntos dispersos está dado por:

Ejercicio 8

El diagrama de dispersión para la regresión lineal está dado por

A B

C D

A B

CD

EJERCICIOS COMPENDIO 8

Ejercicio 1

Los siguientes datos corresponden a 100 salarios tomados en una encuesta aplicada a 380

habitantes de Villavicencio. Determinar en R el grado de asimetría de los datos. Establecer

una conclusión.

289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

Conclusión: la media es mayor que la mediana y la media es mayor que la moda,

por tanto es una asimetría negativa

Ejercicio 2

En una distribución asimétrica negativa:

A. La moda se encuentra entre la media y la mediana

B. La moda está ubicada a la derecha de la media

C. La media es menor que la desviación típica

D. La media es menor que la mediana

E. La moda y la mediana son iguales

RTA: Porque se dice que una distribución es simétrica a la izquierda o tiene sesgo

negativo cuando el valor de la media aritmética es menor que la mediana y éste

valor de la mediana a su vez es menor que la moda.

Ejercicio 3

Los momentos de segundo orden con respecto a la media de dos distribuciones

son 9 y 16, mientras que los momentos de tercer orden son 8.1 y 12. 8

respectivamente. La distribución más asimétrica es:

A. La primera porque tiene mayor grado de deformación

B. La primera porque tiene menor grado de deformación

C. La segunda porque tiene mayor grado de deformación

D. La segunda porque tiene menor grado de deformación

Ejercicio 4

Uno de los siguientes enunciados es verdadero

A. La media en una muestra de datos agrupados la divide en dos partes.

B. Una distribución de datos permite calcular todas las medidas de

tendencia central

C. La moda es un dato que permite analizar un resultado esperado

D. Una medida de dispersión está libre del cálculo de la media.

RTA: Porque las medidas de tendencia central son la moda, la mediana y la media

y para calcularlas necesito una distribución de datos.

Ejercicio 5

En el análisis de regresión lineal se puede afirmar todo lo siguiente, excepto

A. Ajusta todos los datos a una línea recta

B. Predice el valor de una variable si se conoce el valor de la otra

C. Establece una relación cuantitativa entre dos variables

D. El método grafico es más concreto que el método matemático

E. Una relación lineal de datos queda representada por una recta.

RTA: Porque no se puede comparar las dos gráficas, ya que las dos sirven

para obtener resultados concretos y ninguna superior a la otra.

Ejercicio 6

Dado que el grado de asimetría de una distribución es de 2,27, la media es de

189,87 y la mediana 189,16, entonces la varianza toma un valor correspondiente

a:

A. 0.93

B. 0.88

C. 0.78

D. 1.88

E. 1.78

Ejercicio 7

Tomando una distribución ligeramente asimétrica, calcular la moda sabiendo que

su media es igual a 3 y que la diferencia entre la media y la mediana es igual a -2

A. 2.9

B. 0.9

C. 19

D. 9

E. 1/9

Ejercicio 8.

En la siguiente distribución de datos el coeficiente de asimetría según el coeficiente de Pearson es:

Xi 1 2 3 4 5 6

f 2 8 3 5 7 5

A. ½

B. 2

C. 1/3

D. 3

E. 1

Ejercicio 9

El valor del cuarto momento con relación a la desviación respecto a la media

aritmética es de 14.7.¿Cuál es el valor de la varianza para que la distribución sea

mesocúrtica?

A. 2.19

B. 3.19

C. 19.2

D. 51

E. 21.9

Ejercicio 10

Tomando una distribución ligeramente asimétrica ¿Cuál es el valor de la mediana

sabiendo que la diferencia entre la media y la moda es de -12 y una media

aritmética de 7?

A. 13

B. 31

C. 11

D. 21

E. 12

Ejercicios que desarrollan competencias

Retome los 100 datos y elabore una tabla en R para determinar el coeficiente de

Gini. Utilice la librería ineq, y compare los resultados. Establezca conclusiones

289000 350000 886900 310000 650000 961200 320000 756000 1200000 345000

289000 350000 889000 320000 665500 965000 320000 756000 1300000 320000

289000 350000 890000 320000 689500 996000 320000 759600 1700100 750000

289000 566700 896500 320000 689500 999000 340000 759600 1700100 1120000

310000 566700 900000 320000 690000 1000000 340000 789000 1700100 345000

310000 566700 936200 320000 690000 1025000 340000 789000 1700100 863000

310000 600000 942500 320000 699000 1025000 340000 800000 1700100 886000

320000 700000 1096000 320000 699000 1063000 340000 800000 1700100 345000

320000 700000 1116300 345000 859600 1777000 340000 800000 1700100 850000

320000 750000 1120000 345000 862300 1800000 345000 800000 1700100 1750000

EJERCICIO DE CLASE

x y3,6 11,285,2 14,745,3 18,467,3 20,015 12,43

5,2 15,373 9,59

3,1 11,263,2 8,057,5 27,918,3 24,626,1 18,84,9 13,875,8 12,117,1 23,68

80,60 242,18

EJERCICIO DE TAREA

Nube de puntos

Edad Peso

X Y X^2 XY

1 10 1 10

2 15 4 30

3 18 9 54

4 22 16 88

5 24 25 120

6 30 36 180

7 34 49 238

8 38 64 304

9 40 81 360

45 231 285 1384

Sistema de Ecuaciones

231 = 45 m + 9 b

1384 = 285 m + 45 b

Determinante del sistema

∆ = 45 9 Det ∆= (45*45) – (9*285) = -540285 45

Determinante de la variable m

∆m= 231 9 Det ∆m= (231*45) – (9*1384)= - 20611384 45

Determinante de la variable b

∆b= 45 231 Det ∆b= (45*1384) – (231*285)= - 3555285 1384

Determinantes del sistema

Soluciones de las definiciones de los determinantes

Recta de Regresión Y = 3.81 X + 6.58

EJERCICIO DE APUNTAMIENTO

Media Varianza m3 m4x f (x.f) (x-Media) (x-Media)^2.f (x-Media)^3.f (x-Media)^4*f1 23 23 -1,08 26,827 -28,973 31,291252 12 24 -0,08 0,077 -0,006 0,000493 5 15 0,92 4,232 3,893 3,581964 8 32 1,92 29,491 56,623 108,716365 2 10 2,92 17,053 49,794 145,39899

50 104 77,680 81,331 288,9891

Media=104/50Varianza

Desviación Estándar m3=81,331/50 m4=288,9891/50

2,08 S^2=77,680/50 S=√1,55 1,627 5,7798

1,55 1,246

ASIMETRÍA

g2=m3/S3 g3=(m4/S4)-31,627/(1,246)^3 5,780/(1,246)^4-30,8411 -0,60540Asimetría +

Coeficiente de Variación

Cv=S/Media*100%0,60

EJERCICIO DE CURTOSIS

boxplot(datos, main="Conocimiento", xlab="Apuntamiento", ylab="Nivel de conocimiento")

boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Nivel de conocimiento", xlab="Conocimiento")

BARPLOT

La media es mayor que la mediana y la media es mayor que la moda, por tanto es una asimetría positiva.