ESTADISTICA II Lic. MARTINEZ SANCHEZ, EDGAR
EJERCICIOS DE CORRELACION Y REGRESION
TRABAJO DOMICILIARIO
1.- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a
partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los
siguientes datos:
X 189 190 208 227 239 252 257 274 293 308 316
Y 402 404 412 425 429 436 440 447 458 469 469
X representa la renta nacional en millones de euros e Y representa las ventas de la
compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).
Calcular:
1. La recta de regresión de Y sobre X.
2. El coeficiente de correlación lineal e interpretarlo.
3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la
predicción para las ventas de la compañía en este año?
2.- La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente
entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para
explotaciones agrícolas, se muestra en el siguiente cuadro:
Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11
Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6
Calcular:
1. La recta de regresión del rendimiento respecto de la inversión.
2. La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.
3. El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el
examen correspondiente, de ocho personas es:
Horas (X) 20 16 34 23 27 32 18 22
Calificación (Y) 6.5 6 8.5 7 9 9.5 7.5 8
Se pide:
1. Recta de regresión de Y sobre X.
2. Calificación estimada para una persona que hubiese estudiado 28 horas.
4. En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala
de cero a 10) de 10 niños.
Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1
1. Obtener la recta de regresión de la conducta agresiva en función de la edad.
2. A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería
a un niño de 7.2 años.
5. Los valores de dos variables X e Y se distribuyen según la tabla siguiente:
Y/X 100 50 25
14 1 1 0
18 2 3 0
22 0 1 2
Se pide:
1. Calcular la covarianza.
2. Obtener e interpretar el coeficiente de correlación lineal.
3. Ecuación de la recta de regresión de Y sobre X.
6. Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la
habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
Y/X 20 30 40 50
(25-35) 6 4 0 0
(35-45) 3 6 1 0
(45-55) 0 2 5 3
(55-65) 0 1 2 7
Se pide:
1. ¿Existe correlación entre ambas variables?
2. Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70
puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?
7. Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado
que se recogen en una ciudad no existe relación.
1. ¿Cuál es el valor de la covarianza de estas variables?
2. ¿Cuánto vale el coeficiente de correlación lineal?
3. ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el
plano?
8. En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos
son los siguientes:
Años (X) 3 4 5 6
Infracciones (Y) 4 3 2 1
Calcular el coeficiente de correlación lineal e interpretarlo.
9. Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el
número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:
Quiniela (X) 6 8 6 8
Primitiva (Y) 1 2 2 1
Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las
previsiones hechas con las rectas de regresión?
ESTADISTICA II Lic. MARTÍNEZ SÁNCHEZ, EDGAR
EJERCICIOS DE CORRELACION Y REGRESION
TRABAJO EN AULA
1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilos.
1. Hallar la ecuación de la recta de regresión de la edad sobre el peso.
2. ¿Cuál sería el peso aproximado de un niño de seis años?
2. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40
1. Calcular el coeficiente de correlación lineal .
2. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
3. Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe
situarse?
3. Las notas obtenidas por cinco alumnos en Matemáticas y Química son:
Matemáticas 6 4 8 5 3. 5
Química 6. 5 4. 5 7 5 4
Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno
que tiene 7.5 en Matemáticas.
4. Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = −0.9,
siendo las medias de las distribuciones marginales = 1, = 2. Se sabe que una de las cuatro
ecuaciones siguientes corresponde a larecta de regresión de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Seleccionar razonadamente esta recta.
5. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
Calcular:
1. La recta de regresión de Y sobre X.
2. El coeficiente de correlación.
3. El peso estimado de un jugador que mide 208 cm.
6. A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades
producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación
lineal e interpretarlo.
Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62
Producción
(Y)
300 302 315 330 300 250 300 340 315 330 310 240
7. Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que
dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido
elaborar la siente tabla:
Nº de horas dormidas (X) 6 7 8 9 10
Nº de horas de televisión (Y) 4 3 3 2 1
Frecuencias absolutas (f i) 3 16 20 10 1
Se pide:
1. Calcular el coeficiente de correlación.
2. Determinar la ecuación de la recta de regresión de Y sobre X.
3. Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la
televisión?
8. La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba
y ventas del primer mes de prueba (Y) en cientos de euros.
X 25 42 33 54 29 36
Y 42 72 50 90 45 48
1. Hallar el coeficiente de correlación e interpretar el resultado obtenido.
2. Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor
que obtenga 47 en el test.
SOLUCIONARIO 1
Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilos.
1 Hallar la ecuación de la recta de regresión de la edad sobre el peso.
2 ¿Cuál sería el peso aproximado de un niño de seis años?
yi xi ·yi xi2 yi
2
2 14 4 196 28
3 20 9 400 60
5 32 25 1 024 160
7 42 49 1 764 294
8 44 64 1 936 352
25 152 151 5 320 894
2.- Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40
1 Calcular el coeficiente de correlación lineal.
2 Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
3 Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe
situarse?
xi yi xi ·yi xi2 yi
2
8 15 120 64 225
7 19 133 49 361
6 25 150 36 625
4 23 92 16 529
2 34 68 4 1 156
1 40 40 1 1 600
28 156 603 170 4 496
Correlación negativa muy fuerte .
3.-Las notas obtenidas por cinco alumnos en Matemáticas y Química son:
Matemáticas 6 4 8 5 3. 5
Química 6. 5 4. 5 7 5 4
Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno
que tiene 7.5 en Matemáticas.
xi yi xi ·yi xi2 yi
2
6 6. 5 36 42. 25 39
4 4. 5 16 20. 25 18
8 7 64 49 56
5 5 25 25 25
3. 5 4 12. 25 16 14
26. 5 27 153. 25 152. 5 152
4.-Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = -0.9,
siendo las medias de las distribuciones marginales = 1, = 2. Se sabe que una de las
cuatro ecuaciones siguientes corresponde a la recta de regresión de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Seleccionar razonadamente esta recta.
Como el coeficiente de correlación lineal es negativo , la pendiente de la recta también
será negativa, por tanto descartamos la 2ª y 4ª.
Un punto de la recta ha de ser ( , ), es decir, (1, 2).
2 ≠ - 1 + 2
2 . 1 + 2 = 4
La recta pedida es: 2x + y = 4.
5.- Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
Calcular:
1 La recta de regresión de Y sobre X.
2 El coeficiente de correlación.
3 El peso estimado de un jugador que mide 208 cm.
x i y i x i2 y i
2 x i ·y i
186 85 34 596 7 225 15 810
189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971
Correlación positiva muy fuerte.
6.- A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades
producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación
lineal e interpretarlo.
Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62
Producción
(Y)
300 302 315 330 300 250 300 340 315 330 310 240
xi yi xi ·yi xi2 yi
2
80 300 6 400 90 000 24 000
79 302 6 241 91 204 23 858
83 315 6 889 99 225 26 145
84 330 7 056 108 900 27 720
78 300 6 084 90 000 23 400
60 250 3 600 62 500 15 000
82 300 6 724 90 000 24 600
85 340 7 225 115 600 28 900
79 315 6 241 99 225 24 885
84 330 7 056 108 900 27 720
80 310 6 400 96 100 24 800
62 240 3 844 57 600 14 880
936 3 632 73 760 1 109 254 285 908
Correlación positiva muy fuerte
7.- Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que
dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido
elaborar la siente tabla:
Nº de horas dormidas (X) 6 7 8 9 10
Nº de horas de televisión (Y) 4 3 3 2 1
Frecuencias absolutas (f i) 3 16 20 10 1
Se pide:
1 Calcular el coeficiente de correlación.
2 Determinar la ecuación de la recta de regresión de Y sobre X.
3 Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la
televisión?
x i y i f i x i · f i x i2 · f i y i · f i y i
2 · f i x i · y i · f i
6 4 3 18 108 12 48 72
7 3 16 112 784 48 144 336
8 3 20 160 1280 60 180 480
9 2 10 90 810 20 40 180
10 1 1 10 100 1 1 10
50 390 3082 141 413 1078
Es una correlación negativa y fuerte .
8.- La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba
y ventas del primer mes de prueba (Y) en cientos de euros.
X 25 42 33 54 29 36
Y 42 72 50 90 45 48
1 Hallar el coeficiente de correlación e interpretar el resultado obtenido.
2 Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor
que obtenga 47 en el test.
xi yi xi ·yi xi2 yi
2
25 42 625 1 764 1 050
42 72 1 764 5 184 3 024
33 50 1 089 2 500 1 650
54 90 2 916 8 100 4 860
29 45 841 2 025 1 305
36 48 1 296 2 304 1 728
209 347 8 531 21 877 13 617
SOLUCIONARIO 2
1.- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a
partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los
siguientes datos:
X 189 190 208 227 239 252 257 274 293 308 316
Y 402 404 412 425 429 436 440 447 458 469 469
X representa la renta nacional en millones de euros e Y representa las ventas de la
compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).
Calcular:
1 La recta de regresión de Y sobre X.
2 El coeficiente de correlación lineal e interpretarlo.
3 Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la
predicción para las ventas de la compañía en este año?
xi yi xi ·yi xi2 yi
2
189 402 35 721 161 604 75 978
190 404 36 100 163 216 76 760
208 412 43 264 169 744 85 696
227 425 51 529 180 625 96 475
239 429 57 121 184 041 102 531
252 436 63 504 190 096 109 872
257 440 66 049 193 600 113 080
274 447 75 076 199 809 122 478
293 458 85 849 209 764 134 194
308 469 94 864 219 961 144 452
316 469 99 856 219 961 148 204
2 753 4 791 708 933 2 092 421 1 209 720
2. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente
entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para
explotaciones agrícolas, se muestra en el siguiente cuadro:
Inversión (X) 11 14 16 15 16 18 20 21 14 20 19 11
Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6
Calcular:
1 La recta de regresión del rendimiento respecto de la inversión.
2 La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.
xi yi xi ·yi xi2 yi
2
11 2 121 4 22
14 3 196 9 42
16 5 256 25 80
15 6 225 36 90
16 5 256 25 80
18 3 324 9 54
20 7 400 49 140
21 10 441 100 210
14 6 196 36 84
20 10 400 100 200
19 5 361 25 95
11 6 121 36 66
195 68 3 297 454 1 163
3.- El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el
examen correspondiente, de ocho personas es:
Horas (X) 20 16 34 23 27 32 18 22
Calificación (Y) 6.5 6 8.5 7 9 9.5 7.5 8
Se pide:
1 Recta de regresión de Y sobre X.
2 Calificación estimada para una persona que hubiese estudiado 28 horas.
xi yi xi ·yi xi2 yi
2
16 6 256 36 96
18 7.5 324 56.25 135
20 6.5 400 42.25 130
22 8 484 64 176
23 7 529 49 161
27 9 729 81 243
32 9.5 1 024 90.25 304
34 8.5 1156 72.25 289
192 62 4 902 491 1 534
4. En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala
de cero a 10) de 10 niños.
Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1
1 Obtener la recta de regresión de la conducta agresiva en función de la edad.
2 A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería
a un niño de 7.2 años.
xi yi xi ·yi xi2 yi
2
6 9 36 81 54
6.4 6 40.96 36 38.4
6.7 7 44.89 49 46.9
7 8 49 64 56
7.4 7 54.76 49 51.8
7.9 4 62.41 16 31.6
8 2 64 4 16
8.2 3 67.24 9 24.6
8.5 2 72.25 4 17
8.9 1 79.21 1 8.9
75 49 570.72 313 345.2
5.- Los valores de dos variables X e Y se distribuyen según la tabla siguiente:
Y/X 100 50 25
14 1 1 0
18 2 3 0
22 0 1 2
Se pide:
1 Calcular la covarianza.
2 Obtener e interpretar el coeficiente de correlación lineal .
3 Ecuación de la recta de regresión de Y sobre X.
Convertimos la tabla de doble entrada en una tabla simple.
xi yi fi xi · fi xi2 · fi yi · fi yi
2 · fi xi · yi · fi
100 14 1 100 10 000 14 196 1 400
100 18 2 200 20 000 36 648 3 600
50 14 1 50 2 500 14 196 700
50 18 3 150 7 500 54 972 2 700
50 22 1 50 2 500 22 484 1 100
25 22 2 50 1 250 44 968 1 100
10 600 43 750 184 3 464 10 600
Es una correlación negativa débil .
6.- Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la
habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
Y/X 20 30 40 50
(25-35) 6 4 0 0
(35-45) 3 6 1 0
(45-55) 0 2 5 3
(55-65) 0 1 2 7
Se pide:
1 ¿Existe correlación entre ambas variables?
2 Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70
puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?
Convertimos la tabla de doble entrada en tabla simple.
xi yi fi xi · fi xi2 · fi yi · fi yi
2 · fi xi · yi · fi
20 30 6 120 2 400 180 5 400 3 600
20 40 3 60 1 200 120 4 800 2 400
30 30 4 120 3 600 120 3 600 3 600
30 40 6 180 5 400 240 9 600 7 200
30 50 2 60 1 800 100 5 000 3 000
30 60 1 30 900 60 3 600 1 800
40 40 1 40 1 600 40 1 600 1 600
40 50 5 200 8 000 250 12 500 10 000
40 60 2 80 3 200 120 7 200 4 800
50 50 3 150 7 500 150 7 500 7 500
50 60 7 350 17 500 420 25 200 21 000
40 1 390 53 100 1 080 86 000 66 500
7.-Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado
que se recogen en una ciudad no existe relación.
1 ¿Cuál es el valor de la covarianza de estas variables?
= 0
2 ¿Cuánto vale el coeficiente de correlación lineal?
r = 0
3 ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el
plano?
= k1 , = k2 k1, k2 .
Las rectas son paralelas a los ejes y perpendiculares entre sí.
8.- En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos
son los siguientes:
Años (X) 3 4 5 6
Infracciones (Y) 4 3 2 1
Calcular el coeficiente de correlación lineal e interpretarlo.
xi yi xi ·yi xi2 yi
2
3 4 12 9 16
4 3 12 16 9
5 2 10 25 4
6 1 6 36 1
18 10 40 86 30
La correlación es perfecta e inversa .
9.-Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el
número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:
Quiniela (X) 6 8 6 8
Primitiva (Y) 1 2 2 1
Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza
las previsiones hechas con las rectas de regresión?
xi yi xi ·yi xi2 yi
2
6 1 6 36 1
8 2 16 64 4
6 2 12 36 4
8 1 8 64 1
28 6 42 200 10
Top Related