Caso de regresión lineal simple: Relación entre población y número de nacimientos.

22
Caso de regresión lineal simple: Relación entre población y número de nacimientos. Jorge Galbiati

description

Caso de regresión lineal simple: Relación entre población y número de nacimientos. Jorge Galbiati. El objetivo del estudio es explorar el valor predictivo de la población de cada uno de los tramos etarios sobre el número de nacimientos , de las comunas. - PowerPoint PPT Presentation

Transcript of Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Page 1: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Caso de regresión lineal simple:

Relación entre población y número de

nacimientos.

Jorge Galbiati

Page 2: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

El objetivo del estudio es explorar el valor predictivo de la población

de cada uno de los tramos etarios sobre el número de nacimientos, de

las comunas.

En particular, determinar cuál tramo etario (su población) tiene mayor

poder predictivo sobre el número de nacimientos.

Page 3: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Se tiene una muestra de 40 comunas comunas elegidas al azar, en que

se midieron las siguientes variables :

Población por tramo etario (del censo de 2002):

1 menos de 1 año

2 entre 1 y 4 años

3 entre 5 y 9 años

4 entre 19 y 19 años

5 entre 20 y 44 años

6 entre 45 y 64 años

7 entre 65 y 79 años

8 80 años o más

9 Nacimientos en el año (correspondientes a 2006)

Page 4: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

  Comunamenos

1e 1 - 4 e 5-9

e 10-19

e 20-44

e 45-64

e 65-79

mas 80

Nacimientos

1 Huasco 116 486 677 1,501 2735 1802 624 124 101

2 Las Cabras 305 1,299 1,794 3,872 7995 4661 1639 378 1066

3 El Monte 508 2,079 2,634 5,634 11082 5467 1700 464 392

4 Alto Biobío 140 544 617 1,108 4146 2038 387 74 176

5 San Nicolás 132 538 761 1,736 3684 2216 779 165 118

6 San Fernando 960 4,090 5,756 12,911 25627 14007 4446 1098 965

7 Aisén 427 1,682 2,121 4,790 9951 4535 1234 271 409

8 Llanquihue 280 1,155 1,581 3,327 6619 3446 1078 234 218

9 Victoria 471 1,760 2,547 6,500 11768 6995 2751 707 462

10 Arauco 613 2,678 3,573 7,521 15147 7119 2140 517 528

11 El Bosque 2,655 10,647 13,257 31,249 66602 35983 11795 2547 2573

12 San Vicente 568 1,392 3,462 7,955 15458 9518 3202 785 561

13 Yerbas Buenas 244 978 1,362 3,189 6265 3512 1050 240 216

14 Pemuco 101 507 794 1,692 3295 1844 691 153 90

15 Chiguayante 1,537 6,152 8,612 20,445 39650 20500 5239 1552 1145

16 Porvenir 67 271 366 994 2275 1157 382 77 80

17 Combarbalá 161 661 934 2,010 4225 2962 1521 395 168

18 Conchalí 1,686 6,676 8,286 18,977 44767 25540 11377 2842 1958

19 Tucapel 190 745 1,058 2,391 4609 2787 1205 305 175

20 Camarones 18 74 100 255 546 346 106 26 4

Page 5: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

  Comunamenos

1e 1 - 4 e 5-9

e 10-19

e 20-44

e 45-64

e 65-79

mas 80

Nacimientos

21Quinta de Tilcoco 160 635 894 2,179 4279 2556 813 203 162

22 Ovalle 1,661 6,712 9,140 20,281 38840 20843 7750 1833 1653

23 Pica 75 304 354 746 7218 2487 338 100 59

24 Ninhue 60 310 455 939 1738 1272 550 134 49

25 Taltal 177 735 950 1,939 4075 2336 655 143 199

26 Molina 538 2,297 3,224 7,218 15539 8832 2803 666 521

27 Arica 2,842 11,630 15,545 33,775 67981 38405 12487 2767 3079

28 Navidad 54 263 369 752 1658 1396 709 184 45

29 Graneros 429 1,757 2,406 5,480 10809 5659 1634 217 86

30 Coronel 1,471 6,248 8,681 20,287 39860 20784 5792 1130 1509

31 Caldera 249 966 1,266 2,941 5512 2810 837 138 264

32 Mejillones 177 682 830 1,836 3954 1943 408 81 139

33 Colchane 26 101 120 249 620 347 140 47 14

34 Chillán 2,283 9,549 13,437 30,848 66475 35890 11216 2527 2479

35 Lago Verde 13 53 68 139 390 258 69 13 12

36 Futrono 278 1,150 1,541 3,211 5420 2886 976 208 214

37 Máfil 111 368 521 1,516 2472 1436 569 160 86

38 Canela 121 515 716 1,437 2818 1986 1101 261 103

39 Freire 402 1,667 2,337 5,134 9525 5416 2093 542 311

40 Valdivia 2,173 8,470 11,336 28,184 59713 30986 10176 2539 2192

Page 6: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Se presentan los gráficos de los nacimientos versus población,

de cada tramo.

menos de 1 año

Naci

mie

nto

s

300025002000150010005000

3500

3000

2500

2000

1500

1000

500

0

Nacimientos versus enores de 1 año

Page 7: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 1 - 4

Nac

120001000080006000400020000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 1 - 4

Page 8: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 5-9

Nac

1600014000120001000080006000400020000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 5-9

Page 9: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 10-19

Nac

35000300002500020000150001000050000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 10-19

Page 10: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 20-44

Nac

700006000050000400003000020000100000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 20-44

Page 11: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 45-64

Nac

400003000020000100000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 45-64

Page 12: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

e 65-79

Nac

14000120001000080006000400020000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs e 65-79

Page 13: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

mas 80

Nac

300025002000150010005000

3500

3000

2500

2000

1500

1000

500

0

Scatterplot of Nac vs mas 80

Page 14: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Se observa que persistentemente una comuna tiene un número de

nacimientos mayor que el resto, según su población, en todos los

tramos.

Es la Comuna de Las Cabras.

Las comunas con ambos números más grandes son Arica, El Bosque

y Chillán.

Para los gráficos y los cálculos siguientes se usó el software MINITAB.,

Page 15: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Hay una correlación muy fuerte entre las poblaciones de los distintos

tramos de edad, siendo un poco menos entre el tramo “más de 80” y

las demás.

Esto se puede apreciar en la siguiente figura, en que grafican las

variables de a pares.

Page 16: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

menos 1

1000050000 30000150000 40000200000 300015000

3000

1500

010000

5000

0

e 1 - 4

e 5-9

16000

8000

030000

15000

0

e 10-19

e 20-44

50000

25000

040000

20000

0

e 45-64

e 65-79

10000

5000

0

300015000

3000

1500

0

1600080000 50000250000 1000050000

mas 80

Matrix Plot of menos 1, e 1 - 4, e 5-9, e 10-19, e 20-44, e 45-64, ...

Page 17: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Se ajustaron modelos de regresión lineal simple a los

nacimientos, con la población de cada uno de los tramos

etarios, como regresor.

La respuesta (y) siempre fue el número de nacimientos.

La salida de MINITAB es la siguiente (en el primer caso):

Page 18: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Regression Analysis: Nac versus menos 1

The regression equation is

Nac = - 14.2 + 1.03 (menos 1)

Predictor Coef SE Coef T P

Constant -14.17 33.63 -0.42 0.676

menos 1 1.02732 0.03418 30.06 0.000

Page 19: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

(cont.)

S = 166.564 R-Sq = 96.0% R-Sq(adj) = 95.9%

Analysis of Variance

Source DF SS MS F P

Regression 1 25065853 25065853 903.49 0.000

Residual Error 38 1054251 27743

Total 39 26120104

Page 20: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

De las pruebas t de hipótesis, se concluye que el intercepto

a = -14.2 no es significativo, mientras que la pendiente

B = 1.03 si lo es.

Por lo tanto la relación entre nacimientos y el tamaño de la

población de menores de 1 año es

Nac = 1.03

Page 21: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

Relaciones similares se puede obtener para las otras

variables poblacionales y su efecto sobre el número de

nacimientos.

Eso queda para el lector.

Page 22: Caso de regresión lineal simple: Relación entre población y número de nacimientos.

FIN