Metodos de Predicción Regresión Lineal (1)

download Metodos de Predicción Regresión Lineal (1)

of 23

Transcript of Metodos de Predicción Regresión Lineal (1)

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    1/23

    Pronsticos

    Modelos deregresin

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    2/23

    Modelos de regresin

    Una cosa es ajustar un modelo a una serie de tiempos;otra, totalmente diferente, es proponer otras variablesque se relacionen a la serie de datos de inters ydesarrollar un modelo que exprese la forma en que se

    relaciona diversas variables.

    Regresin es un conjunto de tcnicas que son usadas paraestablecer una relacin entre una variable cuantitativa

    llamada variable dependiente (Y)y una o ms variablesindependientes (X) llamadas variables predictoras. Laecuacin que representa la relacin es llamada el modelode regresin.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    3/23

    Modelos de regresin simple

    Y = f(X)

    Modelos de regresin mltiple

    Y = f ( X1, X2, ....., Xn)

    Modelos de regresin

    Los modelos de regresin los clasificaremos en dostipos:

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    4/23

    Regresin simple

    El anlisis de regresin simple es una herramientaestadstica que nos permite estimar la relacinmatemtica existente entre una variable dependiente(denominada generalmente Y) y una nica variableindependiente (expresada comnmente X).

    La variable dependiente es aquella que queremosrealizar una previsin.

    Si a la relacin entre las dos variables (X Y) es unalnea, estamos hablando de modelos de regresinlineal, que son los que se utilizan con mayorfrecuencia.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    5/23

    El modelo matemtico que se ajusta a una recta, es elsiguiente:

    1seala la tasa de cambio de Y por unidad de X.

    La interseccin oes el valor que adquiere la variabledependiente Y cuando X es cero.

    del modelo representa un trmino de error.

    Y = o+ 1X +e

    Regresin simple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    6/23

    Nuestro problema es determinar los valores de boy b1de manera que la ecuacin resultante se ajusten a losdatos de la mejor manera posible.

    La tcnica que se utiliza con mayor frecuencia es MCO(mnimos cuadrados ordinarios).

    oy 1son parmetros de la poblacin que se estimantpicamente mediante datos muestrales. Losestadsticos muestrales son boy b1, en consecuencia el

    modelo muestral es:

    Y = bo + b1 X

    Regresin simple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    7/23

    X Y X Y X Y X Y

    10 8.04 10 9.14 10 7.46 8 6.58

    8 6.95 8 8.14 8 6.77 8 5.76

    13 7.58 13 8.74 13 12.74 8 7.71

    9 8.81 9 8.77 9 7.11 8 8.8411 8.33 11 9.26 11 7.81 8 8.47

    14 9.96 14 8.1 14 8.84 8 7.04

    6 7.24 6 6.13 6 6.08 8 5.25

    4 4.26 4 3.1 4 5.39 19 12.5

    12 10.84 12 9.13 12 8.15 8 5.56

    7 4.82 7 7.26 7 6.42 8 7.91

    5 5.68 5 4.74 5 5.73 8 6.89

    CONJUNTO DCONJUNTO CCONJUNTO BCONJUNTO A

    Qu tienen de comn estos conjuntos de datos?

    Ejemplo

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    8/23

    Que los resultados de la regresin de todas ellas seexpresan con la siguiente ecuacin de MCO:

    ES POSIBLE ESTO?

    Veamos la representacin grafica de cada uno de

    ellas

    Y = 3 + 0.5 X

    Regresin simple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    9/23

    0

    2

    4

    6

    8

    10

    12

    0 5 10 15

    X

    Y

    0

    2

    4

    6

    8

    10

    12

    0 5 10 15

    X

    Y

    ConjuntoA

    Conjunto

    B

    0

    2

    4

    6

    8

    10

    12

    14

    0 5 10 15

    X

    Y

    ConjuntoC

    0

    2

    4

    6

    8

    10

    12

    14

    0 5 10 15 20

    X

    Y ConjuntoD

    Qu opinan ahora?

    Regresin simple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    10/23

    Una buena leccin:

    La visualizacin de los datos nos permite percibirnotables diferencias que no aparecen en losestadsticos descriptivos.

    Regresin simple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    11/23

    Pasos a seguir en unaregresin lineal

    Diagrama de dispersin.

    Calcular el coeficiente de correlacin ydeterminacin.

    Prueba de significancia del coeficiente decorrelacin.

    Anlisis de regresin.

    Error estndar de estimacin

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    12/23

    Suponga que el Sr. Juan observa el precio y volumen degalones de leche de 10 semanas elegidas en formaaleatoria. Podr el seor Jun pronosticar el volumen deventas a partir del precio de galn de la leche?

    SEMANA VENTAS PRECIO

    1 10 1.3

    2 6 2

    3 5 1.7

    4 12 1.5

    5 10 1.66 15 1.2

    7 5 1.6

    8 12 1.4

    9 17 1

    10 20 1.1

    Ventas en miles de galones

    Precio de venta por galon

    Lo resuelven?

    Ejemplo

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    13/23

    El seor Juan se enfrenta alproblema de formular unpronstico que no es del todopreciso. El puede explicar casi

    el 75% de la varianza total delvolumen de ventas de galonesde leche vendidos mediante eluso de una variableindependiente. Para ser maspreciso, debe encontrar otra

    variable de prediccin que lepermita explicar mas lavarianza total.

    SEMANA VENTAS PRECIO PUBLICIDAD

    1 10 1.3 9

    2 6 2 7

    3 5 1.7 5

    4 12 1.5 14

    5 10 1.6 15

    6 15 1.2 12

    7 5 1.6 6

    8 12 1.4 10

    9 17 1 15

    10 20 1.1 21

    Ventas en miles de galones

    Precio de venta por galon

    Publicidad en ciento de dolares

    MEJORO SU PRONOSTICO?

    Ejemplo 20

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    14/23

    Diagrama de dispersin mltiple.

    Calcular el coeficiente de correlacin ydeterminacin.

    Prueba de significancia del coeficiente decorrelacin.

    Anlisis de regresin.

    Error estndar de estimacin.

    Prueba de significancia de los coeficientes deregresin.

    Pasos a seguir en una regresinlineal mltiple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    15/23

    Regresin lineal mltiple

    Observe usted, elgrafico de dispersinmltiple

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    16/23

    Regresin lineal mltiple

    Model Summa ry

    .965a .932 .912 1.507

    Model

    1

    R R Square

    Adjus ted

    R Square

    Std. Error of

    the Estimate

    Predictors: (Constant), publicidad, precioa.

    r2=0.932, es un buen coeficiente dedeterminacin, eso me indica que lacorrelacin es muy intensa.

    r=0.965, es un buen coeficiente decorrelacin, eso me indica que siexiste correlacin.

    ANOVAb

    217.699 2 108.849 47.917 .000

    a

    15.901 7 2.272

    233.600 9

    RegressionResidual

    Total

    Model

    1

    Sum of

    Squares df Mean Square F Sig.

    Predictors: (Constan t), publicidad, p recioa.

    Depe ndent Variable: ventasb.

    Como la probabilidad p es 0.000 y es menor que (0.05), entonces, lacorrelacin es real.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    17/23

    Regresin lineal mltiple

    Coefficientsa

    16.406 4.343 3.778 .007

    -8.248 2.196 -.490 -3.756 .007

    .585 .134 .571 4.377 .003

    (Constant)

    precio

    publicidad

    Model

    1

    B Std. Error

    Unstandardized

    Coefficients

    Beta

    Standardized

    Coefficients

    t Sig.

    Dependent Variable: ventasa.

    La funcin de regresin es:

    Publicidad0.585Precio8.24816.406Ventas

    Observe usted, que la probabilidad p de las variables precio ypublicidad son 0.007 y 0.003 respectivamente y ambas sonmenores que (0.05), por lo tanto, los coeficientes de estasvariables si son significativos. Dicho de otra manera, las variablesprecio y publicidad si aportan en el modelo de regresin.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    18/23

    Model Summary

    .965a .932 .912 1.507

    Model1

    R R Square

    Adjusted

    R Square

    Std. Error of

    the Estimate

    Predictors: (Constant), publicidad, precioa.

    ANOVAb

    217.699 2 108.849 47.917 .000a

    15.901 7 2.272

    233.600 9

    Regression

    Residual

    Total

    Model

    1

    Sum of

    Squares df Mean Square F Sig.

    Predictors: (Constant), publicidad, precioa.

    Dependent Variable: v entasb.

    Coefficientsa

    16.406 4.343 3.778 .007

    -8.248 2.196 -.490 -3.756 .007

    .585 .134 .571 4.377 .003

    (Constant)

    precio

    publicidad

    Model1

    B Std. Error

    Unstandardized

    Coeff icients

    Beta

    Standardized

    Coeff icients

    t Sig.

    Dependent Variable: v entasa.

    Regresin lineal mltiple

    Los resultados delanlisis de regresindel SPSS

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    19/23

    Ejemplo

    Caso A - Elecciones en Florida

    En las elecciones presidenciales norteamericanasde Noviembre 2000 los contendientes principales,

    George Bush y Al Gore, resultaron casi empatados

    en trminos de votos electorales, por lo que el

    resultado dependa crucialmente de los comicios

    en el estado de Florida, donde el escrutinio inicialno dio un resultado definitivo a favor de ninguno

    de los candidatos. A medida que prosegua el

    conteo, surgieron varias anomalas, una de las

    cuales tuvo que ver con el condado de PalmBeach.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    20/23

    Entre otras cosas, se aleg que en este condado muchos votantes que deseaban

    votar por Gore se confundieron, debido al diseo de la papeleta electoral, y

    votaron por error por un candidato marginal, Pat Buchanan, del Reform Party.

    (El condado de Palm Beach tena una papeleta electoral un tanto confusa y conun formato diferente a la de los dems condados en el estado.)

    El cuadro adjunto muestra la votacin obtenida por Buchanan en todos los

    condados del estado de Florida, y se aprecia claramente que la cantidad de votos

    obtenidos por ese candidato en Palm Beach fue exageradamente grande en

    comparacin al resto del estado. Presumiblemente, muchos de estos fueron

    efectivamente votos errneos (y probablemente con la intencin de votar por

    Gore, debido al diseo de la papeleta). La pregunta es si se puede obtener una

    estimacin aproximada de la cantidad de estos votos errneos.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    21/23

    Como una primera aproximacin, se esperara que la votacin obtenida por Buchanan en

    un condado determinado estara positivamente relacionada con la cantidad de personas

    afiliadas al Reform Party residentes en ese condado. Este dato tambin se muestra en el

    cuadro adjunto.

    Con esta informacin,

    (a) Construya un diagrama de dispersin, relacionando las dos variables.

    (b) Calcule la lnea de regresin (excluyendo la observacin para Palm Beach), y con los

    resultados obtenidos, haga una estimacin de la "votacin excedente" obtenida por

    Buchanan en Palm Beach.

    (c) Tomando en cuenta que segn los resultados oficiales, Bush gan a Gore en Florida por

    una diferencia de 537 votos (sobre un total de ms de 6,100,000 votos emitidos),comente sobre las implicaciones de este anlisis para el resultado final de las elecciones

    presidenciales de ese ao.

  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    22/23

    Registrados Votos por Registrados Votos por

    Condado Reform Party Buchanan Condado Reform Party Buchanan

    Alachua 91 263 Lake 80 289

    Baker 4 73 Lee 113 305

    Bay 55 248 Leon 80 282

    Bradford 3 65 Levy 17 67

    Brevard 148 570 Liberty 0 39Broward 332 788 Madison 2 29

    Calhoun 2 90 Manatee 140 271

    Charlotte 41 182 Marion 108 563

    Citrus 44 270 Martin 48 112

    Clay 40 186 Monroe 62 47

    Collier 118 122 Nassau 13 90

    Columbia 35 89 Okaloosa 96 267

    Dade 217 560 Okeechobe 27 43

    Desoto 7 36 Orange 199 446

    Dixie 0 29 Osceola 62 145Duval 150 652 Pasco 167 570

    Escambia 130 502 Pinellas 425 1013

    Flagler 30 83 Polk 119 532

    Franklin 0 33 Putnam 27 148

    Gadsden 11 38 Santa Rosa 55 311

    Gilchrist 6 29 Sarasota 154 305

    Glades 2 9 Seminole 81 194

    Gulf 3 71 St.Johns 59 229

    Hamilton 3 23 St.Lucie 25 124

    Hardee 4 30 Sumter 21 114

    Hendry 10 22 Suwannee 7 108

    Hernando 43 242 Taylor 3 27

    Highlands 24 127 Union 1 37

    Hillsborough 299 847 Volusia 176 496

    Holmes 2 76 Wakulla 7 46

    Indian River 66 105 Walton 22 120

    Jackson 8 102 Washington 9 88

    Jefferson 2 29

    Lafayette 0 10 PALM BEACH 337 3407

    Fuentes:

    Florida Dept. of State, Division of Elections,

    "County Voter Registration by Party," Oct 10, 2000

    http://election.dos.state.fl.us/pdf/2000voterreg/20

    00genparty.pdf

    ABC News, "Florida: Real-Time County

    Returns"

    (www.abcnews.go.com/sections/politics/2000vote/

    general/FL_county.html), visited June 15, 2001.

    http://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdfhttp://election.dos.state.fl.us/pdf/2000voterreg/2000genparty.pdf
  • 7/24/2019 Metodos de Prediccin Regresin Lineal (1)

    23/23