Regresión Lineal Simple Antecedentes Generales

4
Regresión Lineal Simple Antecedentes Generales Los métodos de regresión corresponden a la aplicación de modelos matemáticos que explican la dependencia de una variable dependiente “ Y” respecto de una o varias variables independientes. Un modelo de regresión entonces permite evaluar la relación que existe entre estas variables. Cuando se tiene solamente una variable independiente se habla de regresión simple y cuando son varias de regresión múltiple. En general los métodos de regresión permiten: •Caracterizar el tipo de relación en el sentido de determinar la dirección, intensidad y fuerza de la relación entré las variables. •Presentar un modelo matemático que permita describir el comportamiento de la variable dependiente en función de las variables independientes. •Determinar cuáles de las variables independientes son más importantes al momento de explicar el comportamiento de la variable dependiente. En general, el procedimiento para elaborar un modelo de regresión implica varias etapas, tales como: Etapa 1. Análisis exploratorio: Todo proceso de análisis de datos requiere, en forma previa de la verificación de la calidad de la información y de la validez de los supuestos necesarios para enfrentar el proceso de ajuste de un modelo. Etapa 2. Formulación de una clase o familia de modelos: En esta etapa se debe identificar el tipo de problema al cual se enfrenta, para encontrar, entre las distintas alternativas de modelos posibles, la que proporcione la mejor representación de la situación o fenómeno a estudiar. Etapa 3. Estimación de parámetros: Utilizando algoritmos adecuados, y disponiendo de una muestra de tamaño y características específicas, se generan, para el

description

regresión lineal antecedentes

Transcript of Regresión Lineal Simple Antecedentes Generales

Page 1: Regresión Lineal Simple Antecedentes Generales

Regresión Lineal Simple Antecedentes GeneralesLos métodos de regresión corresponden a la aplicación de modelos matemáticos que explican la dependencia de una variable dependiente “Y” respecto de una o varias variables independientes”. Un modelo de regresión entonces permite evaluar la relación que existe entre estas variables. Cuando se tiene solamente una variable independiente se habla de regresión simple y cuando son varias de regresión múltiple. En general los métodos de regresión permiten:

•Caracterizar el tipo de relación en el sentido de determinar la dirección, intensidad y fuerza de la relación entré las variables.

•Presentar un modelo matemático que permita describir el comportamiento de la variable dependiente en función de las variables independientes.

•Determinar cuáles de las variables independientes son más importantes al momento de explicar el comportamiento de la variable dependiente.En general, el procedimiento para elaborar un modelo de regresión implica varias etapas, tales como:

Etapa 1. Análisis exploratorio:Todo proceso de análisis de datos requiere, en forma previa de la verificación de la calidad de la información y de la validez de los supuestos necesarios para enfrentar el proceso de ajuste de un modelo.Etapa 2. Formulación de una clase o familia de modelos:En esta etapa se debe identificar el tipo de problema al cual se enfrenta, para encontrar, entre las distintas alternativas de modelos posibles, la que proporcione la mejor representación de la situación o fenómeno a estudiar.Etapa 3. Estimación de parámetros:Utilizando algoritmos adecuados, y disponiendo de una muestra de tamaño y características específicas, se generan, para el modelo seleccionado en la etapa 2, los estimadores necesarios.Etapa 4. Verificación y diagnóstico:Una vez obtenidos los estimadores de los parámetros del modelo, se debe verificar si el modelo propuesto representa eficientemente las relaciones entre las variables de interés. Esta etapas de interpretación de resultados gráficos, aplicación de pruebas de hipótesis específicas sobre los parámetros del modelo. En caso que el modelo ajustado no represente las relaciones propuestas, se debe volver a la etapa 2 y seleccionar una nueva familia de modelos.Etapa 5. Predicción:En la mayoría de las aplicaciones prácticas de modelos de regresión, el objetivo básico es encontrar una relación de dependencia entre una

Page 2: Regresión Lineal Simple Antecedentes Generales

variable dependiente y un conjunto de variables predictores. La finalidad de tal búsqueda, en tales casos, es poder predecir el comportamiento de la variable respuesta ante cambios de las variables predictores, en particular, ante valores futuros de estas variables. Para poder construir estas predicciones se debe estar convencido que el modelo en cuestión es correcto.Etapa 6. Simulación:La etapa final del proceso de construcción de un modelo, pasa necesariamente por la verificación de la capacidad del modelo para reproducir el comportamiento de la relación descrita, usando datos simulados. Este tipo de estudios tiene especial importancia en la planificación y toma de decisiones. Debido a las restricciones propias de este curso, solamente se dará una pequeña mirada a la aplicación de métodos de regresión, restringiéndolo solamente a la etapa de identificación, formulación de modelos y estimación de parámetros, para el caso del modelo de regresión lineal simple. El alumno, sin embargo, debe tener claro que en un caso real, los 6 pasos señalados anteriormente no deben ser evitados y que el modelo puede considerar varias variables.

Regresión Lineal SimpleCualquier estudio estadístico debe comenzar por una revisión de la información disponible, debiendo comenzaron un estudio gráfico inicial, los supuestos referentes a la distribución de las variables a considerar (respuesta predictores), la presencia de observaciones erróneas, atípicas o faltantes. Una vez que se ha realizado el análisis exploratorio se debe formular una familia de modelos a ajustar, en este caso se considerará el modelo más simple que corresponde a modelar el comportamiento de una variable dependiente en función de otra independiente, donde la relación funcional es lineal, es decir:

Donde β0: es el intercepto de la recta de regresión β1: es la pendiente de la recta de regresiónεi:es la componente de error del modelo. El componente aleatorio εi: corresponde a la parte de la variable respuesta que no logra ser explicada por el modeló, es decir:

Para que las inferencias que se realicen a partir de este modelo sean válidas, el error aleatorio (εi) debe cumplir con varios supuestos, a saber: Esperanza cero, varianza σ2, errores independientes entre sí e idénticamente distribuidos según una normal

La estimación de los parámetros se puede realizar por varios métodos, siendo uno de ellos

Page 3: Regresión Lineal Simple Antecedentes Generales

El método de los mínimos cuadradosQue consiste en minimizar las diferencias cuadráticas que se producen entre los valores observados y los estimados, para ello se generan las ecuaciones normales, es decir:

Modelo de regresión múltiple:

Es un modelo de regresión que contiene más de una variable regresora o independiente, y éste utiliza el término lineal ya que forman una función lineal de variables desconocidas.En general, la variable de respuesta o dependiente y puede relacionarse con k variables regresoras ó independientes.MODELO DE REGRESION LINEAL MUTIPLE

Y=β0+β1 x1+β2 x2+...βk xk+ε

Un ejemplo de regresión lineal múltiple es:* Suponga que la vida efectiva de una herramienta de corte depende de la velocidad de corte y del ángulo de la herramienta, el modelo que describe esta relación es:

Y=β0+β1 x1+β2 x2+ε

Donde:

Y = vida de la herramienta.β0 = velocidad de corte.β1 = ángulo de la herramienta. ε = error aleatorio.Enfoque matricial de la regresión lineal múltiple

Al ajustar un modelo de regresión múltiple, es mucho más conveniente expresar las operaciones matemáticas utilizando la notación matricial. Suponga que hay K variables regresoras y n observaciones ( xi1, xi2,… x ik, yi), i= 1,2,…,n, y que el modelo que relaciona las variables regresoras con la variable de respuesta es Yi = βₒ+β1 xi1 + β2 xi2 +… + βk xik + ԑi i=1,2,…, n