Regresion lineal

9
Índice. Introducción................................ Pag.O1 Covarianza.................................. Pag.O1 Coeficiente de correlación.................. Pag.O2 Propiedades de correlación.................. Pag.O3 Diagramas de dispersión..................... Pag.O4 Grado de Correlación........................ Pag.O5 Recta de regresión.......................... Pag.O6 Conclusión, Crítica, Bibliografía........... Pag.O7 Introducción. La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber qué es y cómo se relacionan entre si dos o más variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos; los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas. Covarianza La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por s xy o σ xy . Facultad de Ingeniería. González Briseño Efrain Página 1

description

Probabilidad y estadistica

Transcript of Regresion lineal

Page 1: Regresion lineal

Índice.

Introducción................................................................ Pag.O1 Covarianza.................................................................. Pag.O1 Coeficiente de correlación.......................................... Pag.O2 Propiedades de correlación......................................... Pag.O3 Diagramas de dispersión............................................ Pag.O4 Grado de Correlación.................................................. Pag.O5 Recta de regresión...................................................... Pag.O6 Conclusión, Crítica, Bibliografía................................... Pag.O7

Introducción.La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber qué es y cómo se relacionan entre si dos o más variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación

La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos; los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.

Covarianza La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.

La covarianza se representa por sxy o σxy.

La covarianza indica el sentido de la correlación entre las variables

Si σxy > 0 la correlación es directa. Si σxy < 0 la correlación es inversa.

La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.

Facultad de Ingeniería. González Briseño EfrainPágina 1

Page 2: Regresion lineal

Es decir, la covarianza variará si expresamos la altura en metros o en centímetros. También variará si el dinero lo expresamos en euros o en dólares.

Coeficiente de correlación

El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables.El coeficiente de correlación lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlación1. El coeficiente de correlación no varía al hacerlo la escala de medición; es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.

2. El signo del coeficiente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la correlación es directa. Si la covarianza es negativa, la correlación es inversa. Si la covarianza es nula, no existe correlación.

3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.−1 ≤ r ≤ 1

4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.

6. Si el coeficiente de correlación lineal  toma valores cercanos a 0, la correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

Diagrama de dispersión 

El diagrama de dispersión, es una gráfica del tipo X –Y cuyo objetivo es analizar la forma en que dos variables numéricas están relacionadas; se obtiene coleccionando los datos en pares de valores sobre dos variables (x,y). Las parejas de datos obtenidos se representan a través de puntos en una gráfica del tipo X – Y (ejes de coordenada cartesianos).

El análisis de un diagrama puede mostrar varios tipos de correlaciones entre las variables con un intervalo de confianza determinado.

Correlación positiva ((Y aumenta con X)),

Facultad de Ingeniería. González Briseño EfrainPágina 2

Page 3: Regresion lineal

Correlación negativa (Y disminuye con X), Correlación nula (las variables no están correlacionadas).

Es una de las herramientas básicas de gestión de la calidad, muy útil al analizar las causas de un problema y para Identificar oportunidades de mejora continua.

En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (x i, y i).

Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntoso diagrama de dispersión.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresión.

Diagrama de dispersiónEjemplo Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

1º Correlación directaLa recta correspondiente a la nube de puntos de la distribución es una recta creciente.

Facultad de Ingeniería. González Briseño EfrainPágina 3

*Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10*Física 1 3 2 4 4 4 6 4 6 7 9 10

Page 4: Regresion lineal

2º Correlación inversaLa recta correspondiente a la nube de puntos de la distribución es una recta decreciente.

3º Correlación nulaEn este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlación

El grado de correlación indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:

1. Correlación fuerteLa correlación será fuerte cuanto más cerca estén los puntos de la recta.

Facultad de Ingeniería. González Briseño EfrainPágina 4

Page 5: Regresion lineal

2. Correlación débilLa correlación será débil cuanto más separados estén los puntos de la recta.

3. Correlación nulaNo existe ninguna correlación entre los datos.

Por otro lado se puede observar que los puntos en un diagrama de dispersión pueden estar muy cerca de la línea recta que los atraviesa, o muy dispersos o alejados con respecto a la misma. El índice que se utiliza para medir ese grado de cercanía de los puntos con respecto a la línea recta es la correlación.

Facultad de Ingeniería. González Briseño EfrainPágina 5

Page 6: Regresion lineal

En total existen cinco grados de correlación: positiva evidente, positiva, negativa evidente, negativa y , nula.

Recta de regresión- Regresión Lineal.

La recta de regresión es la que mejor se ajusta a la nube de puntos.

La recta de regresión pasa por el punto   llamado centro de gravedad.

Recta de regresión de Y sobre XLa recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresión de X sobre YLa recta de regresión de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y.

Facultad de Ingeniería. González Briseño EfrainPágina 6

Page 7: Regresion lineal

La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí, y sus ecuaciones son:

y =  x = 

Conclusión.

El análisis de regresión y correlación lineal constituyen métodos que se emplean para conocer las relaciones y significación entre series de datos. Estos métodos estadísticos constituyen una herramienta útil para el análisis de las variables de un proceso ya que a través de la aplicación de éstas, es posible conocer el modelo que siguen y la fuerza con que se encuentran relacionadas. Así mismo, es posible explicar la relación que guardan dos o más causas de un posible defecto.

Critica.

Hasta la fecha la clase se ha llevado de una forma amena en la cual el aprendizaje es bueno, solo que necesitamos un poco de explicación más a detalle con esto quiero decir que sea paso por paso. Ahora es necesario un compromiso mayor para poder adquirir dichos conocimientos de una manera sencilla.

Bibliografía.

Estadística para administradores - alan wester - editorial mcgraw-hill  Estadística y muestreo - ciro martínez - editorial ecoe editores (octava edición). William mendenhall y dennos d. Wackerly. Estadística matemática con aplicaciones,

segunda edición. 1994 editorial iberoamericana. Gutiérrez-pulido, h. Y de la vara salazar, r. (2005), control estadístico de calidad y seis

sigma, primera edición. 2005 editorial mcgraw-hill, méxico. http://www.um.es/docencia/pguardio/documentos/tec2.pdf http://recursostic.educacion.es/descartes/web/materiales_didacticos/

unidimensional_lbarrios/asimetria_est.htm http://www.euosuna.org/zonaalumnos/materiales/c03/230.pdf

Facultad de Ingeniería. González Briseño EfrainPágina 7