Regresión y Correlación
-
Upload
adrian10104 -
Category
Documents
-
view
10 -
download
2
description
Transcript of Regresión y Correlación
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Seminario Integrador Profesional
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
INDICEPág.
Introducción........................................................................................................................i
Distribuciones Bidimensionales........................................................................................1
Idea De Correlación...........................................................................................................1
Nube De Puntos O Diagrama De Dispersión....................................................................1
Correlación Lineal Y Recta De Regresión........................................................................2
Medida De La Correlación................................................................................................4
Estimación Mediante La Recta De Regresión...................................................................5
Propiedades De La Recta De Regresión De Los Mínimos Cuadráticos...........................6
Mapa De Esparcimiento O Nube De Puntos.....................................................................6
Analisis De Regresión.......................................................................................................7
Tipos Análisis De Regresión.............................................................................................7
Regresión Lineal Simple...................................................................................................7
Fórmulas Para Encontrar "A" Y "B":...............................................................................8
Diagrama De Esparcimiento, Nube De Puntos O Mapa De Dispersion:.........................8
Error Estandar De Regresión:............................................................................................8
Hay Dos Formas De Calcularlo:........................................................................................9
Intervalo De Confianza:....................................................................................................9
Analisis De Correlacion..................................................................................................14
Símbolo " R”...............................................................................................................14
Tipos De Correlación......................................................................................................14
Correlación Perfectamente Positiva...............................................................................14
Correlación Perfecta Negativa.........................................................................................15
Correlación Irregular O Nula.........................................................................................15
Coeficiente De Determinación.......................................................................................16
Coeficiente De Correlación.............................................................................................16
Ejercicio...........................................................................................................................17
Conclusiones....................................................................................................................20
Recomendaciones............................................................................................................21
Bibliografía......................................................................................................................22
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
INTRODUCCIÓN
Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella los
capítulos de correlación y regresión son muy usados en la Investigación Científica, una
herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre
sí, como por ejemplo., el nivel de hemoglobina y embarazo en el ámbito de las Ciencias
de la Salud, la Correlación implica el grado de dependencia de una variable respecto a
otra y la Regresión es otra técnica que ayuda en la investigación de la salud Psicología
costos de una Empresa etc.
El Análisis de Regresión Lineal y La Correlación nos permite establecer la relación que
se produce entre una variable dependiente Y y un conjunto de variables independientes
(X1, X2,... XK). El análisis de regresión lineal múltiple, a diferencia del simple, se
aproxima más a situaciones de análisis real puesto que los fenómenos, hechos y
procesos sociales, por definición, son complejos y, en consecuencia, deben ser
explicados en la medida de lo posible por la serie de variables que, directa e
indirectamente, participan en su concreción.
Al aplicar el análisis de regresión múltiple lo más frecuente es que tanto la variable
dependiente como las independientes sean variables continuas medidas en escala de
intervalo o razón. No obstante, caben otras posibilidades: (1) también podremos aplicar
este análisis cuando relacionemos una variable dependiente continua con un conjunto de
variables categóricas; (2) o bien, también aplicaremos el análisis de regresión lineal
múltiple en el caso de que relacionemos una variable dependiente nominal con un
conjunto de variables continuas
Seminario Integrador Profesional Página i
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
DISTRIBUCIONES BIDIMENSIONALES
“Cuando sobre una población estudiamos simultáneamente los valores de dos variables
estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se
denomina distribución bidimensional.
Ejemplo 1:
Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente
tabla:
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
LENGUA 2 2 5 6 5 7 5 8 7 10
Los pares de valores {(2,2), (4,2), (5,5),...;(8,7), (9,10)}, forman la distribución
bidimensional.
IDEA DE CORRELACIÓN
Es frecuente que estudiemos sobre una misma población los valores de dos variables
estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si
los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos
que las variables están correlacionadas o bien que hay correlación entre ellas.
En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en
Matemáticas, mejor es la de lengua.
NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN
La primera forma de describir una distribución bidimensional es representar los pares de
valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o
diagrama de dispersión.
Seminario Integrador Profesional Página 1
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan
cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor
de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina
recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y
será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con
respecto a la recta.
En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya
que la recta que hemos dibujado está próxima a los puntos de la nube.
Seminario Integrador Profesional Página 2
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una
variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior.
Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una
variable, la otra tiene tendencia a disminuir.
Ejemplo 2:
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50
preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos
realizados.
Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y
negativa (la recta es decreciente).
Ejemplo 3:
A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del
Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media
obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:
Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1 1,2 2,1 2,5 3 3
Nota media 8,4 4 5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1
Seminario Integrador Profesional Página 3
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la
correlación es prácticamente inexistente, es decir, no tiene nada que ver con el
rendimiento académico la distancia del domicilio al instituto,
MEDIDA DE LA CORRELACIÓN
La apreciación visual de la existencia de correlación no es suficiente. Usaremos un
parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos
permite valorar si ésta es fuerte o débil, positiva o negativa.
El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un
programa informático. Nuestro interés está en saber interpretarlo.
Antes de ponernos a trabajar destacaremos una de sus propiedades
-1 < r < 1
A continuación tienes unos ejes con una nube de puntos que puedes modificar haciendo
clic sobre ellos con el ratón y arrastrándolos. No tengas miedo de equivocarte, siempre
puedes volver a la posición inicial pulsando el botón inicio. Las coordenadas de los
puntos las puedes saber con aproximación naciendo clic en cualquier punto del plano y
arrastrando hasta colocarte encima del punto.
Observa el valor de r, así como el ajuste de la nube a la recta. Intenta deducir las
propiedades de r, relacionando su valor con la forma de la nube y realizando los
siguientes ejercicios.
Seminario Integrador Profesional Página 4
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
1. Acerca los puntos a la recta. ¿Hacia qué valor se aproxima r?
2. Aleja los puntos de la recta, separándolos entre sí ¿Hacia qué valor se aproxima
r?
3. Mueve los puntos hasta que la recta tenga pendiente negativa, es decir, sea
decreciente. En estas condiciones contesta a las preguntas anteriores.
4. Si alineas todos los puntos ¿Qué valor aproximadamente toma r?
Anota tus conclusiones en tu cuaderno; puedes ayudarte con el siguiente esquema:
ESTIMACIÓN MEDIANTE LA RECTA DE REGRESIÓN
Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de
puntos, aunque la correlación fuera bastante fuerte.
De todas las rectas posibles los matemáticos han elegido como la mejor aproximación la
llamada de los mínimos cuadráticos, Su cálculo es también algo mecánico que podemos
hacer con calculadora o un ordenador. En el siguiente apartado encontrarás un ejercicio
para estudiar sus propiedades.
La recta de regresión sirve para hacer estimaciones, teniendo en cuenta que:
Los valores obtenidos son aproximaciones en términos de probabilidad: es
probable que el valor correspondiente a x0 sea y0.
La fiabilidad es mayor cuanto más fuerte sea la correlación.
La fiabilidad aumenta al aumentar el número de datos.
La estimación es más fiable para los valores de x próximos a la media.
Ejemplo 1:
Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemáticas y en
Lengua), podemos contestar con aproximación a la siguiente cuestión: si un alumno no
realizó el examen de lengua, pero sí el de matemáticas, obteniendo un 7, ¿qué nota cabe
esperar que obtuviera en lengua?
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
Seminario Integrador Profesional Página 5
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
LENGUA 2 2 5 6 5 7 5 8 7 10
Observa el punto amarillo, cuya abscisa corresponde a la nota de matemáticas y su
ordenada a la nota que esperamos que tenga en lengua. Es resultado es aproximado y
relativamente fiable, ya que la correlación es fuerte Y el valor de la nota no está muy
próximo a la media, aunque el nº de datos que tenemos no es muy alto.
Puedes cambiar el valor de la nota de matemáticas sin más que cambiar su valor en el
recuadro de la parte inferior.
PROPIEDADES DE LA RECTA DE REGRESIÓN DE LOS MÍNIMOS CUADRÁTICOS.
En la siguiente escena puedes comprobar las principales propiedades de la recta de
regresión mínimo-cuadrática.
1. Observa la recta blanca, cuyos coeficientes a y b puedes hacer variar en los
recuadros inferiores de la escena, bien con las flechas o introduciendo los
valores deseados. Observa los segmentos denominados di, que marcan las
distancias de los puntos de la nube a la recta en la dirección del eje OY”. i
MAPA DE ESPARCIMIENTO O NUBE DE PUNTOS
“Esla representación grafica del predictor y el predictando o sea de las variables
consideradas, es decir los datos de dos variable, marcadas en un grafica. Como primer
punto cuando se cuenta con dos variables, es representarlas gráficamente porque esto
permite tener una apreciación visual del comportamiento lineal o no; también se puede
apreciar si su comportamiento es positivo o negativo, importante porque si es negativo
el valor del coeficiente de regresión “b” en la ecuación de regresión tendrá signo
negativo.
i..http://recursostic.educacion.es/descartes/web/materiales_didacticos/
Correlacion_regresion_recta_regresion/correlacion_y_regresion.htm. Verificado el
27/09/2011.
Seminario Integrador Profesional Página 6
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
ANALISIS DE REGRESIÓN
Es la técnica mas usada en investigación económica y comercial para buscar una
relación entre 2 o más variables ligadas de un modo causal. Consiste en general en: una
función a partir de datos o información conocida para hacer estimaciones.
TIPOS ANÁLISIS DE REGRESIÓN
a) REGRESION LINEAL SIMPLE: Se refiere al análisis de 2 variables.
b) REGRESION MULTIPLE: Cuando se relacionan 3 o más variables.
REGRESIÓN LINEAL SIMPLE
Seminario Integrador Profesional Página 7
VALOR DE COMSUMO DE COMBUSTIBLE Q.
KMSRECORRIDOS
Y275 300260 290310 325400 400425 410
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Para este análisis es necesario ajustar los datos a una línea recta, para poder estimar una
variable con relación a otra. Para esto utilizamos la ecuación de la línea recta:
Y = a+ bx ===® yc = a+ bx = Ecuación de Regresión
Donde:
Yc = Variable estimada o calculada.
a y b = Coeficientes de regresión.
X = Variable que sirve para estimar la otra variable. Predictor en base a ella
se estima el predictando. (Variable Independiente).
Y = Constituye la Variable a estimar y recibe el nombre de Predictando.
(Variable Dependiente).
Ecuaciones Normales: å Y = n.a + b å X
å XY = åX a + b å X2
FÓRMULAS PARA ENCONTRAR "a" y "b":
a = åæx2ö (åyö - åæxåæöxyö
nåx2 - åæxö 2
b = nåxy - åæxåæöyö
nåxy2 - åæxö 2
DIAGRAMA DE ESPARCIMIENTO, NUBE DE PUNTOS O MAPA DE DISPERSION:
Es la representación gráfica del Predictor y el predictando. Es una gráfica que nos
muestra la forma en que los puntajes de dos variables cualquiera X y Y están dispersas.
Así a cada elemento de una muestra de tamaño N se le puede hacer corresponder un
par de números. Los números de cada par son las medidas o valores correspondientes a
determinadas características o aspectos que tienen los elementos de la muestra. El
diagrama de esparcimiento es la representación gráfica de los valores "X" y "Y"
A continuación se presentan 4 tipos de gráficas que muestran los tipos de
relaciones lineales:
RELACION LINEAL ASCEDENTE
Seminario Integrador Profesional Página 8
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
RELACION LINEAS DESCENDENTE
RELACION LINEAL CURVILÍNEA
RELACION LINEAL CONSTANTE
ERROR ESTANDAR DE REGRESIÓN:
(SÍMBOLO Syx) Mide el grado de error de las estimaciones alrededor de la línea de
regresión; si este es igual a cero ( 0 ) se dirá que existe una estimación perfecta.
Propiedades de Syx;
Yc, +, - Syx = Agrupa aproximadamente al
68.26% de los datos.
Yc , +, - 2 (Syx) = Agrupa aproximadamente al
95.46% de los datos.
Yc , +, - 3 (Syx) = Agrupa aproximadamente al
99.72% de los datos.
Hay dos formas de calcularlo:
1.) Varianza no explicada (ve)
___________
Syx = å (y- yc)
N
2.) Formula general
Syx = å y2 - åy a - åXY b
N
INTERVALO DE CONFIANZA:
Yc = Z+,- Syx
APLICACIÓN: Al tabular los costos Unitarios y la producción de una empresa
industrial durante el año anterior, se encontró el siguiente comportamiento:
COSTO POR PROD EN MILES
Seminario Integrador Profesional Página 9
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
UNIDAD DE UNIDADESQ 1.00 20Q. 2.00 15Q 3.00 12Q. 4.00 11Q. 5.00 7
1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representación gráfica sabiendo que la empresa desea estimar su producción.
0
5
10
15
20
25
0 2 4 6
Costo Unitario
Pro
du
cció
n (
Miles Q
)
Serie1
DESARROLLO:
DATOS N = 5åx = 15 åy = 65åx2 = 55åy2 = 939åxy = 165
2). Encuentre la Ecuación de Regresión del comportamiento de la producción en
función de los costos unitarios
65 = 5 a + 15b (-3) Factor que multiplica a la Ec. -195 = -15a -45bb = -30 b= -3
165 = 15 a + 55b 165 = 15a +55b 10
Seminario Integrador Profesional Página 10
x y x2 y2 xy
1 20 1 400 20
2 15 4 225 30
3 12 9 144 36
4 11 16 121 44
5 7 25 49 35
15 65 55 939 165
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
-30 = 10B
Encontrar "a":65 = 5 a + 15 (-3) Valor de “b”
65 = 5 a - 45-5 a = -65 – 45a = -110 = a = 22
-5La Ecuación de regresión de la Producción en función de los costos = Y = 22 – 3x
3.) OBTENER "a" y "b" por Fórmula:a = (åx2 ) (åy) – (åx) (åxy) nå x2 - (åx)2
b = n åxy - (åx) (åy) n åx2 - (åx) 2
a = ( 55 ) (65) – (15) (165) = 3575 – 2475 = 1100 a = 22 5 (55) - (15) 2 275 - 225 50
b = 5 (165) – (15) (65) = 825 – 975 = -150 b = -3 5 (55) - (15) 2 275 – 225 50
4.) El Departamento de Ventas de la empresa solicita le indique qué número de
unidades puede producir el presente año, si según estudios se considera que su
costo unitario será igual a Q.3.75
Y = a + bx Yc = 22 – 3 (3.75)Yc = 22 – 11.25 = 10.75
5.) CALCULAR EN ERROR ESTANDAR DE REGRESION;
Syx = å y2 - åy.a - åxy.b N
Syx = 939 – 22 ( 65) – (-3) 165 5
Syx = 939 – 1430 + 495 = 4 5 5
Seminario Integrador Profesional Página 11
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Syx = 0.894427191
Yc Yc=22-3x (y-Yc) (y-Yc)2
19 22 - 3 (1) 1 1
16 22 - 3 (2) -1 1
13 22 - 3 (3) -1 1
10 22 - 3 (4) 1 1
7 22 - 3 (5) 0 0
65 xxxx 0 4
Otra forma:Syx = å (y- yc)2 N ___________Syx = 4 5Syx = 0.894427191 6.) Estimar por intervalo la producción para costo de Q.6.00 con un 85% de
confianza
yc = a +bx 4 +, - 1.43 (0.89442719)
yc = 22 +-3 (6) 4 + 1.28 = 5.28
yc = 22 – 18 4 – 1.28 = 2.72
yc = 4
La producción estimada para costos de Q 6.00 oscila entre 2.72 y 5.28 miles de
unidades.
7.) Según el presupuesto de la empresa para el presente año su producción
alcanzará la suma de 11,500 unidades. ¿Se quiere saber a qué costo debe producir
?. En ejemplos anteriores en base al costo se estima la producción, en este caso es a
la inversa. Entonces, para el desarrollo de este caso se invierte la fórmula original Yc
= a + bx por la siguiente: Xc = a + by
Así como las ecuaciones normales, las cuales quedan así:
å x = n. A + å yb
å xy = å y a + å y2b
Seminario Integrador Profesional Página 12
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
15 = 5a + 65b (-13)
165 = 65a + 939b
-195 = - 65a - 845b
165 = 65a + 939b
-30 94b
b = -30 b = -0.31915
94
Encontrar el valor de "a":
15 = 5 a + 65 ( -0.31915 ) ® 15 = 5 a – 2074475
-5 a = -15 – 20.74475 ® -5 a = -35.74475
a = 7.14895
La Ecuación de los costos en función de la producción queda:
X = 7.14895 - 0.31915y
Costos a que debe producir:
Xc = 7.14895- 0.31915 ( 11.5)
Xc = 3.48
8.) Con las ecuaciones de regresión de la producción en función de los costos
unitarios y los costos unitarios en función de la producción, encontrar el promedio
del costo por unidad y el costo promedio.
Las ecuaciones encontradas son:
Y=22–3x
X = 7.1489 – 0.319148y
Las colocamos en orden:
y = 22.0000 – 3x
0.319148y = 7.1489 - x (-3) Se multiplica por este valor la 2ª. Ecuación
y = 22.0000 – 3x
-0.9574y = -21.4467 + 3x
0.0426y = 0.5533
Y = 0.5533 = 12.9882 Y = 13 Producción
Seminario Integrador Profesional Página 13
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
0.0426 Promedio
Comprobación: Y = 65 = 13
5
Costo Promedio:
Y= 22-3X = 13 = 22 – 3 (X)
3X = 22 – 13
3X = 9
X = 3
Comprobación X = 15 = 3
5
ANALISIS DE CORRELACION
Mide el grado de asociación de dos o más variables. La correlación también se puede
usar por si misma para medir el grado de asociación de dos variables.
SÍMBOLO " r”
Si r es igual a 0 = no existe correlación
Si r mayor que 0 = correlación positiva
Si r menor que 0 = correlación negativa
Si r es igual a menos 1 = correlación perfecta negativa
Si r es igual a uno = correlación perfecta positiva.
Entonces los límites o extremos del coeficiente de correlación son –1y 1.
TIPOS DE CORRELACIÓN
a.) Por el comportamiento de las variables: positiva, negativa y nula o irregular
B) por el numero de variables: simple, múltiple y parcial
CORRELACIÓN PERFECTAMENTE POSITIVA
Aumenta una variable y la otra también aumenta o a la inversa.
Precio Ingresos
Seminario Integrador Profesional Página 14
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
Venta (x) (y) 1.0 10.00
2.0 12.00 3.0 14.004.0 16.005.0 18.0015 70.00
================= Mapa de Dispersión
Correlación perfecta positiva r = 1
CORRELACIÓN PERFECTA NEGATIVA
Una variable aumenta la otra disminuye.
Costo UnidsUnidad Vendidas(x) (y)18.00 160.00 16.00 180.0015.00 190.0014.00 200.0013.00 210.0076.00 940.00===================
Mapa de Dispersión Correlación perfecta negativa r = -1
Seminario Integrador Profesional Página 15
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
CORRELACIÓN IRREGULAR O NULA
No sabemos el compartimiento de la variable, Eje. Aumentamos costo, las ventas
puede que aumenten o disminuyan.
Precios Ingresos(y)1.00 11.00 2.00 9.003.00 2.004.00 15.005.00 8.0015.00 45.00
===================
Mapa de Dispersión
No hay correlación r = 0
COEFICIENTE DE DETERMINACIÓN
Es la forma primaria por la cual se puede medir la extensión o fuerza, de la asociación
que existe entre 2 variables X y Y.
r2 = a (åy) + b (åxy) - n ( y )2
Seminario Integrador Profesional Página 16
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
åy2 - n ( y )2
COEFICIENTE DE CORRELACIÓN
Sirve para medir la relación entre dos variables. Es la segunda medida que se pueda
usar para describir lo bien que una variable se explica por otra. Cuando se está
tratando de muestras, el coeficiente de correlación se denota por “1” y es la raíz
cuadrada del coeficiente de determinación muestral .
Fórmula
.r = r2
o bien:
.r = a (åy) + b (åxy) - n ( y promedio)2 åy2 - n (y promedio)2
APLICACIÓN:
Con los datos del ejemplo que se ha desarrollado en el Análisis de Regresión,
calcular la forma en que primariamente se relacionan las variables:
r2 = a (åy) + b (åxy) - n ( y promedio)2 åy2 - n (y promedio)2
.r 2= 65 (22) + 165 (-3) - 5 ( 13)2 939 - 5 (13)2
.r2 = 0.957447
A continuación calcular el grado de asociación entre las dos variables, (la fuerza o
extensión en que se asocian las variables):
r = 0.957447
r = 0.978492Por ser “r” mayor que cero se dice que la correlación es positiva”.ii
ii Libro de Estadística I Guía de Estudio, José Luis Reyes Donis, Catedrático de
Estadística, facultad de ciencias economías, Segunda Edición, Pág. 189 a 201.
Seminario Integrador Profesional Página 17
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
EJERCICIO
La empresa “Chapín” le proporciona a usted como asesor financiero de la empresa la
siguiente información en miles de quetzales:
Años 1 2 3 4 5
Costos 50 60 65 70 90
Ventas (Q. miles) 65 70 75 85 105
Se pide:
a) Determinar la ecuación de regresión para estimar las ventas;
b) Determinar las ventas para un costo de Q. 120,000.00;
c) Determinar el grado de asociación entre las dos variables;
d) Interpretar el coeficiente hallado en el inciso anterior; y
e) El error estándar de estimación.
n Costos (x) Ventas (y) xy x2 y21 50 65 3250 2500 42252 60 70 4200 3600 49003 65 75 4875 4225 56254 70 85 5950 4900 72255 90 105 9450 8100 11025
335 400 27725 23325 33000
a) Ecuación de regresión
a = (Σx) ( Σ xy) – (Σy) (Σx2)(Σ x)2 – n(Σx2)
a = (335) ( 27725) – (400) (23325)(335)2 - 5 (23325)
a = -42125-4400
a = 9.57
Seminario Integrador Profesional Página 18
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
b = (400) (335) – 5 (27725)(335)2 - 5 (23325)
b = -4625-4400
b = 1.05
Yc = 9.57 + 1.05 X
b) Ventas para un costo de Q 120,000.00
Y (20,000) = 9.57 + 1.05
(120)
Y (20,000) = 135.71
c) Grado de asociación de las variables
Ŷ = 400=
805
r = a (Σ y) + (b)(Σ xy) – n(Ŷ)2
(Σ y2) – n(Ŷ )2
r =(9.57) (400) + (1.05) (27725) – (5)
(80)2
(33000) – (5) (80)2
r = 972.3011361000
r = 0.97230114
r = 0.9861
Seminario Integrador Profesional Página 19
b = (Σy) ( Σ x) – n (Σxy) (Σ x)2 – n(Σx2)
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
d) Interpretación del coeficiente de correlación
Coeficiente de correlación positivo, lo que implica que al aumentar una variable
(Costos) la otra (Ventas) también aumenta.
e) Error Estándar de Estimación
Syx = ∑ y2 – a ∑ y – b ∑ xyN
Syx =(33000) – (9.57) (400) – (1.05)
(27725)5
Syx = 60.755
Syx = 12.15
Syx = 3.49
Seminario Integrador Profesional Página 20
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
CONCLUSIONES
La correlación es frecuente que estudiemos sobre una misma población los valores
de dos variables estadísticas distintas, con el fin de ver si existe alguna relación
entre ellas.
La primera forma de describir una distribución bidimensional es representar los
pares de valores en el plano cartesiano.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan
cerca de alguna curva.
El análisis de regresión es la técnica más usada en investigación económica y
comercial para buscar una relación entre 2 o más variables ligadas de un modo
causal.
Seminario Integrador Profesional Página 21
Seminario De Integración Profesional Planeación Y Desarrollo Del Informe De InvestigaciónGrupo No. 10
RECOMENDACIONES
Al realizar estimar una variable con base a la otra se trata de regresión y si se desea
conocer la relación existente entre variables entonces se refiere al tema de
correlación.
La regresión y correlación son una herramienta estadística para la toma de
decisiones por tal motivo nos proporcionan indicadores que nos lleva a conocer el
comportamiento de una variable a otra, la cual de esta manera obtendremos los
resultados esperados.
Seminario Integrador Profesional Página 22