Análisis Bivariante- Guía de estudio
-
Upload
zoraida-perez-s -
Category
Education
-
view
480 -
download
0
Transcript of Análisis Bivariante- Guía de estudio
Guía N° 3
ANÁLISIS BIVARIANTE
Curso Básico Universitario de
Estadística y Probabilidad
Universidad Nacional Experimental de GuayanaCiudad Guayana- Venezuela
Zoraida Pérez Sánchez
OBJETIVO: Describir la posible relación entre dos variables:
Estadística Descriptiva
ANÁLISIS BIVARIANTE
DOS VARIABLES CUALITATIVAS
CUALITATIVA Y CUANTITATIVA
DOS VARIABLES CUANTITATIVAS
DOS VARIABLES CUALITATIVAS
Proyecto
de CarreraAprobados Reprobados Inscritos
231 460 691
33,43% 66,57% 100%
Fuente: Actas Oficiales de Evaluación Final
Resumen elaborado por: Zoraida Pérez S.
MATEMÁTICA I
Ingeniería
Informática
Ingeniería
Industrial
Administración y
Contaduría
RESUMEN ESTADISTICO
PERIODO LECTIVO 200403
AREA DE MATEMÁTICA
234
21274 138
95
62
150
172
245
Tablas de Contingencia Diagrama de mosaico
0 30 60 90 120 150 180
N° Alumnos
Pro
yect
o d
e C
arre
ra
Relación Aprob/Reprob por Proyecto
Admin
Contad
Indust
Inform
Reprobado
Aprobado
Diagrama de Barra
feb-16 3
Gráficos y tablas comparativas de grupos. Ejemplos:
Diagrama de Caja y Bigote
Zor
aida
Pére
z S
.
4
Cualitativas con Cuantitativa feb-16
Diagrama Columnas
Relación entre variables
Utilizar Una
variable predictora
(x)
Para pronosticar la Variable que nos interesa estudiar
(y)
Utilizar dos o más
variables predictoras
(x1 , x2, x3, ...., xi)
Para pronosticar la Variable que nos interesa estudiar
(y)
Análisis de Regresión–correlación
Simple
Análisis de Regresión–correlación
Múltiple
feb-165
Relación entre variables cuantitativas
Generalmente, la variable que queremos estudiar (y) no es tan fácil de controlar directamente
(Ejemplo: demanda de un producto, ventas, etc.)
Si sospechamos una posible relación entre dos variables
(Ejemplo: controlando el Precio de un producto,
podemos indirectamente incidir en las Ventas)
Utilizamos un
Análisis de Regresión
para obtener un modelo matemático que describa la
relación entre las dos variables
Utilizamos un
Análisis de Correlación
para saber qué tan fuerte es la relación entre las dos variables
Utilizar Una variable predictora (x) para predecir otra variable (y)
feb-16 6
Análisis de Regresión y Correlación Simple
Técnicas Estadísticas
Diagrama de Dispersión
para visualizarla relación entre las dos variables
--------
----
---------
----
Análisis de
Regresión
para obtener un modelo matemático
que describa la relación entre las
dos variables
Obtener Ecuación de Estimación por
el método de mínimos cuadrados
Análisis de
Correlación
para saber qué tan fuerte es la relación entre
las dos variables
Obtener dos indicadores
-Coef.Correlación (r)
-Coef. Determinación (r2)
feb-167
Técnicas - Análisis Bivariante
BxAy ˆ
Y VARIABLE
A PREDECIR
DÍA
Precio Unitar.
Bs
(x)
VENTAS Docenas de Blusas
(y)
LUNES 18 6
MARTES 25 5
MIERC. 35 3
JUEVES 15 4
VIERNES 18 4
SABADO 23 3
DOMINGO 30 2feb-16
PRIMERO:
Recolectar DATOS PAREADOS
(dos características de una misma unidad de análisis)
Diagrama de Dispersión
Precio Unitario (en Bs.)
VEN
TAS
(en
do
cen
as)
X VARIABLE
PREDICTORA
SEGUNDO:
Construir unDIAGRAMA DE DISPERSIÓN,
el cual nos da información visual sobre la relación entre:
0
1
2
3
4
5
6
7
0 10 20 30 40
Para realizar el Análisis Bivariante
feb-16
TERCERO:
Aplicamos el método de Mínimos Cuadrados para encontrar la recta de mejor ajuste a la nube de puntos
Analíticamente se obtiene la Ecuación de Estimación
- Cálculos manuales- Funciones estadísticas de la calculadora- Funciones estadísticas de Excel- Programas estadísticos (STATGRAPHICS, SPSS, MINITAB...)
xByA
donde:22 )(xnx
yxnxyB
BxAy ˆ
Análisis de Regresión
Cálculos Manuales feb-16
Día x y x2
xy y2
Lunes 18 6 324 108 36
Martes 25 5 625 125 25
Miércoles 35 3 1.225 105 9
Jueves 15 4 225 60 16
Viernes 18 4 324 72 16
Sábado 23 3 529 69 9
Domingo 30 2 900 60 4
Sumatorias 164 27 4.152 599 115
medias= 23,429 3,857
n= 7
pendiente de la rescta: B= -0,1084
Punto de corte con el eje "y" : A= 6,3967
Error Estándar de Estimación: Se= 1,040684
Coeficiente de Determinación: r2= 0,3352
Coeficiente de Correlación: r= 0,578937
y=A+B.x
ó
ó
bxay ˆ
22
xnx
yxnxyb
xbya
2
)ˆ( 2
n
yyse
2
2
n
xybyayse
2
2
2
)(
)ˆ(1
yy
yyr
22
2
2
yny
ynxybyar
DATOSfeb-16
11
Con Hoja de Cálculo (Excel)
mes Gastos Publicidad
[en Miles de Bs ]
Ventas[en Miles Bs ]
Ene 200 560Feb 125 410Mar 300 630Abr 250 840May 330 930Jun 535 1060Jul 480 1110
Ago 350 850Sep 240 700Oct 180 760Nov 390 745Dic 160 610
y = 1,3591x + 366,15R² = 0,7194
0
200
400
600
800
1000
1200
0 100 200 300 400 500 600
Ventas
En la calculadora....
Uso de la calculadora para realizar un análisis de Regresión Lineal
Modelo: CASIO fx82 MS o similar (seleccionador GRIS)
1. Seleccionar el modo de Regresión Lineal......MODE – REG—LIN
2. Limpiar la memoria estadistica................SHIFT– MODE– SCL
3. Introducir las parejas de datos................18 6 .........
4. Luego, de introducir la última pareja de datos: Busca los valores de :
A= punto de corte de la recta con el eja “y”
B= pendiente de la recta
r= coeficiente de correlación
5. Replay a la derecha hasta encontrar A , B, y r
, M+
feb-16 12
feb-16 13
Fuente: http://www.ingenieriaindustrialonline.com/herramientas-para-el-ingeniero-
industrial/pron%C3%B3stico-de-ventas/regresi%C3%B3n-lineal/
Medida de asociación entre las variables “x” y “y”,
Su valor varía entre -1 y +1.
Coeficiente de Correlación
Visualización de CorrelaciónProgramado por Erich Neuwirth
target value -0,6
empirical
(data) value -0,6122
-3
-2
-1
0
1
2
3
-3 -2 -1 0 1 2 3
Desplace la
barra para
cambiar la
correlación
Coeficiente de correlación ( r )
feb-16 14
Diagramas de Dispersión
No hay evidencia de que
x se relacione con yfeb-16 15
Visualizando los tipos de relación entre variables
feb-16 16
Modelos No Lineales
Error Estándar de Estimación. Cómo se interpreta
Una forma de ver el error estándar de estimación es concebirlo como la herramienta estadística que podemos usar para
hacer un enunciado de probabilidad sobre el intervalo alrededor del valor estimado de Y gorrito, dentro del cual cae el valor
real de Y. Podemos ver por ejemplo , en la Figura 12-12, que podemos estar 95,5% seguros que el valor real de Y caerá
dentro de DOS ERRORES ESTANDAR del valor estimado de Y gorrito. Llamamos a estos intervalos , alrededor de la Y gorrito
(estimada) INTERVALOS DE PREDICCIÓN APROXIMADA
FUENTE: LEVIN-RUBIN (1996) ESTADISTICA PARA ADMINISTRADORES. Pag. 674feb-16 17
Restricciones y Limitaciones
Al hacer predicciones con base en la recta de mejor ajuste,esnecesario observar las siguientes restricciones
La ecuación debe usarse solo para
hacer estimaciones
sobre la población de la cual se
extrajo la muestra
La ecuación debe usarse solo dentro del
dominio muestral de la variable de
entrada (x)
Si la muestra fue tomada en el año 2000, no espere
que los resultados sean válidos para
el año 1950 o para el año 2006
Advertencia
No se debe esperar que el valor estimado ocurra exactamente. La interpretación es la siguiente:
“ygorrito 1” es el valor promedio de la cantidad de docenas
vendidas, sólo para las veces que mantuve el precio de
“X1” bolívares