Regresion
-
Upload
vsuarezf2732 -
Category
Documents
-
view
4 -
download
1
description
Transcript of Regresion
-
CONTEXTUALIZACIN Y REVISIN GENERAL DE LAS TCNICAS MULTIVARIANTES
TEMA I
-
Modelos Multivariantes 2
Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadstica
Prctica para la Investigacin en Ciencias de la Salud. Corua: Netbiblo. Pginas 3-11.
Introduccin al Anlisis Multivariante. En Rial, A. y Varela, J. (2008).
Estadstica Prctica para la Investigacin en Ciencias de la Salud.
Corua: Netbiblo. Pginas 189-199.
LECTURA OBLIGATORIA
-
Modelos Multivariantes 3
ALGUNOS CONCEPTOS PREVIOS
Tipos de Variables y Niveles de medida Proceso de datos y Anlisis de datos Estadstica y niveles de anlisis Validez Interna, Externa y Ecolgica Error Tipo I () y Error Tipo II () Significacin estadstica y significacin prctica Contraste estadstico Supuestos para el anlisis de datos Pruebas paramtricas y no paramtricas Matriz (tipos de matrices) Correlacin y covarianza Coeficientes de correlacin Regresin
-
Modelos Multivariantes 4
EL ANLISIS ESTADSTICO
La ESTADSTICA como un cuadro de herramientas. 3
niveles de anlisis:
Nivel 1: UNIVARIADO. Resumir e ilustrar la informacin contenida en una matriz de datos
Nivel 2: BIVARIADO. Contrastar hiptesis, comparar el comportamiento de dos o ms grupos o analizar la relacin entre
pares de variables
Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o funciones que permitan explicar unas variables a partir de otras o
identificar variables latentes para resumir la informacin
-
Modelos Multivariantes 5
La seleccin de la Prueba Estadstica
Qu queremos hacer? en qu Nivel de Anlisis nos
situamos?
Nivel 1: UNIVARIADO. Estadsticos descriptivos: ndices de tendencia central, de variabilidad, de distribucin, posicin, etc.
Nivel 2: BIVARIADO. Contrastes paramtricos vs. no paramtricos, anlisis de correlaciones.
Nivel 3: MULTIVARIANTE. Tcnicas multivariantes de Dependencia (Regresin Lineal, Regresin Logstica, Discriminante, Anova,
Manova..) y de Interdependencia (Factorial, Correspondencias,
Cluster,...)
-
Modelos Multivariantes 6
Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores.
Los cientficos sociales son conscientes de que gran parte de los fenmenos se explican por la intervencin de mltiples variables.
Los investigadores necesitan herramientas estadsticas adecuadas para comprobar cmo distintas variables se combinan a la hora de explicar los comportamientos objeto de estudio.
La mejor forma de representar el conocimiento que poseemos de la realidad y de las leyes que la rigen es la elaboracin de modelos.
Importancia de lo MULTIVARIANTE
-
Modelos Multivariantes 7
Surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en la realidad, sintetizando los aspectos ms relevantes y perdiendo el mnimo de informacin posible.
til porque permite descubrir estructuras, establecer relaciones o contrastar hiptesis globales, reflejando los mecanismos que actan para determinar la conducta humana de una manera ms adecuada, ya que est multideterminada.
KENDALL lo define como una extensin del anlisis univariable y bivariable al anlisis simultneo de ms de dos variables en un muestreo de observaciones. Es una definicin meramente instrumental, ya que no recoge el enfoque de la MODELIZACIN ESTADSTICA. OTRAS?
ANLISIS MULTIVARIANTE
-
Modelos Multivariantes 8
MODELOS
Qu es un MODELO?. Una representacin formal,
estructurada, concisa y clara de la realidad, que permite recoger
y explicar sus propiedades y las leyes que la rigen, posibilitando
la realizacin de predicciones.
Modelos matemticos. Son formulaciones matemticas de una
situacin, que permiten hacer predicciones en torno a la
distribucin de los acontecimientos.
Los MODELOS ESTADSTICOS son un tipo concreto de modelos
matemticos elaborados a partir de los datos de una muestra.
Tienen un componente de inferencia.
-
Modelos Multivariantes 9
MODELOS ESTADSTICOS
Los Modelos Estadsticos contienen una parte sistemtica (S) y una parte aleatoria (A).
La combinacin de ambos componentes debe ser capaz de reproducir el objeto de inters cientfico (Y).
Aunque existen multitud de formas de vincular los dos elementos de un modelo estadstico, la primera tentativa y la ms recurrida, por su simplicidad, es la forma lineal, sumando ambos componentes:
Y S A
-
Modelos Multivariantes 10
MODELOS ESTADSTICOS
La parte aleatoria se suele denominar trmino de error y acostumbra a representarse por la letra E. La parte sistemtica S suele incluir ms de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemticos, que representen el efecto simultneo de diversas variables. En consecuencia el modelo puede expresarse del siguiente modo:
( )Y f X E
donde f (X) representa una combinacin lineal de las variables explicativas, por ejemplo, f(X) = 1 X1 + 2 X2, siendo 1 y 2 coeficientes que representan el peso, efecto o importancia relativa de cada variable explicativa.
-
Modelos Multivariantes 11
El investigador debe recurrir a un modelo concreto, de la complejidad necesaria, para adaptarse al fenmeno real que pretende explicar.
La estrategia habitual, cuando el problema de investigacin es relativamente simple, es la de intentar explicarlo a travs de un modelo lineal. De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulacin matemtica.
La determinacin del modelo no es una cuestin irrelevante, sino tal vez el mayor reto en el desarrollo de la investigacin.
Adems, el investigador debe optar siempre por el modelo ms simple y parsimonioso de los plausibles.
En definitiva...
-
Modelos Multivariantes 12
RAZONES DE LA EXPANSIN
1.Necesidades de investigacin. La complejidad de los fenmenos sociales requiere un tratamiento de datos multidimensional
2.Utilidad en numerosos campos
3.El desarrollo de la informtica y los ordenadores. Posibilidad de realizar clculos complejos en pocos segundos
4.Abundante bibliografa aplicada (artculos, manuales y series monogrficas)
5.Proliferacin de la investigacin de mercados y los estudios de opinin
ANLISIS MULTIVARIANTE
-
Modelos Multivariantes 13
PELIGROS y PROBLEMAS:
Olvido de la teora
Fcil estimacin y difcil interpretacin
Incluir demasiadas variables (en contra de la parsimonia)
Incumplimento de Supuestos
Casos anmalos
Tamao muestral (arma de doble filo)
Relevancia conceptual significacin estadstica
ANLISIS MULTIVARIANTE
-
Modelos Multivariantes 14
CONFUSIN TERMINOLGICA. Conceptos relacionados:
Modelos, mtodos, tcnicas y anlisis Multivariantes, multivariables, multivariados
Herramientas estadsticas que permiten analizar un conjunto de variables de manera simultnea y poner a prueba distintos modelos para explicar las relaciones entre ellas.
Muy diversas Regresin Lineal, Anlisis Discriminante, Regresin logstica, Anlisis de
Varianza, Anlisis Conjunto, Anlisis de Supervivencia, Anlisis de Estructuras de Covarianza (Ecuaciones Estructurales),
Anlisis Factorial, Anlisis de Correspondencias, Anlisis de Conglomerados, Escalamiento Multidimensional, Anlisis Log-Linear,
TCNICAS MULTIVARIANTES
-
Modelos Multivariantes 15
I.N. SHETH, 2 grandes preguntas:
Son unas variables dependientes de otras? Cules son las propiedades de los datos?
2 grandes tipos:
Mtodos de Dependencia: Regresin, Discriminante, Anlisis de Varianza, Anlisis Conjunto
Mtodos de Interdependencia :Cluster, Factorial, Correspondencias, Escalamiento
Mtodos mtricos vs. no mtricos
CLASIFICACIN
-
Modelos Multivariantes 16
Todas las tcnicas Multivariantes
Algunas de las variables son
dependientes de otras?
NO S
Reciben el nombre de Mtodos de
Interdependencia
Reciben el nombre de Mtodos de Dependencia
No se designa ninguna variable como si se hubiesen pronosticado mediante otras variables. Todas son tomadas como un conjunto que interesa al investigador.
Anlisis Factorial, Anlisis de Conglomerados, Escalamiento Multidimensional
Se especifican una o ms variables como si se hubiesen pronosticado (VD) mediante un conjunto de VI.
Anlisis de Regresin, Anlisis Conjunto, Anlisis Discriminante, Anlisis de Varianza
-
Modelos Multivariantes 17
OBJETIVO: Explicar o predecir una variable Criterio a partir de
una o varias variables predictoras
Y = a + b1X1 + b2X2 ++ bnXn EJEMPLO: Predecir las ventas a partir de la inversin en
publicidad, n de tiendas, descuento aplicado, etc.
CONDICIN: Predictores y Criterio cuantitativos
Simple o Mltiple Caso especial: predictores categricos (Regresin con variables
ficticias: DUMMY)
REGRESIN LINEAL
-
Modelos Multivariantes 18
OBJETIVO: Identificar funciones capaces de separar dos o ms grupos de individuos segn sus puntuaciones en una serie de variables, con el fin
de localizar las variables que contribuyen en mayor grado a discriminar a
los sujetos de los diferentes grupos establecidos a priori. Tcnica de
clasificacin. Y1 = X1 + X2 + X3 + ... + Xn
(no mtrica) (mtricas)
Obtener una funcin discriminante del tipo Zjk = a + W1X1+ W2X2 + ... + WjXk
EJEMPLO: Predecir el voto a partir de los ingresos econmicos, la edad
CONDICIN: Predictores cuantitativos y Criterio categrico
Simple o Mltiple (segn el criterio sea dicotmico politmico)
ANLISIS DISCRIMINANTE
-
Modelos Multivariantes 19
OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo,
a partir de sus puntuaciones en una serie de variables independientes o
predictores (similar al discriminante). Estimar la probabilidad de que se de
un evento.
EJEMPLO: Predecir si un alumno va a aprobar o no en funcin de las horas
de estudio, frecuencia de asistencia a clase, estatus socioeconmico
CONDICIN: VI mtricas o no mtricas y VD categrica
Permite trabajar con predictores cualitativos y/o categricos
Logstica Binaria y Multinomial
REGRESIN LOGSTICA
-
Modelos Multivariantes 20
OBJETIVO: Entender cmo conforman los individuos sus preferencias hacia
los objetos, estimando la importancia relativa que le conceden a cada uno
de los atributos o caractersticas de ste.
EJEMPLO: Explicar las preferencias de las amas de casa hacia las
diferentes opciones de LECHE
CONDICIN: VI categrica (atributos) y VD ordinal
Muy utilizado en Marketing (diseo de nuevos productos, test de envases, elasticidad del precio, Identificacin del producto ideal, segmentacin de
mercados, simulaciones, etc.)
ANLISIS CONJUNTO
-
Modelos Multivariantes 21
OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre
un evento, el RIESGO de
EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de
pacientes de una determinada patologa en funcin del tratamiento
recibido, edad, etc.
CONDICIN (3 variables diferentes):
DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa) DE CENSURA: Si ha ocurrido o no el evento (dicotmica) EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, )
ANLISIS DE SUPERVIVENCIA
-
Modelos Multivariantes 22
OBJETIVO: Determinar e qu medida una VD est influenciada por una o
varias VI. Comprobar si existe un efecto significativo de un Tratamiento
EJEMPLO: Comprobar si existe un efecto significativo del consumo de
alcohol sobre el rendimiento atencional
CONDICIN: VI categrica (factores) y VD cuantitativa
Ideal para experimentos Una o varias VAS (VI): ONEWAY ANOVA (Diseos factoriales) MANOVA (Anlisis Multivariante de la Varianza: varias VD)
ANLISIS DE VARIANZA
-
Modelos Multivariantes 23
OBJETIVO: Reduccin de datos. A partir de la relacin entre variables
observadas identificar FACTORES o variables latentes
EJEMPLO: Agrupar tems de una escala y etiquetarlos bajo una misma
dimensin o factor de evaluacin
CONDICIN: Variables cuantitativas
Exploratorio (AFE): Componentes Principales Confirmatorio (AFC): LISREL, AMOS
ANLISIS FACTORIAL
-
Modelos Multivariantes 24
ANLISIS DE
CORRESPONDENCIAS
OBJETIVO: Reduccin de datos. A partir de la relacin entre variables
observadas identificar DIMENSIONES o variables latentes
EJEMPLO: Obtener un Mapa de Posicionamiento de los pases tursticos
europeos, identificando las dimensiones subyacentes
CONDICIN: Variables cualitativas
Un subtipo de Anlisis Factorial, ideal para tablas de asociacin (recogida de datos rpida)
Muy utilizado en Marketing
-
Modelos Multivariantes 25
OBJETIVO: Identificar grupos grupos homogneos de sujetos u objetos a
partir de su puntuacin en una serie de variables.
EJEMPLO: identificar segmentos de jvenes en funcin de sus hbitos de
consumo
CONDICIN: Variables medidas en la misma escala
Tambin llamado Cluster Analysis Tcnica de Clasificacin Los grupos no son conocidos a priori
ANLISIS DE
CONGLOMERADOS
-
Modelos Multivariantes 26
OBJETIVO: Utilizar las proximidades entre objetos para realizar una
representacin espacial de los mismos, identificando las dimensiones
subyacentes
EJEMPLO: Representacin espacial del mercado de la cerveza en Galicia
CONDICIN: Gran versatilidad en la recogida de datos (distintos tipos de
tareas)
Gran Utilidad en MKT e investigacin social
ESCALAMIENTO
MULTIDIMENSIONAL
-
Modelos Multivariantes 27
OTRAS TCNICAS
Correlacin Cannica: Analizar relaciones entre un grupo de variables
predictoras y un grupo de variables criterio.
Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:
Permite comprobar en qu medida un modelo terico se ajusta a los datos
empricos (Path Analysis). Programas estadsticos: LISREL y AMOS
Modelos Log-Lineales: Permite poner a pruebas modelos que postulan
distinto tipo de relaciones entre dos o ms variables categricas (Incluyen
los modelos LOGIT, PROBIT, etc.)