CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS ... · Modelos Multivariantes 6 Nadie duda...
Transcript of CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS ... · Modelos Multivariantes 6 Nadie duda...
Modelos Multivariantes 2
Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística
Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas 3-11.
Introducción al Análisis Multivariante. En Rial, A. y Varela, J. (2008).
Estadística Práctica para la Investigación en Ciencias de la Salud.
Coruña: Netbiblo. Páginas 189-199.
LECTURA OBLIGATORIA
Modelos Multivariantes 3
ALGUNOS CONCEPTOS PREVIOS
Tipos de Variables y Niveles de medida Proceso de datos y Análisis de datos Estadística y niveles de análisis Validez Interna, Externa y Ecológica
Error Tipo I () y Error Tipo II ()
Significación estadística y significación práctica
Contraste estadístico
Supuestos para el análisis de datos
Pruebas paramétricas y no paramétricas
Matriz (tipos de matrices)
Correlación y covarianza
Coeficientes de correlación
Regresión
Modelos Multivariantes 4
EL ANÁLISIS ESTADÍSTICO
La ESTADÍSTICA como un cuadro de herramientas. 3
niveles de análisis:
Nivel 1: UNIVARIADO. Resumir e ilustrar la información contenida
en una matriz de datos
Nivel 2: BIVARIADO. Contrastar hipótesis, comparar el
comportamiento de dos o más grupos o analizar la relación entre
pares de variables
Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o
funciones que permitan explicar unas variables a partir de otras o
identificar variables latentes para resumir la información
Modelos Multivariantes 5
La selección de la Prueba Estadística
¿Qué queremos hacer? ¿en qué Nivel de Análisis nos
situamos?
Nivel 1: UNIVARIADO. Estadísticos descriptivos: índices de tendencia
central, de variabilidad, de distribución, posición, etc.
Nivel 2: BIVARIADO. Contrastes paramétricos vs. no paramétricos,
análisis de correlaciones.
Nivel 3: MULTIVARIANTE. Técnicas multivariantes de Dependencia
(Regresión Lineal, Regresión Logística, Discriminante, Anova,
Manova..) y de Interdependencia (Factorial, Correspondencias,
Cluster,...)
Modelos Multivariantes 6
Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores.
Los científicos sociales son conscientes de que gran parte de los fenómenos se explican por la intervención de múltiples variables.
Los investigadores necesitan herramientas estadísticas adecuadas para comprobar cómo distintas variables se combinan a la hora de explicar los comportamientos objeto de estudio.
La mejor forma de representar el conocimiento que poseemos de la
realidad y de las leyes que la rigen es la elaboración de modelos.
Importancia de lo MULTIVARIANTE
Modelos Multivariantes 7
Surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en la realidad, sintetizando los aspectos más relevantes y perdiendo el mínimo de información posible.
Útil porque permite descubrir estructuras, establecer relaciones o contrastar hipótesis globales, reflejando los mecanismos que actúan para determinar la conducta humana de una manera más adecuada, ya que está multideterminada.
KENDALL lo define como “una extensión del análisis univariable y bivariable al análisis simultáneo de más de dos variables en un muestreo de observaciones”. Es una definición meramente instrumental, ya que no recoge el enfoque de la MODELIZACIÓN ESTADÍSTICA. ¿OTRAS?
ANÁLISIS MULTIVARIANTE
Modelos Multivariantes 8
MODELOS
¿Qué es un MODELO?. Una representación formal,
estructurada, concisa y clara de la realidad, que permite recoger
y explicar sus propiedades y las leyes que la rigen, posibilitando
la realización de predicciones.
Modelos matemáticos. Son formulaciones matemáticas de una
situación, que permiten hacer predicciones en torno a la
distribución de los acontecimientos.
Los MODELOS ESTADÍSTICOS son un tipo concreto de modelos
matemáticos elaborados a partir de los datos de una muestra.
Tienen un componente de inferencia.
Modelos Multivariantes 9
MODELOS ESTADÍSTICOS
Los Modelos Estadísticos contienen una parte sistemática (S) y una parte aleatoria (A).
La combinación de ambos componentes debe ser capaz de reproducir el objeto de interés científico (Y).
Aunque existen multitud de formas de vincular los dos elementos de un modelo estadístico, la primera tentativa y la más recurrida, por su simplicidad, es la forma lineal, sumando ambos componentes:
Y S A
Modelos Multivariantes 10
MODELOS ESTADÍSTICOS
La parte aleatoria se suele denominar término de error y acostumbra a representarse por la letra E. La parte sistemática S suele incluir más de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemáticos, que representen el efecto simultáneo de diversas variables. En consecuencia el modelo puede expresarse del siguiente modo:
( )Y f X E
donde f (X) representa una combinación lineal de las variables explicativas, por ejemplo, f(X) = 1 X1 + 2 X2, siendo 1 y 2 coeficientes que representan el peso, efecto o importancia relativa de cada variable explicativa.
Modelos Multivariantes 11
El investigador debe recurrir a un modelo concreto, de la complejidad necesaria, para adaptarse al fenómeno real que pretende explicar.
La estrategia habitual, cuando el problema de investigación es relativamente simple, es la de intentar explicarlo a través de un modelo lineal. De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulación matemática.
La determinación del modelo no es una cuestión irrelevante, sino tal vez el mayor reto en el desarrollo de la investigación.
Además, el investigador debe optar siempre por el modelo más simple y parsimonioso de los plausibles.
En definitiva...
Modelos Multivariantes 12
RAZONES DE LA EXPANSIÓN
1.Necesidades de investigación. La complejidad de los fenómenos sociales requiere un tratamiento de datos multidimensional
2.Utilidad en numerosos campos
3.El desarrollo de la informática y los ordenadores. Posibilidad de realizar cálculos complejos en pocos segundos
4.Abundante bibliografía aplicada (artículos, manuales y series monográficas)
5.Proliferación de la investigación de mercados y los estudios de opinión
ANÁLISIS MULTIVARIANTE
Modelos Multivariantes 13
PELIGROS y PROBLEMAS:
Olvido de la teoría
Fácil estimación y difícil interpretación
Incluir demasiadas variables (en contra de la parsimonia)
Incumplimento de Supuestos
Casos anómalos
Tamaño muestral (arma de doble filo)
Relevancia conceptual ≠ significación estadística
ANÁLISIS MULTIVARIANTE
Modelos Multivariantes 14
CONFUSIÓN TERMINOLÓGICA. Conceptos relacionados:
– Modelos, métodos, técnicas y análisis
– Multivariantes, multivariables, multivariados
Herramientas estadísticas que permiten analizar un conjunto de variables de manera simultánea y poner a prueba distintos modelos para explicar las relaciones entre ellas.
Muy diversas – Regresión Lineal, Análisis Discriminante, Regresión logística, Análisis de
Varianza, Análisis Conjunto, Análisis de Supervivencia, Análisis de Estructuras de Covarianza (Ecuaciones Estructurales), …
– Análisis Factorial, Análisis de Correspondencias, Análisis de Conglomerados, Escalamiento Multidimensional, Análisis Log-Linear, …
TÉCNICAS MULTIVARIANTES
Modelos Multivariantes 15
I.N. SHETH, 2 grandes preguntas:
¿Son unas variables dependientes de otras?
¿Cuáles son las propiedades de los datos?
2 grandes tipos:
Métodos de Dependencia: Regresión, Discriminante, Análisis de Varianza, Análisis Conjunto
Métodos de Interdependencia :Cluster, Factorial, Correspondencias, Escalamiento
Métodos métricos vs. no métricos
CLASIFICACIÓN
Modelos Multivariantes 16
Todas las técnicas Multivariantes
¿Algunas de las variables son
dependientes de otras?
NO SÍ
Reciben el nombre de Métodos de
Interdependencia
Reciben el nombre de Métodos de Dependencia
No se designa ninguna variable como si se hubiesen pronosticado mediante otras variables. Todas son tomadas como un conjunto que interesa al investigador.
Análisis Factorial, Análisis de Conglomerados, Escalamiento Multidimensional
Se especifican una o más variables como si se hubiesen pronosticado (VD) mediante un conjunto de VI.
Análisis de Regresión, Análisis Conjunto, Análisis Discriminante, Análisis de Varianza
Modelos Multivariantes 17
OBJETIVO: Explicar o predecir una variable Criterio a partir de
una o varias variables predictoras
Y’ = a + b1X1 + b2X2 +…+ bnXn
EJEMPLO: Predecir las ventas a partir de la inversión en
publicidad, nº de tiendas, descuento aplicado, etc.
CONDICIÓN: Predictores y Criterio cuantitativos
Simple o Múltiple Caso especial: predictores categóricos (Regresión con variables
ficticias: DUMMY)
REGRESIÓN LINEAL
Modelos Multivariantes 18
OBJETIVO: Identificar funciones capaces de separar dos o más grupos
de individuos según sus puntuaciones en una serie de variables, con el fin
de localizar las variables que contribuyen en mayor grado a discriminar a
los sujetos de los diferentes grupos establecidos a priori. Técnica de
clasificación. Y1 = X1 + X2 + X3 + ... + Xn
(no métrica) (métricas)
Obtener una función discriminante del tipo Zjk = a + W1X1+ W2X2 + ... + WjXk
EJEMPLO: Predecir el voto a partir de los ingresos económicos, la edad…
CONDICIÓN: Predictores cuantitativos y Criterio categórico
Simple o Múltiple (según el criterio sea dicotómico ó politómico)
ANÁLISIS DISCRIMINANTE
Modelos Multivariantes 19
OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo,
a partir de sus puntuaciones en una serie de variables independientes o
predictores (similar al discriminante). Estimar la probabilidad de que se de
un evento.
EJEMPLO: Predecir si un alumno va a aprobar o no en función de las horas
de estudio, frecuencia de asistencia a clase, estatus socioeconómico
CONDICIÓN: VI métricas o no métricas y VD categórica
Permite trabajar con predictores cualitativos y/o categóricos
Logística Binaria y Multinomial
REGRESIÓN LOGÍSTICA
Modelos Multivariantes 20
OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia
los objetos, estimando la importancia relativa que le conceden a cada uno
de los atributos o características de éste.
EJEMPLO: Explicar las preferencias de las amas de casa hacia las
diferentes opciones de LECHE
CONDICIÓN: VI categórica (atributos) y VD ordinal
Muy utilizado en Marketing (diseño de nuevos productos, test de envases,
elasticidad del precio, Identificación del producto ideal, segmentación de
mercados, simulaciones, etc.)
ANÁLISIS CONJUNTO
Modelos Multivariantes 21
OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre
un evento, el RIESGO de…
EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de
pacientes de una determinada patología en función del tratamiento
recibido, edad, etc.
CONDICIÓN (3 variables diferentes):
DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)
DE CENSURA: Si ha ocurrido o no el evento (dicotómica)
EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)
ANÁLISIS DE SUPERVIVENCIA
Modelos Multivariantes 22
OBJETIVO: Determinar e qué medida una VD está influenciada por una o
varias VI. Comprobar si existe un efecto significativo de un “Tratamiento”
EJEMPLO: Comprobar si existe un efecto significativo del consumo de
alcohol sobre el rendimiento atencional
CONDICIÓN: VI categórica (factores) y VD cuantitativa
Ideal para experimentos
Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños factoriales)
MANOVA (Análisis Multivariante de la Varianza: varias VD)
ANÁLISIS DE VARIANZA
Modelos Multivariantes 23
OBJETIVO: Reducción de datos. A partir de la relación entre variables
observadas identificar FACTORES o variables latentes
EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una misma
dimensión o factor de evaluación
CONDICIÓN: Variables cuantitativas
Exploratorio (AFE): Componentes Principales
Confirmatorio (AFC): LISREL, AMOS
ANÁLISIS FACTORIAL
Modelos Multivariantes 24
ANÁLISIS DE
CORRESPONDENCIAS
OBJETIVO: Reducción de datos. A partir de la relación entre variables
observadas identificar DIMENSIONES o variables latentes
EJEMPLO: Obtener un Mapa de Posicionamiento de los países turísticos
europeos, identificando las dimensiones subyacentes
CONDICIÓN: Variables cualitativas
Un subtipo de Análisis Factorial, ideal para tablas de asociación (recogida
de datos rápida)
Muy utilizado en Marketing
Modelos Multivariantes 25
OBJETIVO: Identificar grupos grupos homogéneos de sujetos u objetos a
partir de su puntuación en una serie de variables.
EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos de
consumo
CONDICIÓN: Variables medidas en la misma escala
También llamado Cluster Analysis
Técnica de Clasificación
Los grupos no son conocidos a priori
ANÁLISIS DE
CONGLOMERADOS
Modelos Multivariantes 26
OBJETIVO: Utilizar las proximidades entre objetos para realizar una
representación espacial de los mismos, identificando las dimensiones
subyacentes
EJEMPLO: Representación espacial del mercado de la cerveza en Galicia
CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos de
tareas)
Gran Utilidad en MKT e investigación social
ESCALAMIENTO
MULTIDIMENSIONAL
Modelos Multivariantes 27
OTRAS TÉCNICAS
Correlación Canónica: Analizar relaciones entre un grupo de variables
predictoras y un grupo de variables criterio.
Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:
Permite comprobar en qué medida un modelo teórico se ajusta a los datos
empíricos (Path Analysis). Programas estadísticos: LISREL y AMOS
Modelos Log-Lineales: Permite poner a pruebas modelos que postulan
distinto tipo de relaciones entre dos o más variables categóricas (Incluyen
los modelos LOGIT, PROBIT, etc.)