CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS ... · Modelos Multivariantes 6 Nadie duda...

27
CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES TEMA I

Transcript of CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS ... · Modelos Multivariantes 6 Nadie duda...

CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES

TEMA I

Modelos Multivariantes 2

Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística

Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas 3-11.

Introducción al Análisis Multivariante. En Rial, A. y Varela, J. (2008).

Estadística Práctica para la Investigación en Ciencias de la Salud.

Coruña: Netbiblo. Páginas 189-199.

LECTURA OBLIGATORIA

Modelos Multivariantes 3

ALGUNOS CONCEPTOS PREVIOS

Tipos de Variables y Niveles de medida Proceso de datos y Análisis de datos Estadística y niveles de análisis Validez Interna, Externa y Ecológica

Error Tipo I () y Error Tipo II ()

Significación estadística y significación práctica

Contraste estadístico

Supuestos para el análisis de datos

Pruebas paramétricas y no paramétricas

Matriz (tipos de matrices)

Correlación y covarianza

Coeficientes de correlación

Regresión

Modelos Multivariantes 4

EL ANÁLISIS ESTADÍSTICO

La ESTADÍSTICA como un cuadro de herramientas. 3

niveles de análisis:

Nivel 1: UNIVARIADO. Resumir e ilustrar la información contenida

en una matriz de datos

Nivel 2: BIVARIADO. Contrastar hipótesis, comparar el

comportamiento de dos o más grupos o analizar la relación entre

pares de variables

Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o

funciones que permitan explicar unas variables a partir de otras o

identificar variables latentes para resumir la información

Modelos Multivariantes 5

La selección de la Prueba Estadística

¿Qué queremos hacer? ¿en qué Nivel de Análisis nos

situamos?

Nivel 1: UNIVARIADO. Estadísticos descriptivos: índices de tendencia

central, de variabilidad, de distribución, posición, etc.

Nivel 2: BIVARIADO. Contrastes paramétricos vs. no paramétricos,

análisis de correlaciones.

Nivel 3: MULTIVARIANTE. Técnicas multivariantes de Dependencia

(Regresión Lineal, Regresión Logística, Discriminante, Anova,

Manova..) y de Interdependencia (Factorial, Correspondencias,

Cluster,...)

Modelos Multivariantes 6

Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores.

Los científicos sociales son conscientes de que gran parte de los fenómenos se explican por la intervención de múltiples variables.

Los investigadores necesitan herramientas estadísticas adecuadas para comprobar cómo distintas variables se combinan a la hora de explicar los comportamientos objeto de estudio.

La mejor forma de representar el conocimiento que poseemos de la

realidad y de las leyes que la rigen es la elaboración de modelos.

Importancia de lo MULTIVARIANTE

Modelos Multivariantes 7

Surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en la realidad, sintetizando los aspectos más relevantes y perdiendo el mínimo de información posible.

Útil porque permite descubrir estructuras, establecer relaciones o contrastar hipótesis globales, reflejando los mecanismos que actúan para determinar la conducta humana de una manera más adecuada, ya que está multideterminada.

KENDALL lo define como “una extensión del análisis univariable y bivariable al análisis simultáneo de más de dos variables en un muestreo de observaciones”. Es una definición meramente instrumental, ya que no recoge el enfoque de la MODELIZACIÓN ESTADÍSTICA. ¿OTRAS?

ANÁLISIS MULTIVARIANTE

Modelos Multivariantes 8

MODELOS

¿Qué es un MODELO?. Una representación formal,

estructurada, concisa y clara de la realidad, que permite recoger

y explicar sus propiedades y las leyes que la rigen, posibilitando

la realización de predicciones.

Modelos matemáticos. Son formulaciones matemáticas de una

situación, que permiten hacer predicciones en torno a la

distribución de los acontecimientos.

Los MODELOS ESTADÍSTICOS son un tipo concreto de modelos

matemáticos elaborados a partir de los datos de una muestra.

Tienen un componente de inferencia.

Modelos Multivariantes 9

MODELOS ESTADÍSTICOS

Los Modelos Estadísticos contienen una parte sistemática (S) y una parte aleatoria (A).

La combinación de ambos componentes debe ser capaz de reproducir el objeto de interés científico (Y).

Aunque existen multitud de formas de vincular los dos elementos de un modelo estadístico, la primera tentativa y la más recurrida, por su simplicidad, es la forma lineal, sumando ambos componentes:

Y S A

Modelos Multivariantes 10

MODELOS ESTADÍSTICOS

La parte aleatoria se suele denominar término de error y acostumbra a representarse por la letra E. La parte sistemática S suele incluir más de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemáticos, que representen el efecto simultáneo de diversas variables. En consecuencia el modelo puede expresarse del siguiente modo:

( )Y f X E

donde f (X) representa una combinación lineal de las variables explicativas, por ejemplo, f(X) = 1 X1 + 2 X2, siendo 1 y 2 coeficientes que representan el peso, efecto o importancia relativa de cada variable explicativa.

Modelos Multivariantes 11

El investigador debe recurrir a un modelo concreto, de la complejidad necesaria, para adaptarse al fenómeno real que pretende explicar.

La estrategia habitual, cuando el problema de investigación es relativamente simple, es la de intentar explicarlo a través de un modelo lineal. De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulación matemática.

La determinación del modelo no es una cuestión irrelevante, sino tal vez el mayor reto en el desarrollo de la investigación.

Además, el investigador debe optar siempre por el modelo más simple y parsimonioso de los plausibles.

En definitiva...

Modelos Multivariantes 12

RAZONES DE LA EXPANSIÓN

1.Necesidades de investigación. La complejidad de los fenómenos sociales requiere un tratamiento de datos multidimensional

2.Utilidad en numerosos campos

3.El desarrollo de la informática y los ordenadores. Posibilidad de realizar cálculos complejos en pocos segundos

4.Abundante bibliografía aplicada (artículos, manuales y series monográficas)

5.Proliferación de la investigación de mercados y los estudios de opinión

ANÁLISIS MULTIVARIANTE

Modelos Multivariantes 13

PELIGROS y PROBLEMAS:

Olvido de la teoría

Fácil estimación y difícil interpretación

Incluir demasiadas variables (en contra de la parsimonia)

Incumplimento de Supuestos

Casos anómalos

Tamaño muestral (arma de doble filo)

Relevancia conceptual ≠ significación estadística

ANÁLISIS MULTIVARIANTE

Modelos Multivariantes 14

CONFUSIÓN TERMINOLÓGICA. Conceptos relacionados:

– Modelos, métodos, técnicas y análisis

– Multivariantes, multivariables, multivariados

Herramientas estadísticas que permiten analizar un conjunto de variables de manera simultánea y poner a prueba distintos modelos para explicar las relaciones entre ellas.

Muy diversas – Regresión Lineal, Análisis Discriminante, Regresión logística, Análisis de

Varianza, Análisis Conjunto, Análisis de Supervivencia, Análisis de Estructuras de Covarianza (Ecuaciones Estructurales), …

– Análisis Factorial, Análisis de Correspondencias, Análisis de Conglomerados, Escalamiento Multidimensional, Análisis Log-Linear, …

TÉCNICAS MULTIVARIANTES

Modelos Multivariantes 15

I.N. SHETH, 2 grandes preguntas:

¿Son unas variables dependientes de otras?

¿Cuáles son las propiedades de los datos?

2 grandes tipos:

Métodos de Dependencia: Regresión, Discriminante, Análisis de Varianza, Análisis Conjunto

Métodos de Interdependencia :Cluster, Factorial, Correspondencias, Escalamiento

Métodos métricos vs. no métricos

CLASIFICACIÓN

Modelos Multivariantes 16

Todas las técnicas Multivariantes

¿Algunas de las variables son

dependientes de otras?

NO SÍ

Reciben el nombre de Métodos de

Interdependencia

Reciben el nombre de Métodos de Dependencia

No se designa ninguna variable como si se hubiesen pronosticado mediante otras variables. Todas son tomadas como un conjunto que interesa al investigador.

Análisis Factorial, Análisis de Conglomerados, Escalamiento Multidimensional

Se especifican una o más variables como si se hubiesen pronosticado (VD) mediante un conjunto de VI.

Análisis de Regresión, Análisis Conjunto, Análisis Discriminante, Análisis de Varianza

Modelos Multivariantes 17

OBJETIVO: Explicar o predecir una variable Criterio a partir de

una o varias variables predictoras

Y’ = a + b1X1 + b2X2 +…+ bnXn

EJEMPLO: Predecir las ventas a partir de la inversión en

publicidad, nº de tiendas, descuento aplicado, etc.

CONDICIÓN: Predictores y Criterio cuantitativos

Simple o Múltiple Caso especial: predictores categóricos (Regresión con variables

ficticias: DUMMY)

REGRESIÓN LINEAL

Modelos Multivariantes 18

OBJETIVO: Identificar funciones capaces de separar dos o más grupos

de individuos según sus puntuaciones en una serie de variables, con el fin

de localizar las variables que contribuyen en mayor grado a discriminar a

los sujetos de los diferentes grupos establecidos a priori. Técnica de

clasificación. Y1 = X1 + X2 + X3 + ... + Xn

(no métrica) (métricas)

Obtener una función discriminante del tipo Zjk = a + W1X1+ W2X2 + ... + WjXk

EJEMPLO: Predecir el voto a partir de los ingresos económicos, la edad…

CONDICIÓN: Predictores cuantitativos y Criterio categórico

Simple o Múltiple (según el criterio sea dicotómico ó politómico)

ANÁLISIS DISCRIMINANTE

Modelos Multivariantes 19

OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo,

a partir de sus puntuaciones en una serie de variables independientes o

predictores (similar al discriminante). Estimar la probabilidad de que se de

un evento.

EJEMPLO: Predecir si un alumno va a aprobar o no en función de las horas

de estudio, frecuencia de asistencia a clase, estatus socioeconómico

CONDICIÓN: VI métricas o no métricas y VD categórica

Permite trabajar con predictores cualitativos y/o categóricos

Logística Binaria y Multinomial

REGRESIÓN LOGÍSTICA

Modelos Multivariantes 20

OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia

los objetos, estimando la importancia relativa que le conceden a cada uno

de los atributos o características de éste.

EJEMPLO: Explicar las preferencias de las amas de casa hacia las

diferentes opciones de LECHE

CONDICIÓN: VI categórica (atributos) y VD ordinal

Muy utilizado en Marketing (diseño de nuevos productos, test de envases,

elasticidad del precio, Identificación del producto ideal, segmentación de

mercados, simulaciones, etc.)

ANÁLISIS CONJUNTO

Modelos Multivariantes 21

OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre

un evento, el RIESGO de…

EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de

pacientes de una determinada patología en función del tratamiento

recibido, edad, etc.

CONDICIÓN (3 variables diferentes):

DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)

DE CENSURA: Si ha ocurrido o no el evento (dicotómica)

EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)

ANÁLISIS DE SUPERVIVENCIA

Modelos Multivariantes 22

OBJETIVO: Determinar e qué medida una VD está influenciada por una o

varias VI. Comprobar si existe un efecto significativo de un “Tratamiento”

EJEMPLO: Comprobar si existe un efecto significativo del consumo de

alcohol sobre el rendimiento atencional

CONDICIÓN: VI categórica (factores) y VD cuantitativa

Ideal para experimentos

Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños factoriales)

MANOVA (Análisis Multivariante de la Varianza: varias VD)

ANÁLISIS DE VARIANZA

Modelos Multivariantes 23

OBJETIVO: Reducción de datos. A partir de la relación entre variables

observadas identificar FACTORES o variables latentes

EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una misma

dimensión o factor de evaluación

CONDICIÓN: Variables cuantitativas

Exploratorio (AFE): Componentes Principales

Confirmatorio (AFC): LISREL, AMOS

ANÁLISIS FACTORIAL

Modelos Multivariantes 24

ANÁLISIS DE

CORRESPONDENCIAS

OBJETIVO: Reducción de datos. A partir de la relación entre variables

observadas identificar DIMENSIONES o variables latentes

EJEMPLO: Obtener un Mapa de Posicionamiento de los países turísticos

europeos, identificando las dimensiones subyacentes

CONDICIÓN: Variables cualitativas

Un subtipo de Análisis Factorial, ideal para tablas de asociación (recogida

de datos rápida)

Muy utilizado en Marketing

Modelos Multivariantes 25

OBJETIVO: Identificar grupos grupos homogéneos de sujetos u objetos a

partir de su puntuación en una serie de variables.

EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos de

consumo

CONDICIÓN: Variables medidas en la misma escala

También llamado Cluster Analysis

Técnica de Clasificación

Los grupos no son conocidos a priori

ANÁLISIS DE

CONGLOMERADOS

Modelos Multivariantes 26

OBJETIVO: Utilizar las proximidades entre objetos para realizar una

representación espacial de los mismos, identificando las dimensiones

subyacentes

EJEMPLO: Representación espacial del mercado de la cerveza en Galicia

CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos de

tareas)

Gran Utilidad en MKT e investigación social

ESCALAMIENTO

MULTIDIMENSIONAL

Modelos Multivariantes 27

OTRAS TÉCNICAS

Correlación Canónica: Analizar relaciones entre un grupo de variables

predictoras y un grupo de variables criterio.

Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:

Permite comprobar en qué medida un modelo teórico se ajusta a los datos

empíricos (Path Analysis). Programas estadísticos: LISREL y AMOS

Modelos Log-Lineales: Permite poner a pruebas modelos que postulan

distinto tipo de relaciones entre dos o más variables categóricas (Incluyen

los modelos LOGIT, PROBIT, etc.)