Regresion

27
CONTEXTUALIZACIÓN Y REVISIÓN GENERAL DE LAS TÉCNICAS MULTIVARIANTES TEMA I

description

Regresion

Transcript of Regresion

  • CONTEXTUALIZACIN Y REVISIN GENERAL DE LAS TCNICAS MULTIVARIANTES

    TEMA I

  • Modelos Multivariantes 2

    Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadstica

    Prctica para la Investigacin en Ciencias de la Salud. Corua: Netbiblo. Pginas 3-11.

    Introduccin al Anlisis Multivariante. En Rial, A. y Varela, J. (2008).

    Estadstica Prctica para la Investigacin en Ciencias de la Salud.

    Corua: Netbiblo. Pginas 189-199.

    LECTURA OBLIGATORIA

  • Modelos Multivariantes 3

    ALGUNOS CONCEPTOS PREVIOS

    Tipos de Variables y Niveles de medida Proceso de datos y Anlisis de datos Estadstica y niveles de anlisis Validez Interna, Externa y Ecolgica Error Tipo I () y Error Tipo II () Significacin estadstica y significacin prctica Contraste estadstico Supuestos para el anlisis de datos Pruebas paramtricas y no paramtricas Matriz (tipos de matrices) Correlacin y covarianza Coeficientes de correlacin Regresin

  • Modelos Multivariantes 4

    EL ANLISIS ESTADSTICO

    La ESTADSTICA como un cuadro de herramientas. 3

    niveles de anlisis:

    Nivel 1: UNIVARIADO. Resumir e ilustrar la informacin contenida en una matriz de datos

    Nivel 2: BIVARIADO. Contrastar hiptesis, comparar el comportamiento de dos o ms grupos o analizar la relacin entre

    pares de variables

    Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o funciones que permitan explicar unas variables a partir de otras o

    identificar variables latentes para resumir la informacin

  • Modelos Multivariantes 5

    La seleccin de la Prueba Estadstica

    Qu queremos hacer? en qu Nivel de Anlisis nos

    situamos?

    Nivel 1: UNIVARIADO. Estadsticos descriptivos: ndices de tendencia central, de variabilidad, de distribucin, posicin, etc.

    Nivel 2: BIVARIADO. Contrastes paramtricos vs. no paramtricos, anlisis de correlaciones.

    Nivel 3: MULTIVARIANTE. Tcnicas multivariantes de Dependencia (Regresin Lineal, Regresin Logstica, Discriminante, Anova,

    Manova..) y de Interdependencia (Factorial, Correspondencias,

    Cluster,...)

  • Modelos Multivariantes 6

    Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las organizaciones, es algo complejo y sobre el que confluyen multitud de factores.

    Los cientficos sociales son conscientes de que gran parte de los fenmenos se explican por la intervencin de mltiples variables.

    Los investigadores necesitan herramientas estadsticas adecuadas para comprobar cmo distintas variables se combinan a la hora de explicar los comportamientos objeto de estudio.

    La mejor forma de representar el conocimiento que poseemos de la realidad y de las leyes que la rigen es la elaboracin de modelos.

    Importancia de lo MULTIVARIANTE

  • Modelos Multivariantes 7

    Surge como una forma de hacer asimilable al entendimiento humano gran cantidad de datos que hay en la realidad, sintetizando los aspectos ms relevantes y perdiendo el mnimo de informacin posible.

    til porque permite descubrir estructuras, establecer relaciones o contrastar hiptesis globales, reflejando los mecanismos que actan para determinar la conducta humana de una manera ms adecuada, ya que est multideterminada.

    KENDALL lo define como una extensin del anlisis univariable y bivariable al anlisis simultneo de ms de dos variables en un muestreo de observaciones. Es una definicin meramente instrumental, ya que no recoge el enfoque de la MODELIZACIN ESTADSTICA. OTRAS?

    ANLISIS MULTIVARIANTE

  • Modelos Multivariantes 8

    MODELOS

    Qu es un MODELO?. Una representacin formal,

    estructurada, concisa y clara de la realidad, que permite recoger

    y explicar sus propiedades y las leyes que la rigen, posibilitando

    la realizacin de predicciones.

    Modelos matemticos. Son formulaciones matemticas de una

    situacin, que permiten hacer predicciones en torno a la

    distribucin de los acontecimientos.

    Los MODELOS ESTADSTICOS son un tipo concreto de modelos

    matemticos elaborados a partir de los datos de una muestra.

    Tienen un componente de inferencia.

  • Modelos Multivariantes 9

    MODELOS ESTADSTICOS

    Los Modelos Estadsticos contienen una parte sistemtica (S) y una parte aleatoria (A).

    La combinacin de ambos componentes debe ser capaz de reproducir el objeto de inters cientfico (Y).

    Aunque existen multitud de formas de vincular los dos elementos de un modelo estadstico, la primera tentativa y la ms recurrida, por su simplicidad, es la forma lineal, sumando ambos componentes:

    Y S A

  • Modelos Multivariantes 10

    MODELOS ESTADSTICOS

    La parte aleatoria se suele denominar trmino de error y acostumbra a representarse por la letra E. La parte sistemtica S suele incluir ms de un elemento y, por ello, es frecuente que se desglose en varios componentes sistemticos, que representen el efecto simultneo de diversas variables. En consecuencia el modelo puede expresarse del siguiente modo:

    ( )Y f X E

    donde f (X) representa una combinacin lineal de las variables explicativas, por ejemplo, f(X) = 1 X1 + 2 X2, siendo 1 y 2 coeficientes que representan el peso, efecto o importancia relativa de cada variable explicativa.

  • Modelos Multivariantes 11

    El investigador debe recurrir a un modelo concreto, de la complejidad necesaria, para adaptarse al fenmeno real que pretende explicar.

    La estrategia habitual, cuando el problema de investigacin es relativamente simple, es la de intentar explicarlo a travs de un modelo lineal. De no ser posible, para no encorsetar la realidad, se recurre a un nivel mayor de complejidad en la formulacin matemtica.

    La determinacin del modelo no es una cuestin irrelevante, sino tal vez el mayor reto en el desarrollo de la investigacin.

    Adems, el investigador debe optar siempre por el modelo ms simple y parsimonioso de los plausibles.

    En definitiva...

  • Modelos Multivariantes 12

    RAZONES DE LA EXPANSIN

    1.Necesidades de investigacin. La complejidad de los fenmenos sociales requiere un tratamiento de datos multidimensional

    2.Utilidad en numerosos campos

    3.El desarrollo de la informtica y los ordenadores. Posibilidad de realizar clculos complejos en pocos segundos

    4.Abundante bibliografa aplicada (artculos, manuales y series monogrficas)

    5.Proliferacin de la investigacin de mercados y los estudios de opinin

    ANLISIS MULTIVARIANTE

  • Modelos Multivariantes 13

    PELIGROS y PROBLEMAS:

    Olvido de la teora

    Fcil estimacin y difcil interpretacin

    Incluir demasiadas variables (en contra de la parsimonia)

    Incumplimento de Supuestos

    Casos anmalos

    Tamao muestral (arma de doble filo)

    Relevancia conceptual significacin estadstica

    ANLISIS MULTIVARIANTE

  • Modelos Multivariantes 14

    CONFUSIN TERMINOLGICA. Conceptos relacionados:

    Modelos, mtodos, tcnicas y anlisis Multivariantes, multivariables, multivariados

    Herramientas estadsticas que permiten analizar un conjunto de variables de manera simultnea y poner a prueba distintos modelos para explicar las relaciones entre ellas.

    Muy diversas Regresin Lineal, Anlisis Discriminante, Regresin logstica, Anlisis de

    Varianza, Anlisis Conjunto, Anlisis de Supervivencia, Anlisis de Estructuras de Covarianza (Ecuaciones Estructurales),

    Anlisis Factorial, Anlisis de Correspondencias, Anlisis de Conglomerados, Escalamiento Multidimensional, Anlisis Log-Linear,

    TCNICAS MULTIVARIANTES

  • Modelos Multivariantes 15

    I.N. SHETH, 2 grandes preguntas:

    Son unas variables dependientes de otras? Cules son las propiedades de los datos?

    2 grandes tipos:

    Mtodos de Dependencia: Regresin, Discriminante, Anlisis de Varianza, Anlisis Conjunto

    Mtodos de Interdependencia :Cluster, Factorial, Correspondencias, Escalamiento

    Mtodos mtricos vs. no mtricos

    CLASIFICACIN

  • Modelos Multivariantes 16

    Todas las tcnicas Multivariantes

    Algunas de las variables son

    dependientes de otras?

    NO S

    Reciben el nombre de Mtodos de

    Interdependencia

    Reciben el nombre de Mtodos de Dependencia

    No se designa ninguna variable como si se hubiesen pronosticado mediante otras variables. Todas son tomadas como un conjunto que interesa al investigador.

    Anlisis Factorial, Anlisis de Conglomerados, Escalamiento Multidimensional

    Se especifican una o ms variables como si se hubiesen pronosticado (VD) mediante un conjunto de VI.

    Anlisis de Regresin, Anlisis Conjunto, Anlisis Discriminante, Anlisis de Varianza

  • Modelos Multivariantes 17

    OBJETIVO: Explicar o predecir una variable Criterio a partir de

    una o varias variables predictoras

    Y = a + b1X1 + b2X2 ++ bnXn EJEMPLO: Predecir las ventas a partir de la inversin en

    publicidad, n de tiendas, descuento aplicado, etc.

    CONDICIN: Predictores y Criterio cuantitativos

    Simple o Mltiple Caso especial: predictores categricos (Regresin con variables

    ficticias: DUMMY)

    REGRESIN LINEAL

  • Modelos Multivariantes 18

    OBJETIVO: Identificar funciones capaces de separar dos o ms grupos de individuos segn sus puntuaciones en una serie de variables, con el fin

    de localizar las variables que contribuyen en mayor grado a discriminar a

    los sujetos de los diferentes grupos establecidos a priori. Tcnica de

    clasificacin. Y1 = X1 + X2 + X3 + ... + Xn

    (no mtrica) (mtricas)

    Obtener una funcin discriminante del tipo Zjk = a + W1X1+ W2X2 + ... + WjXk

    EJEMPLO: Predecir el voto a partir de los ingresos econmicos, la edad

    CONDICIN: Predictores cuantitativos y Criterio categrico

    Simple o Mltiple (segn el criterio sea dicotmico politmico)

    ANLISIS DISCRIMINANTE

  • Modelos Multivariantes 19

    OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo,

    a partir de sus puntuaciones en una serie de variables independientes o

    predictores (similar al discriminante). Estimar la probabilidad de que se de

    un evento.

    EJEMPLO: Predecir si un alumno va a aprobar o no en funcin de las horas

    de estudio, frecuencia de asistencia a clase, estatus socioeconmico

    CONDICIN: VI mtricas o no mtricas y VD categrica

    Permite trabajar con predictores cualitativos y/o categricos

    Logstica Binaria y Multinomial

    REGRESIN LOGSTICA

  • Modelos Multivariantes 20

    OBJETIVO: Entender cmo conforman los individuos sus preferencias hacia

    los objetos, estimando la importancia relativa que le conceden a cada uno

    de los atributos o caractersticas de ste.

    EJEMPLO: Explicar las preferencias de las amas de casa hacia las

    diferentes opciones de LECHE

    CONDICIN: VI categrica (atributos) y VD ordinal

    Muy utilizado en Marketing (diseo de nuevos productos, test de envases, elasticidad del precio, Identificacin del producto ideal, segmentacin de

    mercados, simulaciones, etc.)

    ANLISIS CONJUNTO

  • Modelos Multivariantes 21

    OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre

    un evento, el RIESGO de

    EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de

    pacientes de una determinada patologa en funcin del tratamiento

    recibido, edad, etc.

    CONDICIN (3 variables diferentes):

    DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa) DE CENSURA: Si ha ocurrido o no el evento (dicotmica) EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, )

    ANLISIS DE SUPERVIVENCIA

  • Modelos Multivariantes 22

    OBJETIVO: Determinar e qu medida una VD est influenciada por una o

    varias VI. Comprobar si existe un efecto significativo de un Tratamiento

    EJEMPLO: Comprobar si existe un efecto significativo del consumo de

    alcohol sobre el rendimiento atencional

    CONDICIN: VI categrica (factores) y VD cuantitativa

    Ideal para experimentos Una o varias VAS (VI): ONEWAY ANOVA (Diseos factoriales) MANOVA (Anlisis Multivariante de la Varianza: varias VD)

    ANLISIS DE VARIANZA

  • Modelos Multivariantes 23

    OBJETIVO: Reduccin de datos. A partir de la relacin entre variables

    observadas identificar FACTORES o variables latentes

    EJEMPLO: Agrupar tems de una escala y etiquetarlos bajo una misma

    dimensin o factor de evaluacin

    CONDICIN: Variables cuantitativas

    Exploratorio (AFE): Componentes Principales Confirmatorio (AFC): LISREL, AMOS

    ANLISIS FACTORIAL

  • Modelos Multivariantes 24

    ANLISIS DE

    CORRESPONDENCIAS

    OBJETIVO: Reduccin de datos. A partir de la relacin entre variables

    observadas identificar DIMENSIONES o variables latentes

    EJEMPLO: Obtener un Mapa de Posicionamiento de los pases tursticos

    europeos, identificando las dimensiones subyacentes

    CONDICIN: Variables cualitativas

    Un subtipo de Anlisis Factorial, ideal para tablas de asociacin (recogida de datos rpida)

    Muy utilizado en Marketing

  • Modelos Multivariantes 25

    OBJETIVO: Identificar grupos grupos homogneos de sujetos u objetos a

    partir de su puntuacin en una serie de variables.

    EJEMPLO: identificar segmentos de jvenes en funcin de sus hbitos de

    consumo

    CONDICIN: Variables medidas en la misma escala

    Tambin llamado Cluster Analysis Tcnica de Clasificacin Los grupos no son conocidos a priori

    ANLISIS DE

    CONGLOMERADOS

  • Modelos Multivariantes 26

    OBJETIVO: Utilizar las proximidades entre objetos para realizar una

    representacin espacial de los mismos, identificando las dimensiones

    subyacentes

    EJEMPLO: Representacin espacial del mercado de la cerveza en Galicia

    CONDICIN: Gran versatilidad en la recogida de datos (distintos tipos de

    tareas)

    Gran Utilidad en MKT e investigacin social

    ESCALAMIENTO

    MULTIDIMENSIONAL

  • Modelos Multivariantes 27

    OTRAS TCNICAS

    Correlacin Cannica: Analizar relaciones entre un grupo de variables

    predictoras y un grupo de variables criterio.

    Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:

    Permite comprobar en qu medida un modelo terico se ajusta a los datos

    empricos (Path Analysis). Programas estadsticos: LISREL y AMOS

    Modelos Log-Lineales: Permite poner a pruebas modelos que postulan

    distinto tipo de relaciones entre dos o ms variables categricas (Incluyen

    los modelos LOGIT, PROBIT, etc.)