ESTADISTICA BIVARIADA (1).pptx

23
DISTRIBUCIONES ESTADISTICAS BIVARIADAS

Transcript of ESTADISTICA BIVARIADA (1).pptx

PowerPoint Presentation

DISTRIBUCIONES

ESTADISTICAS

BIVARIADAS 1Hasta ahora nos hemos centrado en medidas de tendencia central, variabilidad, asimetra y curtosis de una nica variable.

No obstante, en la prctica es comn examinar dos o ms variables conjuntamente (relacin entre inteligencia y rendimiento, etc.)

En este tema nos centraremos en la relacin entre 2 variables (a partir de n observaciones apareadas) y calcularemos (en particular) un ndice que nos dar el grado de relacin/asociacin entre ambas variables: el coeficiente de correlacin lineal (de Pearson)INTRODUCCIONRepresentacin grfica de una relacin

inteligenciarendimientorendimientorendimientointeligenciainteligenciaRelacin lineal positivaRelacin lineal negativaSin relacinRepresentacin grfica de una relacin rendimientorendimientointeligenciainteligenciaRelacin linealRelacin no linealNota: El coeficiente de correlacin de Pearson mide relacin LINEAL.Representacin grfica de una relacin (3)

inteligenciarendimientorendimientorendimientointeligenciainteligenciaRelacin lineal perfecta (casi perfecta)Relacin lineal dbilRelacin lineal fuerte/moderadaAhora necesitamos un ndice que nos informe tanto del grado en que X e Y estn relacionadas, y si la relacin es positiva o negativaCovarianza e ndice de correlacin de PearsonrendimientointeligenciaObservar que cuando la relacin lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas.inteligenciarendimientoObservar que cuando la relacin lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas.Caso 1Caso 2Dos variables cuantitativas: Grficos de dispersin Dos variables cualitativa: Grficos de Barras dobles Una variable cualitativa y otra cuantitativa: a) Diagramas de Puntos.Panel de histogramas.Diagrama de cajas agrupadas. TIPOS DE GRAFICOS: BIVARIADOSTabla de Correlacin o Contingencia (atributos)

Distribuciones marginalesTabla de Correlacin o Contingencia

Permite ayudarnos a determinar si existe relacin de interdependencia entre 2 variables, es decir, si se influyen mutuamente.

As, una tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurar el nmero de casos o individuos que poseen un nivel de una de las caractersticas analizadas y otro nivel de la otra caracterstica.

donde nij es el nmero de observaciones que presentan simultneamente las caractersticas i, j de las variables A y B, respectivamente.Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaramos as en el anlisis de una distribucin marginal.Distribucin marginal de AAini.A1n1.A2n2.An-1nn-1.Annn.Distribucin marginal de B Bjn.jB1n.1B2n.2Bm-1n.m-1Bmn.mDISTRIBUCIONES MARGINALESson las frecuencias absolutas marginales de las variables A y B, respectivamente.Definimos:son las frecuencias relativas marginales de las variables A y B, respectivamente.Distribuciones marginales

En las tablas de contingencia:Distribuciones marginales Distribuciones de frecuencias relativas

Perfiles fila Perfiles columna

Del total de individuos con la caracterstica A1 que porcentaje comparte a su vez la B1Cmo es lgico, el porcentaje de individuos con A1 que, o bien comparten B1 o B2 y hasta Bj ser el 100% = 1Distribuciones condicionadasDistribucin de una de las variables siempre que la otra cumpla una condicin especfica.

xini.(Frecuencia cuando y=valor especfico)x1n1.x2n2.xn-1nn-1.xnnn.X: Gasto en material escolarY: Nmero de hijosDistrib. Condicionada: Por ejemplo, gasto en material escolar cuando el nmero de hijos es 0 y prximo a 1Si hay relacin lineal negativa r < 0 y prximo a -1Si no hay relacin lineal r se aproxima a 0Si X e Y son independientes Sxy = 0 y por tanto r = 0

Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relacin. Pero pueden pueden ser dependientes. Importante:Propiedades:Coeficiente de correlacin (lineal) de Pearson

InterpretacinHemos de tener en cuenta qu es lo que estamos midiendo para poder interpretar cun grande es la relacin entre las variables bajo estudio. En muchos casos, depende del rea bajo estudio.rendimientointeligenciaEn todo caso, es muy importante efectuar el diagrama de dispersin. Por ejemplo, en el caso de la izquierda, es claro que no hay relacin entre inteligencia y rendimiento. Sin embargo, si calculamos el ndice de correlacin de Pearson nos dar un valor muy elevado, causado por la puntuacin atpica en la esquina superior derecha.Coeficiente de Asociacin Chi-Cuadrado (2):

Frecuencia observada

Frecuencia esperadaSi 0 no habr asociacin inexistencia de asociacin

Problema: no tiene lmite superior por lo que no permite conocer el grado de asociacin.

VARIABLES CUALITATIVASCoeficiente C de contingencia de Karl Pearson:

Si C 0 inexistencia de asociacin Si C 1 perfecta asociacin entre las variables Nunca superior a unoCoeficiente de Correlacin por Rangos de Spearman: El Coeficiente de Correlacin por Rangos de Spearman permite determinar la correlacin de datos de carcter ordinal midiendo la concordancia o discordancia entre las clasificaciones.

Formulacin: Si no hay empates Interpretacin:

Si = 1: Correlacin por rangos perfecta y positiva. La concordancia entre los rangos es perfectaSi = -1: Correlacin por rangos perfecta y negativa. La concordancia entre los rangos es perfectaSi = 0: Correlacin por rangos nula. No hay concordancia entre los rangosSi 0 < < 1: Correlacin por rangos positiva y si -1 <