Estadistica Bivariada 2011

26
 Estadística Bivariada

Transcript of Estadistica Bivariada 2011

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 1/26

 

Estadística Bivariada

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 2/26

 

REPRESENTACIÓN DE DATOS DE DOS VARIABLES.

Cada una de las variables puede ser por su naturaleza cualitativa o cuantitativa.Como resultado, los datos bivariados pueden formarse mediante tres combinacionesde variables:

1. Ambas variables son cualitativas (de atributos).2. Una variable es cualitativa (de atributo) y otra es cuantitativa (numérica).3. Ambas variables son cuantitativas (numéricas).

Dos variables cuantitativas.Cuando los datos bivariados son resultado de dos variables cuantitativas, losdatos matemáticos suelen expresarse como pares ordenados, (X,Y), donde “X”es la variable de entrada (variable independiente) y “Y” es la variable de salida(variable dependiente).

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 3/26

 

Variable estadística bidimensionalUna variable bidimensional es una variable en la que cada individuo está definido por unpar de caracteres, (X, Y).Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entreellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Relación funcionalDos variables x e y están relacionadas funcionalmente cuando conocida la primera sepuede saber con exactitud el valor de la segunda.

Ejemplo

Si se deja caer una piedra, existe una fórmula que nos permite calcular exactamente,la altura a la que se encuentra en función del tiempo transcurrido.

h = ½ g t².

Relación estadísticaDos variables x e y están relacionadas estadísticamente cuando conocida la primera se

puede estimar aproximadamente el valor de la segunda.

EjemplosIngresos y gastos de una familia, Producción y ventas de una fábrica, Gastos enpublicidad y beneficios de una empresa.

REPRESENTACIÓN DE DATOS DE DOS VARIABLES.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 4/26

Distribuciones Bidimensionales

Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempodos variables de cada elemento de la población: por ejemplo peso y altura de un grupode estudiantes; superficie y precio de las viviendas de una ciudad; potencia yvelocidad de una gama de automóviles deportivos.

Para representar los datos obtenidos se utiliza una tabla de correlación

nn,mnn,m-1xnn,2nn,1xn

nn-1,mnn-1,m-1xnn-1,2nn-1,1xn-1

xxxxx.....

n2,mn2,m-1xn2,2n2,1x2

n1,mn1,m-1xn1,2n1,1x1

ymym-1.....y2y1X / Y

En cada intersección (par (x,y)) se recoge el número de veces que dicho par devalores se ha presentado conjuntamente.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 5/26

331,22Alumno 15

301,21Alumno 14

341,27Alumno 13

351,28Alumno 12331,25Alumno 11

351,29Alumno 10

321,27Alumno 9

321,24Alumno 8

341,3Alumno 7

351,29Alumno 6

321,22Alumno 5

301,21Alumno 4

341,27Alumno 3

331,28Alumno 2

321,25Alumno 1

PesoEstaturaAlumno

341,29Alumno 30

351,27Alumno 29

311,24Alumno 28

341,3Alumno 27

341,29Alumno 26

321,22Alumno 25

311,21Alumno 24

341,27Alumno 23

341,28Alumno 22

331,25Alumno 21

331,29Alumno 20

331,27Alumno 19

321,24Alumno 18

351,3Alumno 17

341,29Alumno 16

PesoEstaturaAlumno

Ejemplo: Medimos la estatura y el peso de los alumnos de una clase yobtenemos los siguientes resultados:

Distribuciones Bidimensionales

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 6/26

Esta información se puede representar de un modo más organizado en la

siguiente tabla de correlación:

120001,30 cm

111031,29 cm

101101,28 cm

120121,27 cm

000001,26 cm

001111,25 cm

001201,24 cm

000001,23 cm

101101,22 cm021001,21 cm

35 kg34 kg33 kg32 kg31 kgEstatura / Peso

Tal como se puede ver, en cada casilla se recoge el número de veces que sepresenta conjuntamente cada par de valores (x,y).

Distribuciones Bidimensionales

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 7/26

Distribuciones marginales

Al analizar una distribución bidimensional, uno puede centrar su estudio en elcomportamiento de una de las variables, con independencia de como se comporta laotra. Estaríamos así en el análisis de una distribución marginal.

minnm

 j iji

...1; 1

==

∑=•

n jnnn

i

ij j ..1;1

==∑=

Suma de los valores de la fila i-ésima

de la tabla.

Suma de los valores de la columna j-

ésima de la tabla.

Distribuciones Bidimensionales

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 8/26

120001,30 cm

111031,29 cm

101101,28 cm

120121,27 cm

000001,26 cm

001111,25 cm

001201,24 cm

000001,23 cm

101101,22 cm

021001,21 cm

35 kg34 kg33 kg32 kg31 kgEstatura / Peso

A partir del ejemplo anterior (pesos y medidas de los alumnos) vamos a estudiar susdistribuciones marginales.

3

6

3

6

0

3

3

0

3

3

57666

Distribuciones Bidimensionales

Distribuciones marginales

3030

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 9/26

30Total

31,3

61,29

31,28

61,27

01,26

31,25

31,24

01,23

31,22

31,21

niEstatura

Marginal de X

30Total

535

734

633

632

631

niPeso

Marginal de Y

Distribuciones Bidimensionales

Distribuciones marginales

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 10/26

Diagrama de dispersión o nube de puntos.

Es la gráfica de todos los pares ordenados de datos de dos variables que estánen un sistema de ejes coordenados. La variable de entrada, X, se grafica en eleje horizontal y la variable de salida, Y, se gráfica en el eje vertical.

Diag. Dispersión

29

30

31

32

33

34

35

36

1,2 1,22 1,24 1,26 1,28 1,3 1,32

Estatura Peso

Correlación Lineal.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 11/26

Correlación Lineal.

Si los pares ordenados (x, y) tienden a seguir un patrón de línea recta, se tiene unacorrelación lineal.

Esta correlación puede ser positiva o negativa (relación directa ó inversa).

TIPOS DE DEPENDENCIA A PARTIR DE LA REPRESENTACIÓN GRÁFICA

Uno de los objetivos de este tema es estudiar el tipo de dependencia que hay entrelas dos características o variables estudiadas para un fenómeno en cuestión.

" ¿ A mayor talla de una persona le corresponde mayor peso ? "

A esta pregunta parece que se responde rápidamente que sí. ¿Cómo se observa enla nube de puntos este hecho?.

Si los datos forman una línea horizontal o vertical, no hay correlación, ya que unavariable no afecta la otra.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 12/26

Correlación Lineal.

Si los pares ordenados (x, y) tienden a seguir un patrón de línea recta, se tiene unacorrelación lineal.Esta correlación puede ser positiva o negativa (relación directa ó inversa).Si los datos forman una línea horizontal o vertical, no hay correlación, ya que unavariable no afecta la otra.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 13/26

Correlación Lineal.

Diag. Dispersión

29

30

31

32

33

34

3536

1,2 1,22 1,24 1,26 1,28 1,3 1,32

Estatura Peso

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 14/26

∑−−= ))((

1)1 Y  y X  x

nCOV 

ii xy

∑ −= )()(1

)2 Y  X  y xn

COV  ii xy

Correlación Lineal.

OBS:La covarianza, sin embargo, no permite tener una noción del “grado de asociación”

ya que varía entre –infinitos y + infinito y no hay modo de saber si es grande ó

pequeña.

La covarianza entre dos variables X e Y (COVxy), nos indica si la posible relación

es directa o inversa (favorable o no).

•Si COVxy >0

Directa•Si COVxy <0indirecta•Si COVxy = 0 No hay relación ó Incorrelacionadas

Covarianza

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 15/26

∑ −= )()(1

Y  X  y xn

COV  ii xy

Correlación Lineal.

Covarianza

83797466626761585855PESO (kg)

182180180175175171170168165160TALLA (cm)

Ejemplo

Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10personas, podemos obtener los siguientes valores:

Podemos llamar X a la talla e Y al peso con lo que se obtendría la variable

bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de latabla anterior: (160,55), (165,58), etc.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 16/26

Correlación Lineal.

Covarianza

83797466626761585855PESO (kg)

182180180175175171170168165160TALLA (cm)

Ejemplo

TALLA V/S PESO

40

45

50

55

60

65

70

75

80

8590

155 160 165 170 175 180 185

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 17/26

∑ −= )()(1

Y  X  y xn

COV  ii xy

Correlación Lineal.

Covarianza

83797466626761585855PESO (kg)

182180180175175171170168165160TALLA (cm)

Ejemplo

3,666,172

10

831827918074180661756217561170581685816555160⋅−

⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅= xyCOV 

3,66

6,172

=

=

 y

 x

032,5538,114437,11498 >=−= xyCOV  Implica dependencia directa

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 18/26

El coeficiente de correlación lineal, r, es la medida numérica de la intensidad de larelación lineal entre dos variables. El coeficiente refleja la consistencia de efectoque el cambio en una variable tiene sobre otras.

Correlación Lineal.

Coeficiente de Correlación (r).El coeficiente de correlación lineal (de Pearson) de dosvariables, r, nos indica si los puntos tienen una tendencia adisponerse alineadamente (excluyendo rectas horizontales y

verticales).

Tiene el mismo signo que COVxy por tanto de su signo obtenemos el que la posiblerelación sea directa o inversa.

r es útil para determinar si hay relación lineal entre dos variables, pero no servirápara otro tipo de relaciones (cuadrática, logarítmica,...)

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 19/26

Ej: si r=1

Coeficiente de Correlación (r).

Y  x

 xy

SS

COV r =)1Y  x

 xy

Var Var 

COV r =)2

Propiedades de r:

•Es adimensional•Sólo toma valores en [-1,1]

•Las variables son incorreladas si r=0•Relación lineal perfecta entre dos variables r=+1 o r=-1•Excluimos los casos de puntos alineados horiz. o verticalmente.

•Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 20/26

Correlaciones Positivas

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 21/26

Correlaciones Negativas

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 22/26

Si esa relación se expresa mediante una función lineal del tipo y = ax + b, sugráfica correspondería a una recta.

Correlación Lineal.

Recta de regresiónSupongamos que en una variable bidimensional queremos precisar la relación queexiste entre las dos variables que la forman. Normalmente se elige como y la variabledependiente y como x la independiente.

En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos dela nube de la variable. Dicha recta se denomina: recta de regresión.

Por un método que se denomina de "mínimos cuadrados" y cuya concreción no

corresponde a este nivel de estudio, se deduce que la recta de regresión debe

pasar por el punto correspondiente a las medias de ambas variables.

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 23/26

Correlación Lineal.

Recta de regresiónEn la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla) del ejemploanterior. En este caso se supone que represente cómo depende el peso de una personarespecto de su talla.

TALLA V/S PESO

40

50

60

70

80

90

155 160 165 170 175 180 185

PESO (kg) Lineal (PESO (kg))

Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la rectade regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta

el peso. Por tanto:

Dependencia directa

Pendiente de la rectapositiva

Función creciente

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 24/26

Correlación Lineal.

Recta de regresiónEcuación de la recta de regresión

PESO V/S TALLA

y = 1,2121x - 142,91

0

20

40

60

80

100

155 160 165 170 175 180 185

¿qué utilidad tiene la recta de regresión?

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 25/26

Correlación Lineal.

¿Qué utilidad tiene la recta de regresión?En la tabla de valores de las variables talla - peso, solamente nos dan los valores de undeterminado número de personas (10): casos conocidos. Mediante la recta de regresión podríamosobtener de manera aproximada el peso de una persona de la que sólo conociéramos la talla, enuna población semejante a aquella de la que se ha obtenido la muestra.

Si observamos la gráfica anterior, podríamos suponer por ejemplo que una persona de 185 cmpesaría algo más de 80 kg

De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular

valores para la variable y, conocidos los de x, como si se tratara de una función.

PESO V/S TALLA

y = 1,2121x - 142,91

0

20

40

60

80

100

155 160 165 170 175 180 185

 

5/12/2018 Estadistica Bivariada 2011 - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bivariada-2011 26/26

Correlación Lineal.

Ejemplo anterior: para una persona de 185 cm ¿cuál sería su peso en kg

y = 1,2121x – 142,91

Función y = ax + b

y = 1,2121*185 – 142,91

y = 81,3285 Estimado

Reemplazamos el valor de x =185 (conocido) en la

función