Estadística bidimensional

26
Estadística bidimensional Juan Carlos Ballabriga Departamento de Matemáticas IES Benjamín de Tudela

Transcript of Estadística bidimensional

Page 1: Estadística bidimensional

Estadística bidimensional

Juan Carlos Ballabriga

Departamento de Matemáticas

IES Benjamín de Tudela

Page 2: Estadística bidimensional

Variables estadísticas bidimensionales

Se trata de variables que surgen cuando se estudian dos características asociadas a la observación de un mismofenómeno.

Page 3: Estadística bidimensional

Podemos llamar X a la talla e Y al peso con lo que se obtendría la variable bidimensional (X, Y)que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.

83797466626761585855

Peso

(kgs)

182180180175175171170168165160

Talla

(cms)

83797466626761585855

Peso

(kgs)

182180180175175171170168165160

Talla

(cms)

Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un

grupo de 10 personas, podemos obtener los siguientes valores

Page 4: Estadística bidimensional

Variables estadísticas bidimensionales En algunos casos el número de "parejas" de valores (x,y) es

grande y además muchos de ellos aparecen repetidos; en este caso se utiliza una "Tabla de doble entrada" como la

que se muestra a continuación en el ejemplo 2

En la primera fila se colocan los valores de una de las características o variable que componen la variable

bidimensional y en la primera columna los de la otra.

Page 5: Estadística bidimensional

Variables estadísticas bidimensionales

Ejemplo 2.- Se representa por X el número de hijos de 100

familias y por Y el número de hijas

Nº de hijas (y)

Nº de hijos (x) 0 1 2 3Frecuencias

Marginales (x)

0 10 15 15 3 43

1 10 12 7 2 31

2 8 4 3 1 16

3 3 2 1 0 6

4 2 1 1 0 4

Frecuencias

Marginales(y)33 34 27 6 100

Page 6: Estadística bidimensional

Representación gráfica

Diagramas de dispersión o nubes de puntos: En unos ejes de coordenadas representaremos la posición y frecuencia de cada pareja de datos

Page 7: Estadística bidimensional

Diagramas de dispersión o nubes de puntos

En el ejemplo 1 anterior en el que se estudiaba la talla y el peso de 10 personas se obtendría el siguiente diagrama de dispersión: (En el eje X se representa la talla en cm. y en el eje Y el peso en kg.)

Page 8: Estadística bidimensional

En el caso de tablas de doble entrada

0

1

2

3

0 1 2 3 4

15

15

1010

12

2

7

8

4

31

3

3

1

1

1

2

2

Page 9: Estadística bidimensional

Diagramas de dispersión o nubes de puntos

Se puede ver en el primera figura que correspondía al diagrama de talla - peso que la serie de puntos presenta una tendencia "ascendente" . Se dice en este caso que existen entre las dos variables una "dependencia directa" .

En caso en que la tendencia sea "descendente" se diría que estaríamos ante una " dependencia inversa "

Naturalmente en caso en que no se pueda observar una tendencia clara estaríamos ante una dependencia muy débil que no se puede observar mediante la nube de puntos

Page 10: Estadística bidimensional

Diferentes tipos de diagramas

Page 11: Estadística bidimensional

Dependencia funcional

-10

0

10

20

30

40

50

60

70

-10 -8 -6 -4 -2 0 2 4 6 8 10

Page 12: Estadística bidimensional

Ajustes lineales

Page 13: Estadística bidimensional

Covarianza y Correlación

• Para estudiar si hay relación o no entre las variables

• Puede ser directa o inversa

• Se puede “cuantificar”

Page 14: Estadística bidimensional

Covarianza

i

iii

xyf

fYyXx

YXf

fyx

i

iii

xyUsaremos una fórmula más cómoda

Page 15: Estadística bidimensional

Tabla de frecuencia

Talla (cm) Peso kg) x-X y-Y (x-X)(y-Y)160 55 -12,6 -11,3 142,38165 58 -7,6 -8,3 63,08168 58 -4,6 -8,3 38,18170 61 -2,6 -5,3 13,78171 67 -1,6 0,7 -1,12175 62 2,4 -4,3 -10,32175 66 2,4 -0,3 -0,72180 74 7,4 7,7 56,98180 79 7,4 12,7 93,98182 83 9,4 16,7 156,98

10

Media x 172,6 Cov 15,698Media y 66,3

Covarianza

Page 16: Estadística bidimensional

Como vemos la relación es

Positiva (creciente) y parece

que es bastante fuerte, pero

¿cuánto? 0

10

20

30

40

50

60

70

80

90

155 160 165 170 175 180 185

Peso (kg)

Talla (cm)

Page 17: Estadística bidimensional

Coeficiente de Correlación

Para cuantificar la relación usaremos el coeficiente de correlación:

yx

xyr

Propiedades:

• Es un valor entre -1 y 1

• Si es positivo la relación es directa y si es negativa es inversa

• Cuando se acerca a cero no hay relación

Page 18: Estadística bidimensional

En el ejemplo 1

Talla (cm) Peso kg) x-X y-Y (x-X)(y-Y) (x-X)2 (y-Y)2

160 55 -12,6 -11,3 142,38 158,76 127,69165 58 -7,6 -8,3 63,08 57,76 68,89168 58 -4,6 -8,3 38,18 21,16 68,89170 61 -2,6 -5,3 13,78 6,76 28,09171 67 -1,6 0,7 -1,12 2,56 0,49175 62 2,4 -4,3 -10,32 5,76 18,49175 66 2,4 -0,3 -0,72 5,76 0,09180 74 7,4 7,7 56,98 54,76 59,29180 79 7,4 12,7 93,98 54,76 161,29182 83 9,4 16,7 156,98 88,36 278,89

10 553,2 456,4 812,1

Media x 172,6 Cov 55,32 Var x 45,64Media y 66,3 Var x 81,21

Des x 6,7557383

Des y 9,01165911

Coef. Correl. 0,91

Mucha relación directa

Page 19: Estadística bidimensional

Recta de regresión Relación entre dos variables

Variable independiente x

Variable dependiente y

función lineal del tipo y = ax + b, su gráfica

correspondería a una recta de regresión.

Ajuste por mínimos cuadrados

Page 20: Estadística bidimensional

Se deduce que la recta de regresión debe pasar por el punto correspondiente a

las medias de ambas variables y que debe tener por pendiente

Con ello la expresión de la recta de regresión utilizando la ecuación

punto-pendiente será:

Esta es la llamada "Recta de regresión de y sobre x". Si se deseara estudiar la

dependencia de x respecto a y sólo habría que cambiar en la expresión de la

recta x por y, obteniéndose la recta regresión de x sobre y

XxYyx

xy

2

YX ,2

x

xy

YyXxy

xy

2

Page 21: Estadística bidimensional

En la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla)

del ejemplo 1 de este tema. En este caso se supone que represente cómo depende

el peso de una persona de su talla

Si recordamos que entre la talla y el peso decíamos que existía una dependencia

directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida

que aumenta la talla aumenta el peso. Por tanto:

Dependencia directa - Pendiente de la recta positiva - Función creciente

0

20

40

60

80

100

155 160 165 170 175 180 185

Peso (kg)

Talla (cm)

Page 22: Estadística bidimensional

0

10

20

30

40

50

60

70

80

90

155 160 165 170 175 180 185

Peso (kg)

Talla (cm)

Media x 172,6Media y 66,3

),( YX

),( YX

Page 23: Estadística bidimensional

Utilidad tiene la recta de regresión

Mediante la recta de regresión podríamos obtener de manera aproximada el valor de la variable dependiente (y) de la que conociéramos la variable independiente (x), en una población semejante a aquella de la que se ha obtenido la muestra

De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular valores para la variable y, conocidos los de x, como si se tratara de una función

Page 24: Estadística bidimensional

Ejemplo :

Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185

cm pesaría algo más de 80 kg

De acuerdo a la fórmula

La recta de regresión de la variable y (peso) sobre x (talla) será la recta:

-que pasa por el punto (172,6 ; 66,3) (medias respectivas de (x,y))

-tiene de pendiente: 55.32 / 50.71 = 1.0909

Recta: y – 66.3 = 1.0909 ( x – 172.6) que operando y simplificando queda:

y = 1.0909x – 121.9

0102030405060708090

155 160 165 170 175 180 185

Peso (kg)

Talla (cm)

XxYyx

xy

2

Page 25: Estadística bidimensional

El valor del peso que suponíamos aproximado para una talla de 185 cm

sería:

Peso= 1.0909 · 185 – 121.9 = 79.9

Este valor obtenido es algo menor al esperado. Eso quiere decir que las

predicciones hechas con la recta de regresión no son exactas.

Por tanto la recta de regresión se puede utilizar para realizar predicciones

para la variable y a partir de valores conocidos de la variable x.

Page 26: Estadística bidimensional

Resumen:

• Variables bidimensionales

• Coeficiente de correlación

• Regresión

• Recta de regresión