Profesora: Dra. Alejandrina Gonzales Ochoa 1. 1. Medidas de asociación entre dos variables...

Post on 02-Feb-2016

236 views 6 download

Transcript of Profesora: Dra. Alejandrina Gonzales Ochoa 1. 1. Medidas de asociación entre dos variables...

Profesora: Dra. Alejandrina Gonzales Ochoa

SESIÓN 08:MEDIDAS DE ASOCIACIÓN ENTRE DOS VARIABLES

Y TEOREMA DE CHEVYSHEV

Estadística Aplicada a la Gestión Empresarial

1

1. Medidas de asociación entre dos

variables

ESTADÍSTICA DESCRIPTIVA

Medidas de asociación entre dos variables

Hasta ahora hemos examinado métodos numéricos cuyo objetivo es resumir los datos de una sola variable. Con frecuencia al gerente o quien toma decisiones le interesa la relación entre dos variables.

A continuación se presenta la covarianza como medida descriptiva de la relación entre dos variables.

3

Medidas de asociación entre dos variables

1. Covarianza:

Para un conjunto de observaciones, la covarianza se define como:

Covarianza de una muestra: Covarianza de una población:

1

))((_

1

_

n

yyxxS

i

n

ii

xy N

YX yix

N

ii

xy

))((1

4

Ejemplo

El departamento de logística de una tienda de equipos de sonido, ha usado comerciales de televisión los fines de semana para promover sus ventas. El administrador de la tienda le interesa investigar la relación entre la cantidad de comerciales de televisión que aparecen los fines de semana y las ventas en su negocio durante la siguiente semana. En la siguiente tabla aparecen datos de la muestra, donde las ventas se expresan en miles de dólares, con una observación para cada semana.

5

Muestra de datos del departamento de logística

Semana Cantidad de comercialesx

Volumen de ventasy

1 2 50

2 5 57

3 1 41

4 3 54

5 4 54

6 1 38

7 5 63

8 3 48

9 4 59

10 2 466

Cálculo de la covarianza de la muestra

xi yi

2 50 -1 -1 1

5 57 2 6 12

1 41 -2 -10 20

3 54 0 3 0

4 54 1 3 3

1 38 -2 -13 26

5 63 2 12 24

3 48 0 -3 0

4 59 1 8 8

2 46 -1 -5 5

30 510 0 0 99

_

)( yyi _

)( xxi )()(__

yyxx ii

7

Reemplazando valores en la fórmula:

11110

99

110

))((_10

1

_

yyxxS

ii

i

xy

Interpretación de la covarianza:

Para ayudarnos en la interpretación de la covarianza de la muestra es necesario tomar en cuenta el diagrama de dispersión de x e y

8

Diagrama de dispersión

Interpretación de la covarianza:

En la gráfica quedan cuatro cuadrantes: • Los puntos del cuadrante I corresponde a valores de x mayores que su

media y a valores de y mayores que su media.• Los puntos del cuadrante II corresponde a valores de x menores que

su media y a valores de y mayores que su media.• Los puntos del cuadrante III corresponde a valores de x menores que

su media y a valores de y menores que su media.• Los puntos del cuadrante IV corresponde a valores de x mayores que

su media y a valores de y menores que su media.

10

Interpretación de la covarianza:

Si el valor de Sxy es positivo, los puntos que tuvieron la máxima

influencia sobre Sxy deben estar en los cuadrantes I y III, por

consiguiente un valor positivo de Sxy indica una asociación lineal

positiva entre x e y. Sin embargo si el valor de Sxy es negativo los

puntos que tuvieron mayor influencia sobre Sxy están en los

cuadrantes II y IV, por consiguiente un valor negativo de Sxy indica

una asociación lineal negativa entre x e y.

Si los puntos se distribuyen uniformemente en los cuatro cuadrantes el valor de Sxy será cercano a cero, indicando que no hay asociación

lineal entre x e y.

11

2. Coeficiente de CorrelaciónMide el grado de asociación existente entre variables

FUERTE POSITIVA

0

10

20

30

40

50

60

0 10 20 30 40 50 60

Variable A

Var

iab

le B

FUERTE NEGATIVA

0

10

20

30

40

50

0 10 20 30 40 50

Variable A

Va

ria

ble

B

SIN CORRELACIÓN

0

10

20

30

40

50

60

0 10 20 30 40 50 60

Variable A

Var

iab

le B

12

Interpretación:

n

ii

n

ii

n

iii

ynyxnx

yxnyxr

1

22

1

22

1

01-1 0.70-0.70

Fórmula:

13

Ejemplo:Analizar la relación entre la edad y el tiempo de servicio de 15 trabajadores, contando con la siguiente información:

Trabajador Edad Tiempo de

servicio

Trabajador Edad Tiempo de

servicio

1 48 24 9 34 10

2 40 18 10 46 20

3 30 9 11 32 12

4 39 14 12 42 18

5 46 22 13 40 16

6 42 22 14 32 8

7 27 4 15 27 6

8 36 13

14

Reemplazando valores en la fórmula el coeficiente de correlación es:

97.0

1

22

1

22

1

n

ii

n

ii

n

iii

ynyxnx

yxnyxr

01-1 0.70-0.70

Existe una correlación fuerte (0.97) entre la edad y el tiempo de servicio del trabajador.

15

2. Teorema de Chevyshev y regla

empírica

ESTADÍSTICA DESCRIPTIVA

3 m

Curva en forma de campana que muestra la relación entre y

2 1 +1 +2 +3

Teorema de Chebyshev

El teorema de Chebyshev se aplica a cualquier conjunto de datos y se emplea para determinar la cantidad mínima de valores que deben estar dentro de cierta cantidad de desviaciones estándar respecto a la media.

Interpretación y usos de la desviación estándar

Regla empírica: para datos con una distribución en forma de campana:

• Aproximadamente 68% de los valores de la población estará dentro de 1 desviación estándar a partir de la media.

• Aproximadamente 95% de los valores de la población estará dentro de 2 desviación estándar a partir de la media.

• Aproximadamente 99% de los valores de la población estará dentro de 3 desviación estándar a partir de la media.

19