ESTADÍSTICA (GRUPO 12 - personal.us.espersonal.us.es/aggonzalez/Docencia/TEMA_11.pdf · Son las...

25
CAPÍTULO V .- DISTRIBUCIONES DE FRECUENCIAS MULTIDIMENSIONALES ESTADÍSTICA (GRUPO 12) TEMA 11 .- ANÁLISIS DE MÁS DE DOS CARACTERÍSTICAS. DIPLOMATURA EN CIENCIAS EMPRESARIALES UNIVERSIDAD DE SEVILLA

Transcript of ESTADÍSTICA (GRUPO 12 - personal.us.espersonal.us.es/aggonzalez/Docencia/TEMA_11.pdf · Son las...

CAPÍTULO V.-DISTRIBUCIONES DE FRECUENCIAS

MULTIDIMENSIONALES

ESTADÍSTICA (GRUPO 12)

TEMA 11.- ANÁLISIS DE MÁS DE DOS CARACTERÍSTICAS.

DIPLOMATURA EN CIENCIAS EMPRESARIALES

UNIVERSIDAD DE SEVILLA

2© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

1

2

j

N

x11, x21 , x31

X1X2X3

x12, x22 , x32

p332313

m222212

k112111

x...,,x,x:Xx...,,x,x:Xx...,,x,x:X

x1j, x2j , x3j

x1N, x2N , x3N

3© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.Distribución de frecuencias tridimensional de (X1, X2 , X3)

1i 2 j 3t ijt[(x , x , x ); n ]

i 1, 2, ... k; j 1, 2, ... m; t 1, 2, ... p∀ = ∀ = ∀ =

CARACTERÍSTICAS GENERALES DE LA DISTRIBUCIÓN TRIDIMENSIONAL

Frecuencias absolutas conjuntas de las distintas tripletas de valores de X1, X2 y X3 (nijt): número de veces que aparecen conjuntamente los valores x1i, x2j y x3t

∑ ∑ ∑= = =

=k

1i

m

1j

p

1tijt Nn

4© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.CARACTERÍSTICAS GENERALES DE LA DISTRIBUCIÓN

TRIDIMENSIONALFrecuencia relativa conjunta de la tripleta de valores de x1i, x2j y x3t :

N

nf ijtijt = ∑ ∑ ∑

= = ==

k

1i

m

1j

p

1tijt 1f

Frecuencias acumuladas de la tripleta de valores de x1i, x2j y x3t :

∑ ∑ ∑== = =

i

1u

j

1v

t

1zuvzijt nN

∑ ∑ ∑== = =

i

1u

j

1v

t

1zuvzijt fF

Frecuencias absolutas

acumuladas

Frecuencias relativas

acumuladas

5© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1

Ej.: Caracterización de 10 alumnos en cuanto al nº de zapato quecalzan, su altura (en cm.) y su peso (en kg.).Valores Observados:(40,174,70); (44,184,80); (40,163,61); (41,167,70); (45,191,85); (40,166,61); (43,188,79); (42,179,81); (41,169, 62); (43,17673)

77-8570-7777-8559-70

59-70

X3

3111

4

nijt

180-19142-45170-18042-45170-18040-42170-18040-42

163-17040-42

X2X1

Agrupación

6© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES

Concepto.- Son las distribuciones de frecuencias de los valores de cada una de las tres variables, sin considerar los valores concretos que tomen las otras; y las de los valores de dos ellas, sin considerar el valor concreto que tome la otra.

Tipos de distribuciones marginales.-Distribuciones marginales unidimensionales:

Distribución marginal de X1Distribución marginal de X2Distribución marginal de X3

Distribuciones marginales bidimensionales:Distribución marginal de (X1,X2)Distribución marginal de (X2,X3)Distribución marginal de (X1,X3)

7© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES

DISTRIBUCIONES MARGINALES UNIDIMENSIONALES

( ) k...,,2,1i;n,x ..ii1 =∀ ∑∑=

p

1tijt

m

1=j..i n = nX1

( ) m...,,2,1j;n,x .j.j2 =∀ ∑∑=

p

1tijt

k

1=i.j. n = nX2

( ) p...,,2,1t;n,x t..t3 =∀ ∑∑=

m

1jijt

k

1=it.. n = nX3

8© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES

DISTRIBUCIONES MARGINALES BIDIMENSIONALES

( )1i 2 j ij.x , x ;n ; i 1,2,...,k; j 1,2,...,m⎡ ⎤ ∀ = ∀ =⎣ ⎦p

ij. ijtt 1

n n=

= ∑(X1, X2)

( )1i 3t i.tx , x ;n ; i 1,2,..., k; t 1,2, ...,p⎡ ⎤ ∀ = ∀ =⎣ ⎦ ∑=

m

1jijtt.i n = n(X1, X3)

( )2 j 3t .jtx , x ;n ; j 1,2,...,m; t 1,2,...,p⎡ ⎤ ∀ = ∀ =⎣ ⎦ ∑=

k

1iijtjt. n = n(X2, X3)

9© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES MARGINALES

Nnnnnnnm

1j

p

1tjt.

k

1i

p

1tt.i

k

1i

m

1j.ij

p

1tt..

m

1j.j.

k

1i..i ====== ∑ ∑∑ ∑∑ ∑∑∑∑

= == == ====

Propiedad General.- La suma de las frecuencias absolutas de cualquiera de las distribuciones marginales siempre es igual al total de observaciones (N), coincidiendo también, por tanto con la suma de las frecuencias absolutas de la distribución conjunta.

pk m

ijti 1 j 1 t 1

n N= = =

=∑∑∑

10© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1

Ej.: Para la distribución acerca del nº de zapato calzado, altura (en cm.) y peso (en kg.) de 10 alumnos, determinemos la distribución marginal del número de zapato calzado.

1451212

3

ni..

44434241

40

X1

Distr. Marginal de X1

11© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.Ej.: Para la distribución conjunta acerca del nº de zapato que calza, altura (en cm.) y peso (en kg.) de 10 alumnos, agrupada en intervalos, determinemos la distribución marginal del número de zapato calzado y el peso.

Distr. Marginal de

X1 y X3

77-8570-7777-8559-70

59-70

X3

3111

4

nijt

180-19142-45170-18042-45170-18040-42170-18040-42

163-17040-42

X2X1

3115ni.t

77-8542-4570-7742-4577-8540-4259-7040-42

X3X1

12© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS

Concepto.- Son las distribuciones de frecuencia de una o dos de las variables de la distribución tridimensional cuando la otra o las otras cumplen una determinada condición (se presenta un determinado valor o conjunto de valores o una determinada pareja de valores o conjunto de parejas de valores).

Tipos de distribuciones condicionadas.-

Distribuciones condicionadas unidimensionales

Distribuciones condicionadas bidimensionales

13© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS

(X1/X2=x2i, X3=x3t): DISTRIBUCIÓN DE X1 CONDICIONADA A QUE (X2, X3) TOME LA PAREJA DE VALORES (x2j, x3t)

.jtk

1iijt

k

1iti/j, nnn)1 =∑=∑

==

k

ijk.jti 1

i / j,ti 1 .jt .jt

n nf 1

n n=

=

= = =∑

Frec. Abs.Vals. X1

nk/j,t=nkjtx1k

……ni/j,t=nijtx1i

......n2/j,t=n2jtx12

n1/j,t=n1jtx11

ijti/j,t

.jt

n2) f = n

14© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.DISTRIBUCIONES CONDICIONADAS

(X1,X2/ X3=x3t): DISTRIBUCIÓN DE (X1, X2) CONDICIONADA A QUE X3 TOME EL VALOR x3t

( )1i 2 j i,j / tx , x ,n ; i 1,2,...,k; j 1,2,...m⎡ ⎤ = =⎣ ⎦k m k m

i,j/t ijt ..ti 1 j 1 i 1 j 1

1) n n n= = = =

= =∑∑ ∑∑

ijti,j/t

..t

n2) f = n

k m

ijtk mi 1 j 1 ..t

i,j / ti 1 j 1 ..t ..t

nn

f 1n n

= =

= =

= = =∑∑

∑∑

15© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

8519145801844479188437317643811794262169417016741701744061166405916340X3X2X1

145121

ni/j,t

444342

X1/ X2>175, X3>70Distr. de X1 condicionadaa que X2 sea superior que

175 y que X3 sea superior que 70

Ej.: Para la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, determinemos la distribución del número de zapato calzado de los estudiantes con altura superior a los 175 cm. y peso superior a los 70 kg.

16© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

Distribución de frecuencias n-dimensional para el vector(X1, X2 , X3, ..., Xn)

( )1i 2 j 3t nv ijt...vx , x , x ,..., x ; n⎡ ⎤⎣ ⎦

i 1, 2, ... k∀ =Distribuciones marginales

Concepto.- Son las distribuciones de frecuencias de cualquier subconjunto (de dimensión 1, 2, n-1) de las variables del vector.

j 1, 2, ... m∀ = v 1, 2, ... z∀ =...

Ejemplos:Distrib. marginal de X1, distr. marginal de X2, ..., distr. marginal de XnDistr. marg. de (X1,X2), distr. marg. de (X1,X3), ..., distr. marginal de (Xn-1,Xn)[...]Distr. marg. de (X1,X2,...,Xn-1), ..., distr. marg. de (X2,X3,...,Xn)

17© Antonio Pajares Ruiz

1. DISTRIBUCIÓN DE FRECUENCIAS TRIDIMENSIONAL. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

GENERALIZACIÓN AL CASO N-DIMENSIONAL.

Distribución de frecuencias n-dimensional para el vector(X1, X2 , X3, ..., Xn)

Concepto.- Son las distribuciones de frecuencias de cualquier subconjunto (de dimensión 1, 2, n-1) de las variables del vector, condicionada a que cualquiera de los otros componentes o cualquier subconjunto del resto de componentes tome un valor concreto o conjunto de valores concretos.

Distribuciones condicionadas

Ejemplos:Distrib. condicionada de X1 a que X2 presente el valor x2jDistr. condicionada de (X1,X2) a que el vector (X3,X4) presente un conjunto de valores concretos[...]Distr. condicionada de (X1,X2,...,Xn-1) a que Xn presente un valor xnv

18© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.VECTOR DE MEDIAS

1

2

3

xM x

x

⎛ ⎞⎜ ⎟= ⎜ ⎟⎜ ⎟⎝ ⎠

Propiedades de C23

22

21 sssC0:adacotA)3

0C:positivadaSemidefini)2

Simétrica)1

⋅⋅≤≤

MATRIZ DE VARIANZAS Y COVARIANZAS

⎟⎟⎟⎟

⎜⎜⎜⎜

=233231

232221

131221

sssssssss

C

19© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.MATRIZ DE VARIANZAS Y COVARIANZAS

Propiedades de los elementos de C

( ) ( )1 2 1 21) Cov a X ,X a Cov X ,X⋅ = ⋅

( ) ( ) ( )1 2 3 1 3 2 32) Cov X X , X Cov X , X Cov X , X+ = +

( ) ( ) ( )1 2 3 1 3 2 33) Cov a X b X ,c X a c Cov X ,X b c Cov X ,X⋅ + ⋅ ⋅ = ⋅ ⋅ + ⋅ ⋅

( )14) Cov X ,a 0= ( ) ( )1 1 15) Cov X ,X Var X=

( ) ( ) ( ) ( )1 2 1 2 1 26) Var X X Var X Var X 2 Cov X ,X± = + ± ⋅

( ) ( ) ( )1 2

1 2 1 2

Si X X son independientes o incorreladas :

Var X X Var X Var X± = +

20© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.

MATRIZ DE CORRELACIÓN

⎟⎟⎟

⎜⎜⎜

⎛=

1rrr1rrr1

R

3231

2321

1312

Propiedades de R

1) Simétrica

Silas var iables están tipificadas : C R=

3) A cot ada : 0 R 1≤ ≤

2) Semidefinida positiva : R 0≥

2 2 21 2 3

4) El det erminante de C se puede expresar en función del de R :

C s s s R= ⋅ ⋅ ⋅

21© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.

RANGO DE LA DISTRIBUCIÓN

Concepto.- Es el rango de la matriz C ó de la matriz R

Tipos de distribuciones:

Distribuciones singulares: Rango<3⇒|C|=0 ó |R|=0(existe multicolinealidad entre las variables)

Distribuciones no singulares: Rango=3⇒|C|≠0 ó |R|≠0

22© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.

Total 72017574198519145801844479188437317643811794262169417016741701744061166405916340X3X2X1

Ej.: Determinar la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos.Para ello, calculamos primero el vector de medias de la misma.

1

2

3

419x 41,9

101757

x 175,710

720x 72

10

= =

= =

= =

1

2

3

x 41,9M x 175,7

x 72

⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= =⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

23© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.Ej.: Para determinar la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, calculamos en segundo lugar su matriz de varianzas y covarianzas.

2 21

2 22

2 23

17585s 41,9 2,89

10309549

s 175,7 84,4110

52602s 72 76,2

10

= − =

= − =

= − =

21 12 13

221 2 23

231 32 3

s s s 2,89 13,87 12,7C s s s 13,87 84,41 74,1

s s s 12,7 74,1 76,2

⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= =⎜ ⎟ ⎜ ⎟

⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠

12

13

23

73757s 41,9 175,7 13,87

1030295

s 41,9 72 12,710

127245s 175,7 72 74,1

10

= − ⋅ =

= − ⋅ =

= − ⋅ =

24© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.

Ej.: Finalmente, completamos la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, calculando su matriz de correlación.

12 13

21 23

31 32

1 r rR r 1 r

r r 1

1 0,8880 0,85580,8880 1 0,92390,8558 0,9239 1

⎛ ⎞⎜ ⎟= =⎜ ⎟⎜ ⎟⎝ ⎠

⎛ ⎞⎜ ⎟= ⎜ ⎟⎜ ⎟⎝ ⎠

12

13

23

13,87r 0,8880

2,89 84,4112,7

r 0,85582,89 76,2

74,1r 0,9239

84,41 76,2

= =⋅

= =⋅

= =⋅

25© Antonio Pajares Ruiz

2. CARACTERIZACIÓN DE LA DISTRIBUCIÓN.Ej.: Determinada la caracterización de la distribución acerca del nº de zapato que calzan, altura (en cm.) y peso (en kg.) de 10 alumnos, parece interesante concretar si la misma es singular.En este caso, se trata de una distribución de frecuencias no singular, ya que los determinantes de las matrices C y R son distintos de cero.

2,89 13,87 12,7C 13,87 84,41 74,1 551,8336

12,7 74,1 76,2= =

1 0,8880 0,8558R 0,8880 1 0,9239 0,0297

0,8558 0,9239 1= =

2 2 21 2 3

C 551,8336R 0,0297

s s s 2,89 84,41 76,2= = =

⋅ ⋅ ⋅ ⋅