Tema2 ud1b

Post on 14-Aug-2015

794 views 0 download

Transcript of Tema2 ud1b

Probabilidades y Estadística I

TEMA 2

Medidas características de una distribución de frecuencias

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

3. Medidas de dispersión (5/11)

Cuartiles (idea intuitiva)

25% 25% 25% 25%

Son los valores que dividen la muestra en 4 grupos, cada uno con el 25% de los datos (aproximadamente)

25% 25% 25% 25%

Q1 Q2 Q3min max Q1 Q2 Q3min max

Rango intercuartílico

Probabilidades y Estadística I

3. Medidas de dispersión (6/11)

(definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional

F(x) = i/4

Datos explícitos

Datos implícitos

( )

( ) ( )

jn4ij si

xx

n4ij six

Qjj

j

i

+<+<+

+==

+ 1)1(2

)1(

1

Cuartiles

Probabilidades y Estadística I

3. Medidas de dispersión (7/11)

(definición intuitiva)Percentiles

Son los valores que dividen la muestra en 100 grupos, cada uno con el 1% de los datos (aproximadamente)

P25 P50 P75min maxQ1 Q2 Q3

Probabilidades y Estadística I

3. Medidas de dispersión (8/11)

(definición formal)

Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.

Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional

F(x) = i/100

Datos explícitos

Datos implícitos

( )

( ) ( )1

i si j ( 1) x x i si j ( 1) 1

2

100

100

j

ij j

x nP

n j+

= += + < + < +

Percentiles

Probabilidades y Estadística I

3. Medidas de dispersión (9/11)

Varianza (definición formal)

Sea x1, x2, ...., xn una serie de datos

2 2 22 1 2( ) ( ) .... ( )nx x x x x x

nσ − + − + + −

=

Datos explícitos

Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {f1,f2,.…,fk} su distribución de frecuencias relativas.

( )∑=

−=k

iii xxfVar

1

2'X

Datos implícitos

Probabilidades y Estadística I

3. Medidas de dispersión (10/11)

Desviación típica (definición formal)

( )∑=

−+=k

iii xxf

1

2'σ

)2,2( σσ +− x x contiene el 75% de los datos

( 3 , 3 )x xσ σ− + contiene el 89% de los datos

Detectar datos

atípicos

Probabilidades y Estadística I

3. Medidas de dispersión (11/11)

Varianza (propiedades)

Var (aX+b)= a2Var(X)

Es un operador cuadrático (Teorema de Pitágoras)

COMPARACIÓN DE DISPERSIONES (Coeficiente de variación)

xCV σ

=

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

4. Medidas de forma (1/6)

Una forma de valorar cuantitativamente la forma del perfil de una distribución de frecuencias

¿qué valores de una distribución pueden considerarse atípicos?

Apuntamiento Curtosis

Simetría Coeficiente de Fisher

Criterio MedidaGráfico

Probabilidades y Estadística I

4. Medidas de forma (2/6)

Momento centrado en el origen (definición formal)

Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:

n x.... x x

ar

n

r

2

r1

r+++

=

Momento centrado en la media (definición formal)

Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:

n x(x....x(x x(x

mr

nr

2r

1r

))) −++−+−=

Probabilidades y Estadística I

4. Medidas de forma (3/6)

Momentos (propiedades)

m1= 0m2 = Var (X)

a1= x

Var (X) = m2 = a2 – a12

2n n2i i

i 1 i 1x x

Var(X)n n

= =

= −

∑ ∑

Probabilidades y Estadística I

4. Medidas de forma (4/6)

Coef. de Fisher

n3

i3 i 1

1 3 3

(x x)m

n=

−γ = =

σ σ

1 0γ =1 0γ < 1 0γ >

(definición formal)

Probabilidades y Estadística I

4. Medidas de forma (5/6)

Curtosis (definición formal)

n4

i4 i 1

2 4 4

(x x)m 3 3

n=

−γ = − = −

σ σ

2 0γ =2 0γ < 2 0γ >

Probabilidades y Estadística I

4. Medidas de forma (6/6)

Datos atípicos

No atípico Atípico

Probabilidades y Estadística I

Esquema inicial

1. Introducción

2. Medidas de Centralización

3. Medidas de Dispersión

4. Medidas de Forma

5. Medidas de Relación

6. Representaciones gráficas. Diagrama de caja

7. Transformaciones de datos

Probabilidades y Estadística I

5. Medidas de relación (1/4)

Una forma de valorar cuantitativamente la relación lineal entre dos variables

Eliminar información redundante. Establecer causalidades

Probabilidades y Estadística I

5. Medidas de relación (2/5)

Momento centrado en el origen (definición formal)

Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).

r h r h r h1 1 2 2 n n

rhx y x y .... x y a

n+ + +

=

Momento centrado en la media (definición formal)

Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).

r h r h r h1 1 2 2 n n

r ,h(x X ) (y Y ) (x X ) (y Y ) .... (x X ) (y Y ) m

n− − + − − + + − −

=

Probabilidades y Estadística I

5. Medidas de relación (3/5)

Momentos bid. (interrelaciones)

COVARIANZA

Probabilidades y Estadística I

5. Medidas de relación (4/5)

Covarianza

DEPENDE DE LA MAGNITUD

Cov (X, Y) = m11

Probabilidades y Estadística I

5. Medidas de relación (5/5)

Coeficiente de correlación (covarianza normalizada)

x ,yx y

cov( X ,Y )ρσ σ

= x ,y1 1ρ− ≤ ≤

X

Y

X

Y

X

Y

X

Y

x ,y 1ρ = − x ,y1 0ρ− < <X

Y

X

Y

X

Y

X

Y

x ,y 0ρ =

X

Y

X

Y

X

Y

X

Y

x ,y0 1ρ< < x ,y 1ρ =