Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III...

14
Tema 4: Variables aleatorias III Estadística- Biología sanitaria Marcos Marvá Ruiz Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 1 / 14

Transcript of Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III...

Page 1: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Tema 4: Variables aleatorias III

Estadística- Biología sanitaria

Marcos Marvá Ruiz

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 1 / 14

Page 2: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Media y varianza de una v.a. continua

Para un variable aleatoria discreta con valores x1, . . . , xk y probabilidades p1, . . . , pk :

µ = E(X) =k∑

i=1

xi · pi

σ2 = Var(X) =k∑

i=1

(xi − µ)2 · pi

Para una variable aleatoria continua con densidad f (x) se tiene:

µ = E(X) =∫ ∞−∞

x · f (x) dx

σ2 = Var(X) =∫ ∞−∞

(x − µ)2 · f (x) dx

Para pasar de discreto a continuo cambia sumatorio por integral y la probabilidad pipor el diferencial de probabilidad dp = f (x) dx (sección 5.4.2 del libro)

No hay sorpresa: la media de la curva normal es µ y su varianza es σ2.Calcula la media y la varianza de la función del ejemplo anteriorEstadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 2 / 14

Page 3: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Ejemplo: media y varianza de una v.a. continua

1 Comprobar que la función f (x) = 38 x2 si 0 ≤ x ≤ 2, f (x) = 0 si x /∈ [0, 2] es una

función de probabilidad.2 Calcular P(0.5 < X ≤ 1.5)3 Calcular la media y la varianza

Escribir el cálculo y resolver con WolframAlpha

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 3 / 14

Page 4: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Función de distribución: F (k) = P(X ≤ k).Esto se traduce de forma diferente para v.a. discreta (izquierda) y continua (derecha) :

F (xk) =k∑

i=1

P(X = xi ) F (k) =∫ k

−∞f (x) dx

La gráfica de F también es diferente en el caso discreto (izq) y continuo (dcha)

−1 1 3 5

0.0

0.8

−4 0 2 4

0.0

0.8

Para un intervalo [a, b] se cumple esta propiedad que hace que F sea más útil que f :

P(a < X < b) = F (b)− F (a)

Problema inverso: percentiles dado p ∈ (0, 1), encontrar x∗ tal que

P(X < x∗) = p

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 4 / 14

Page 5: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Ejemplo:sea X ∼ N(10, 3) esLa probabilidad de que X esté entre 9 y 12

pnorm(q = 12, mean = 10, sd = 3) - pnorm(q = 9, mean = 10, sd = 3)

## [1] 0.3780661

El percentil 70 de una v.a.

qnorm(p = 0.7, mean = 10, sd = 3)

## [1] 11.5732

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 5 / 14

Page 6: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

QQPLOTs: ¿son normales estos datos?Idea: comparar (estandarizados o no)

Percentiles muestrales: los de de los datosPercentiles teóricos: los que tendrían si la población subyacente fuera normal

−2 0 2

−2

02

4

Presión diastólica Framingham

Theoretical Quantiles

Sam

ple

Qua

ntile

s

−3 −2 −1 0 1 2 3

−2

−1

01

2

Longitud caparazón "crabs"

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 6 / 14

Page 7: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Detectar la normalidad gráficamente, muestras grandespar(mfrow = c(2,3))muestra = rnorm(200); hist(muestra, main = "Muestra normal", cex.main = .8)boxplot(muestra, main = "Muestra normal", cex.main = .8)qqnorm(muestra, main = "Muestra normal", cex.main = .8)qqline(muestra, lwd = 3, col = "purple")muestra2 = rexp(200, rate = .4)hist(muestra2, main = "Muestra NO normal", cex.main = .8)boxplot(muestra2, main = "Muestra NO normal", cex.main = .8)qqnorm(muestra2, main = "Muestra NO normal", cex.main = .8)qqline(muestra2, lwd = 3, col = "purple")

Muestra normal

muestra

Fre

quen

cy

−3 −2 −1 0 1 2

010

2030

40

−3

−2

−1

01

2

Muestra normal

−3 −2 −1 0 1 2 3

−3

−2

−1

01

2

Muestra normal

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Muestra NO normal

muestra2

Fre

quen

cy

0 2 4 6 8 10 12

020

4060

02

46

810

Muestra NO normal

−3 −2 −1 0 1 2 3

02

46

810

Muestra NO normal

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 7 / 14

Page 8: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Detectar la normalidad gráficamente, muestras pequeñaspar(mfrow = c(2,3))muestra = rnorm(15)hist(muestra, main = "Muestra normal", cex.main = .8)boxplot(muestra, main = "Muestra normal", cex.main = .8)qqnorm(muestra, main = "Muestra normal", cex.main = .8)qqline(muestra)muestra2 = rnorm(20)hist(muestra2, main = "Muestra normal", cex.main = .8)boxplot(muestra2, main = "Muestra normal", cex.main = .8)qqnorm(muestra2, main = "Muestra normal", cex.main = .8)qqline(muestra2)

Muestra normal

muestra

Fre

quen

cy

−2 −1 0 1 2

01

23

45

−1.

5−

0.5

0.5

1.5

Muestra normal

−1 0 1

−1.

5−

0.5

0.5

1.5

Muestra normal

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Muestra normal

muestra2

Fre

quen

cy

−2 −1 0 1 2

01

23

45

−2

−1

01

Muestra normal

−2 −1 0 1 2

−2

−1

01

Muestra normal

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 8 / 14

Page 9: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Propiedades de X ∼ N(µ, σ)

Regla 68 - 95 - 99. Si X ∼ N(µ, σ) entonces se cumplen estas aproximaciones:P(µ− σ < X < µ+ σ) ≈ 0.683,

P(µ− 2σ < X < µ+ 2σ) ≈ 0.955

P(µ− 3σ < X < µ+ 3σ) ≈ 0.997

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 9 / 14

Page 10: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Propiedades de X ∼ N(µ, σ)Problema: Imposible calcular la primitiva de fµ,σ.

Solución: Aproximar numéricamente.

Si X ∼ N(µ, σ), la variable que se obtiene mediante la transformación de tipificación:

Z = X − µσ

es una variable normal N(0, 1), la normal estándar, a la que llamaremos Z . Además

P(a < X < b) = P(a − µ

σ< Z <

b − µσ

)Ejemplo: considera X ∼ N(5, 0.5), entonces P(5 < X < 6) = P(0 < Z < 2)

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 10 / 14

Page 11: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Propiedades de X ∼ N(µ, σ): la tabla (para conectar, si la conocías)

Ejemplo: Si X ∼ N(5, 0.5), calcular P(5< X < 6)

Ejemplo: Si X ∼ N(0, 1), calcular a tal que P(X < a) = 0.7Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 11 / 14

Page 12: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Propiedades de la media y la varianza

Sean X1,X2 son dos variables aleatorias, a, b ∈ R se tiene:1 E(X1 + X2) = E(X1) + E(X2)2 Si X1 y X2 son independientes, Var(X1 + X2) = Var(X1) + Var(X2)3 E(a · X + b) = a · E(X) + b4 Var(a · X + b) = a2 · Var(X)

Propiedades válidas para variables aleatorias continuas (más adelante)

Ejemplos:

Para 1 y 2: media y varianza binomial a partir de Bernoulli.Para 3: cambio de unidades afín (Fahrenheit = 32 + 9

5 Celsius).

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 12 / 14

Page 13: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

Propiedades de la normal X ∼ N(µ, σ)

Si X1 ∼ N(µ1, σ1) y X2 ∼ N(µ2, σ2) son independientes, entonces:

X = aX1 + bX2 ∼ N(µX = aµ1 + nµ2, σX =√

a2σ21 + b2σ2

2)

Esto se extiende a la combinación lineal de cualquier número de normales

Ejemplo: Dispones de dos medios de cultivo celular, A y B. Los fabricantes aseguran quela concentración de nutrientes es:

En el medio A, en promedio, de 10gr/dm3, con una desviación típica de 0.5gr/dm3

En el medio B, en promedio, de 12gr/dm3, con una desviación típica de 0.6gr/dm3

Si mezclas 4dm3 de A con 6dm3 de B:

1 Determina la concentración esperada y su desviación típica.2 Si las concentraciones XA y XB siguen distribuciones normales, ¿qué distribución sigue

la concentración del nuev medio de cultivo (la mezcla)?

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 13 / 14

Page 14: Tema 4: Variables aleatorias III · 2019. 10. 15. · Tema 4: Variables aleatorias III Estadística-Biologíasanitaria MarcosMarváRuiz Estadística- Biología sanitaria Tema 4: Variables

La distribución uniforme

La distribución uniforme en el intervalo [a, b]Esta distribución representa la idea intuitiva de que todos los puntos del intervalo sonigual de probables. (¡Pero, cuidado, esa idea es inútil! ¿Ves por qué?)Es más acertado pensar que ninguna parte del intervalo es más probable que otraLa función de densidad apropiada es constante en [a, b] y vale 0 fuera:

f (x) =

1

b − a si a ≤ x ≤ b

0 en otro caso

Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 14 / 14