Miguel Angel Chong R. [email protected] 29 de ... · el resultado, en otras palabras se...

41
Introducci´on Inferencia Estad´ ıstica Miguel ´ Angel Chong R. [email protected] 29 de septiembre del 2011 Miguel Chong CNSF IIMAS-UNAM

Transcript of Miguel Angel Chong R. [email protected] 29 de ... · el resultado, en otras palabras se...

Page 1: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Inferencia Estadıstica

Miguel Angel Chong [email protected]

29 de septiembre del 2011

Miguel Chong CNSF IIMAS-UNAM

Page 2: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Calendario

clase 1 29 de septiembre de 2011 E. puntual clase 12 15 de diciembre de 2011 Evaluacion

clase 2 06 de octubre de 2011 E. puntual clase 13 12 de enero de 2012 P. Hipotesis

clase 3 13 de octubre de 2011 E. puntual clase 14 19 de enero de 2012 P. Hipotesis

clase 4 20 de octubre de 2011 E. puntual clase 15 26 de enero de 2012 P. Hipotesis

clase 5 27 de octubre de 2011 E. puntual clase 16 02 de febrero de 2012 P. Hipotesis

clase 6 03 de noviembre de 2011 E. puntual clase 17 09 de febrero de 2012 P. Hipotesis

clase 7 10 de noviembre de 2011 E. puntual clase 18 16 de febrero de 2012 Evaluacion

clase 8 17 de noviembre de 2011 Evaluacion clase 19 23 de febrero de 2012 A. de Regresion

clase 9 24 de noviembre de 2011 E. intervalos clase 20 01 de marzo de 2012 A. de Regresion

clase 10 01 de diciembre de 2011 E. intervalos clase 21 08 de marzo de 2012 A. de Regresion

clase 11 08 de diciembre de 2011 E. intervalos clase 22 15 de marzo de 2012 Trabajo

Miguel Chong CNSF IIMAS-UNAM

Page 3: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Una caracterıstica del humano es tratar de interpretar losfenomenos que lo rodean, aprender del mundo a partir de lo que seobserva y de su experiencia a lo largo del tiempo. A partir de estasexperiencias uno aprende a hacer deducciones utiles del mundo enque vive. No en valde parte de metodo cientıfico tiene como partefundamental la observacion.

Miguel Chong CNSF IIMAS-UNAM

Page 4: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Hay una gran variedad de fenomenos que quisieramos describir,pero podemos empezar por clasificarlos entre fenomenosdeterministas y fenomenos aleatorios.Un fenomeno determinista es aquel que, cuando se reproduce enlas mismas condiciones, podemos predecir con certeza cual va a serel resultado, en otras palabras se rige bajo leyes causales. Este tipode fenomenos no son parte de nuestro estudio.Por otro lado, el fenomeno aleatorio es el que cada vez que serealiza, aun bajo condiciones casi identicas, el resultado no seconoce con certeza, ademas que el resultado solo se sabe despuesde realizado el experimento.

Miguel Chong CNSF IIMAS-UNAM

Page 5: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Las herramientas con la que contamos para estudiar los fenomenos aleatoriosson:

1 la probabilidad

1 como un grado de confianza o fundada apariencia de que algosuceda.

2 En los juegos o probabilidad clasica, es la razon entre el numero decasos favorables y el numero de casos posibles.

3 y su formalizacion basada en planteamiento axiomatico deKolmogorov en 1933.

2 y la estadıstica.

1 que es el estudio de los datos cuantitativos de la poblacion, ademasque

2 es la rama de la matematica que utiliza grandes conjuntos de datosnumericos para hacer inferencias.

3 la estadıstica clasica o frecuentista se basa en la regularidadestadıstica, es decir que, al repetir un fenomeno aleatorio unnumero grande de veces en condiciones constantes, las proporcionesen las que ocurren los posibles resultados son muy estables.

4 la estadıstica subjetiva o Bayesiana que incorpora el conocimientoque tiene el individuo sobre el fenomeno aleatorio.

Miguel Chong CNSF IIMAS-UNAM

Page 6: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Poblacion y muestra

Definamos como poblacion a todos los elementos presentan una caracterıstica comun que estamos estudiando,acerca de la cual intentamos sacar alguna conclusion. Y entenderemos como una muestra a un subconjunto deelementos de la poblacion.¿Por que estudiamos muestras en vez de la poblacion? Porque en ocasiones es poco factible o hasta imposibleobservar la totalidad de los individuos, es por esto que en lugar de examinar toda la poblacion, se estudia una

pequena muestra1

de la poblacion.Una muestra de tamano n en general, es decir sin fijar los valores la denotaremos como

X = {X1, X2, X3, . . . , Xn} .

Por otro lado cuando ya hemos observado los valores de la muestra2

, la escribiremos como

x = {X1 = x1, X2 = x2, X3 = x3, . . . , Xn = xn} .

Y siempre que la variable que midamos sea numerica, una vez que tenemos una muestra de tamano n{X1, X2, X3, . . . , Xn} entonces podemos obtener la muestra ordenada y la denotaremos como

{X(1), X(2), X(3), . . . , X(n)

},

donde X(1) es la observacion mas chica, X(2) es la segunda observacion mas chica, y ası sucesivamente hasta que

X(n) representa la observacio mayor.

1Que debe ser representativa de la poblacion.

2Una realizacion de la muestra.

Miguel Chong CNSF IIMAS-UNAM

Page 7: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Estadıstica descriptiva

La estadıstica descriptiva tiene como fin presentar resumen de un conjunto de datosX = {X1,X2,X3, . . . ,Xn} y poner de manifiesto sus caracterısticas, medianterepresentaciones numericas y graficas. Los datos se usan para fines comparativos, y nose usan principios de probabilidad. El interes se centra en describir el conjunto dado dedatos y no se plantea el extender las conclusiones a otros datos diferentes o a unapoblacion.

Estadıstica descriptiva =

Numericamente

Medidas de tendencia central

Media

Mediana

Moda

Percentiles

Deciles

Cuartiles

Medidas de dispersion

Varianza muestral

Desviacion estandar

Rango

Rango intercuantil

Coeficiente de variacion

Graficamente

Histograma

Grafico de tallo y hojas

Distribucion acumulada

.

.

.

Miguel Chong CNSF IIMAS-UNAM

Page 8: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Medidas de tendencia central

Media X

X =n∑

i=1

Xi

n

Mediana X es el valor tal que el 50% de los datos sonmenores que el y el 50% son mayores. Aquı hay que distinguirentre dos casos:

Si el tamano de la muestra n es par entonces X =X

( n2 )

+X( n

2+1)

2

Por otro lado si el tamano de la muestra es impar X = X( n+12 ).

Moda: es el valor o categorıa mas frecuente.

Miguel Chong CNSF IIMAS-UNAM

Page 9: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Cuantiles

El cuantil o porcentil de α%, Pα% es aquel valor tal que un α% delos datos son menores a el y un (1− α) % de ellos es mayor a el, esdecir

X(1), X(2), . . . , X(p−1)︸ ︷︷ ︸ P25%Primer cuartil

25%

, X(p), . . . , X(q)︸ ︷︷ ︸25%︸ ︷︷ ︸

50%

, P50%Segundo cuartil

X(q+1), . . . X(s−1),

︸ ︷︷ ︸75%

P75%tercer cuartil

X(s), . . . , X(n−1), X(n)︸ ︷︷ ︸25%

Miguel Chong CNSF IIMAS-UNAM

Page 10: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Medidas de dispersion

1 Varianza muestral se define como S2 =

∑n

i=1(Xi−X)

2

n−1 , y la

desviacion estandar es S =√S2.

2 Rango R = X(n) − X(1)

3 Rango intercuantil RIC = P75% − P25%

4 Coeficiente de variacion cv =S

X× 100

Miguel Chong CNSF IIMAS-UNAM

Page 11: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Medidas de dependencia

1 Medidas de dependencia entre dos muestras X = {X1, X2, X3, . . . , Xn} y Y = {Y1, Y2, Y3, . . . , Yn}de tamano n

1 Covarianza medida de variabilidad conjunta

cov (X , Y ) =

∑ni=1

(Xi − X

) (Yi − Y

)n − 1

2 Coeficiente de Correlacion si la varianza es desconocida

rX Y =cov (X , Y )

SX ∗ SY

=

∑ni=1

(Xi − X

) (Yi − Y

)√(∑n

i=1

(Xi − X

)2) (∑n

i=1

(Yi − Y

)2)

Observaciones

1 rX Y mide la correlacion lineal entre dos conjuntos de datos(X1, Y1) , (X2, Y2) , . . . , (Xn, Yn) .

2 Se puede probar que =1 ≤ rX Y ≤ 1.

3 Si rX Y ≈ 1 o rX Y ≈ −1 entonces podrıamos escribir yi ≈ β0 + β1xi , parai = 1, . . . , n, donde β0,β1 ∈ R. Mas aun, si rX Y ≈ =1 entonces β1 < 0, en cambio,si rX Y ≈ 1 entonces β1 > 0.

4 si rX Y ≈ 0, lo unico que podrıamos afirmar es que nuestras muestras no guardan ningunaasociacion lineal. No podemos afirmar que las muestras sean independientes. El unicocaso en el que rX Y = 0 implica independencia es cuando las dos muestras sigan unadistribucion normal.

Miguel Chong CNSF IIMAS-UNAM

Page 12: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Estadıstica descriptiva

Estadıstica descriptiva vıa graficasHistogramasUn histograma es una grafica en forma de barras, donde las bases de las barrasson una particion del rango muestral, R = X(n) − X(1), es decir,X(1) = a0 < a1 < . . . < ak−1 < ak = X(n) y esto forma las siguientes marcas declase:

[a0, a1] (a1, a2] (a2, a3] . . . (ak−2, al−1] (ak−1, ak ],

y la altura de cada barra es la frecuencia o numero de elementos que cae encada marca del clase.Un histograma se usa cuando se estudia una variable continua, por ejemplopara ver las franjas de edades o alturas de una muestra.Existen varios criterios para determinar el numero de marcas de clases o barras,una de ellas es la regla de Sturgess que establece que k =

√n, aunque otras

personas recomiendan tomar k = log (n) + 1. Siempre sera recomendableexperimentar con varios valores de k dependiendo de como esten los datos ycuantos sean.

Miguel Chong CNSF IIMAS-UNAM

Page 13: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Estadıstica descriptiva

Frecuencia acumulada o funcion de distribucion empırica acumuladaSupongamos que tenemos una muestra X = {X1,X2,X3, . . . ,Xn}, y al ordenarla muestra tenemos

X(1),X(2),X(3), . . . ,X(n).

Entonces la funcion de distribucion empırica acumulada o frecuencia acumuladase define como la proporcion de los datos menores o iguales a x .

Fn(x) =

0 x ∈(−∞,X(1)

)un

x ∈[X(u),X(u+1)

)y u ∈ {1, . . . , n − 1}

1 x ∈[X(n),∞

)

Miguel Chong CNSF IIMAS-UNAM

Page 14: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Estadıstica descriptiva

Los diagramas de cajaLos diagramas de caja y brazos para una muestra X = {X1,X2,X3, . . . ,Xn} esuna tecnica de analisis exploratorio de datos que nos puede servir para

ver que tan dispersos estan los datos

si hay simetrıa entre los datos o no

la deteccion de valores atıpicos

Un diagrama de caja y brazos lo podemos hacer como sigue:De la muestra ordenada X(1),X(2),X(3), . . . ,X(n) encontramos el primer cuartilP25% y el tercer cuartil P75% y dibujamos la caja o rectanculo cuyos extremosson (P25%,P75%), dentro del rectangulo dibujamos con una linea la posicion dela mediana, P50%.El lımite inferior del brazo, Li sera la observacion mayor o igual al numeroP25% − 1.5× RIC = P25% − 1.5× (P75% − P25%).El lımite superior del brazo, Ls sera la observacion menor o igual al numeroP25% + 1.5× RIC = P25% + 1.5× (P75% − P25%).Consideraremos como valores atıpicos a los valores situados fuera del intervalo(Li , Ls ).

Miguel Chong CNSF IIMAS-UNAM

Page 15: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Variables aleatorias

Antes de hacer Inferencia Estadıstica estudiaremos algunos de losmodelos probabilısticos que nos seran de gran utilidad para hacerInferencia.Algunas funciones de distribucion discretas

Nombre Parametro P (X = x) Rango E (X ) Var (X )

Bernoulli p ∈ (0, 1) px (1− p)1−x x ∈ {0, 1} p p(1− p)

Binomial n ∈ N, p ∈ (0, 1)(

nx

)px (1− p)n−x x ∈ {0, 1, . . . , n} np np(1− p)

Geometrica p ∈ (0, 1) p (1− p)x−1 x ∈ {1, 2, . . .} 1p

1−p

p2

Binomial Negativa p ∈ (0, 1)(

x−1k−1

)pk (1− p)x−k x ≥ k k

pk(1−p)

p2

Poisson λ ∈ (0,∞) e−λλx

x!x ∈ {0, 1, 2, . . .} λ λ

Miguel Chong CNSF IIMAS-UNAM

Page 16: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Variables aleatorias

Algunas funciones de distribucion continuas

Nombre Parametro fX (x) Rango E (X ) Var (X )

Uniforme a < b, a, b ∈ R 1b−a

x ∈ (a, b) b+a2

(b−a)2

2

Beta α, β ∈ (0,∞) = R+ Γ(α+β)Γ(α)Γ(β)

xα−1 (1− x)β−1 x ∈ (0, 1) αα+β

αβ

(α+β)2(α+β+1)

Exponencial λ ∈ R+ λe−λx x ∈ (0,∞) 1λ

1λ2

Gamma α, β ∈ R+ βα

Γ(α)xα−1e−βx x ∈ (0,∞) α

βαβ2

Normal µ ∈ R,σ2 ∈ R+ 1√2πσ2

exp

{− (x−µ)2

2σ2

}x ∈ R µ σ2

Miguel Chong CNSF IIMAS-UNAM

Page 17: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Variables aleatorias

NotacionDiremos que la v.a. X sigue cierta una distribucion FX (x), de lassiguientes formas

X ∼ fX (x)

X ∼ FX (x)

X ∼ nombre de la v.a. y sus parametros

Miguel Chong CNSF IIMAS-UNAM

Page 18: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Variables aleatorias

Independencia entre variables aleatoriasDiremos que las variables aleatorias X y Y son independientes, si ysolo si FX Y (x , y) = FX (x)FY (y) para todo (x , y) ∈ R2 otambien si fX Y (x , y) = fX (x) fY (y) para todo (x , y) ∈ R2.

Miguel Chong CNSF IIMAS-UNAM

Page 19: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Variables aleatorias

Podemos hablar de vectores aleatorios de dimension mayor a tres. Supongamos quetenemos n variables aleatorias unidimensionales X1,X2, . . . ,Xn. Entonces podemosdefinir laLa funcion de distribucion conjunta de X1,X2, . . . ,Xn como FX1X2···Xn : Rn → [0, 1]dada por

FX1X2···Xn (x1, x2, . . . , xn) = P (X1 ≤ x1,X2 ≤ x2, . . . ,Xn ≤ xn) .

Si suponemos independencias entre las variables aleatorias X1,X2, . . . ,Xn entoncestenemos que

FX1X2···Xn (x1, x2, . . . , xn) = P (X1 ≤ x1)P (X2 ≤ x2)× . . .× P (Xn ≤ xn)

=n∏

i=1

P (Xi ≤ xi )

=n∏

i=1

F (xi ) .

O equivalentemente

fX1X2···Xn (x1, x2, . . . , xn) =n∏

i=1

fXi(xi ) .

Miguel Chong CNSF IIMAS-UNAM

Page 20: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Esperanza

A continuacion recordemos algunas caracterısticas importantes de lasvariables aleatorias.EsperanzaLa esperanza matematica3 de una v.a. X es un promedio ponderado deacuerdo a la distribucion teorica de probabilidades del fenomenoestudiado. O tambien lo podemos ver como el valor hacıa el que tenderıala media aritmetica x si se tenıan un numero suficientemente grande deobservaciones del fenomeno.La esperanza de una v.a. X, lo denotaremos por E (X ), y lo calcularemoscomo sigue:

E (X ) =

x∈Rango(X )x · P (X = x) si la v.a.X es discreta,

∫∞−∞ x · fX (x) dx si la v.a.X es continua.

3O sus sinonimos: Esperanza, valor esperado, media poblacional, media,primer momento.

Miguel Chong CNSF IIMAS-UNAM

Page 21: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Esperanza

E (X ) puede no existir, es decir que no es un numero sino tiender a ∞ o −∞.Entonces para que podamos garantizar que el valor esperado E (X ) exista si

si solo si =

x∈Rango(X ) |x | · P (X = x) <∞ si la v.a.X es discreta,

∫∞−∞ |x | · fX (x) dx <∞ si la v.a.X es continua.

Miguel Chong CNSF IIMAS-UNAM

Page 22: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Esperanza

Propiedades de la Esperanza

1 Supongamos que k es constante, entonces la esperanza de una constante esigual a la misma constante, es decir

E (k) = k.

2 Sean X1,X2, . . . ,Xn v.a.´s, entonces la esperanza matematica de la suma (oresta) de variables aleatorias es igual a la suma (o resta) de las esperanzas decada una de esas variables aleatorias, es decir que

E (X1 ± X2 ± . . .± Xn) = E (X1)± E (X2)± . . .± E (Xn) .

3 Sean X1,X2, . . . ,Xn v.a.´s, independientes, entonces la esperanza de unproducto de v.a.´s es igual al producto de las esperanzas de cada una de lasv.a.´s, si y solo si son X1,X2, . . . ,Xn independientes

E (X1 · X2 · . . . · Xn) = E (X1) · E (X2) · . . . · E (Xn) .

4 Sea X una v.a. y b una constante real, entonces la esperanza de una v.a. masuna constante es igual a la esperanza de la v.a. mas la constante, es decir

E (X + b) = E (X1) + b.

5 Sea X una v.a. y a una constante real, entonces la esperanza matematica deuna constante por una v.a. es igual a la constante por la esperanza de la v.a.

E (aX ) = aE (X1) .Miguel Chong CNSF IIMAS-UNAM

Page 23: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

La esperanza de una funcion evaluada en una v.a.Comencemos diciendo que si X una variable aleatoria y g(X ) una funcion de lavariable X , entonces g(X ) tambien es una variable aleatoria. Y por lo tantodefiniremos E (g(X )) de la siguiente manera:

E (g(X )) =

x∈Rango(X )g(x) · P (X = x) si la v.a.X es discreta,

∫∞−∞ g(x) · fX (x) dx si la v.a.X es continua.

Y nuevamete para garantizar que E (g(X )) exista debe pasar que

x∈Rango(X )|g(x)| · P (X = x) <∞ si la v.a.X es discreta,

∫∞−∞ |g(x)| · fX (x) dx <∞ si la v.a.X es continua.

Noten que podemos obtener la esperanza de g(X ) a traves de la distribucion deprobabilidad de la variable aleatoria X , sin necesidad de primero calculardistribucion de probabilidad de g(X ).

Miguel Chong CNSF IIMAS-UNAM

Page 24: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

En particular si proponemos la transformacion g(X ) = X r , entoncesE (g(X )) = E (X r ) se le conoce como el r -esimo momentos con respecto a elorigen, y en forma compacta lo denotamos por E (X r ) = αr .Un resultado muy importate nos dice que si el momento de orden t existe,entonces todos los momentos de orden inferior existen. En sımbolos esto seescribe ası

αt = E(X t) <∞ entonces αr = E (X r ) <∞, con r ≤ t.

Los momentos con respecto al origen mas usados son:

α0 = E(X 0)

= 1,

α1 = E (X ) = µ,

α2 = E(X 2),

α3 = E(X 3)

y

α4 = E(X 4)

Miguel Chong CNSF IIMAS-UNAM

Page 25: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Por otro lado, si definimos g(X ) = (X − µ)r , donde E (X ) = µ. Entonces aE ((X − µ)r ) lo llamamos el r -esimo momento respecto a la media y lodenotaremos por µr = E ((X − µ)r ).Los momentos con respecto a la media mas usados son:

µ1 = E((X − µ)1) = 0,

µ2 = E((X − µ)2), ası definiremos la variaza

µ3 = E((X − µ)3), se usa para calcular es sesgo poblacional.

µ4 = E((X − µ)4), se usa para calcular la kurtosis poblacional.

Miguel Chong CNSF IIMAS-UNAM

Page 26: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Notemos que los momentos con respecto a la media, µr , se pueden calcular apartir de los momentos con respecto al origen αr . Por ejemplo

µ2 = E(

(X − µ)2)

= E(X 2 − 2µX + µ2

)= E

(X 2)− 2µE (X ) + µ2

= E(X 2)− 2µ2 + µ2

= α2 − α21

= E(X 2)− (E (X ))2

De manera analoga podemos calcular µk = E(

(X − µ)k)

usando el binomio de

Newton, la unica condicion que necesitamos es que los momentos con respectoal origen αj = E

(X j)

para j ∈ {1, 2, . . . , k} existan, que de hecho es

equivalente a decir que αk = E(X k)

exista.

Miguel Chong CNSF IIMAS-UNAM

Page 27: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Varianza

El momento de segundo orden con respecto a la media

µ2 = E(

(X − µ)2)

lo conoceremos como la varianza, o denotado

por Var(X ) o σ2 y es una medida que refleja que tan dispersosesperamos que esten los valores que toma la v.a. con respecto dela media µ.

Miguel Chong CNSF IIMAS-UNAM

Page 28: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Propiedades de la varianza

La varianza siempre es mayor o igual a cero, puesto que estamoscalculando la esperanza de (X − µ)2 ≥ 0. La varianza de una variablealeatoria que o muestra dispercion sera cero.

Si X es una v.a. con segundo momento y c es una constante real,entonces Var (cX ) = c2Var (X ).

Si X es una v.a. con segundo momento y b es una constante real,entonces Var (X + b) = Var (X ).

Si definimos el Error Cuadratico Medio como, ECM(X ) = E((X − u)2),

con u ∈ R. Es decir, ECM(X ) representa la dispersion de la v.a. alrededor de algun numero real u. Entonces se puede probar que

minu∈R

E(

(X − u)2)

= E(

(X − µ)2)

= Var (X ) .

Miguel Chong CNSF IIMAS-UNAM

Page 29: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Sean X y Y dos v.a. y el primer momento de cada v.a. lo representaremoscomo sigue: E (X ) = α10 y E (Y ) = α01, entonces como

E (X ± Y ) = E (X )± E (Y )

= α10 ± α01.

Entonces la varianza de la v.a. X ± Y es por definicion

Var (X ± Y ) = E({(X ± Y )− (α10 ± α01)}2

)definicion

= E({(X − α10)± (Y − α01)}2

)reordenando

= E(

(X − α10)2)

+ E(

(Y − α01)2)± 2 · E ((X − α10) (Y − α01))

= Var(X ) + Var(Y )± 2 · Cov (X ,Y ) .

A la expresion E ((X − α10) (Y − α01)) la conocemos como la covarianzaentre las v.a.´s X y Y , y la denotamos por el sımbolo Cov (X ,Y ) o comoσX Y .Si Cov (X ,Y ) > 0 significa que cuando la v.a. X crece (disminuye)tambien la v.a. Y crece (disminuye).Si Cov (X ,Y ) < 0 significa que cuando la v.a. X crece (disminuye) la v.a.Y disminuye (crece).Si Cov (X ,Y ) = 0 entonces Var (X ± Y ) = Var(X ) + Var(Y ).

Miguel Chong CNSF IIMAS-UNAM

Page 30: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Observaciones

Si X y Y son v.a. independes entonces la covarianza es cero pues

Cov (X ,Y ) = E ((X − α10) (Y − α01)) por independencia

= E (X − α10)E (Y − α01)

= 0 · 0 = 0.

Y por lo tanto

Var (X ± Y ) = Var(X ) + Var(Y ).

Pero es muy importante notar que Cov (X ,Y ) = 0 no implicanecesariamente independencia entre las v.a.´s.

La desviacion tıpica o estandar es la parte positiva de la raız cuadrada dela varianza, y la denotaremos por σ. Esta medida tambien representa quetanta dispersion hay en la v.a., pero σ esta en las mismas unidades que lamedia µ de la v.a.

Miguel Chong CNSF IIMAS-UNAM

Page 31: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

El sesgo lo definiremos como γ1 =µ3

σ3, bajo este contexto

γ1 = 0 nos indica una distribucion simetrica con respecto a µ.γ1 < 0 nos indica una distribucion asimetrica positiva conrespecto a µ.γ1 > 0 nos indica una distribucion asimetrica negativa conrespecto a µ.

Miguel Chong CNSF IIMAS-UNAM

Page 32: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

La kurtosis la definiremos como γ2 =µ4

σ4− 3, bajo este contexto

γ2 = 0 nos indica una distribucion mesocurticaγ2 < 0 nos indica una distribucion platocurtica o aplanadaγ2 > 0 nos indica una distribucion leptocurtica o puntiaguda.

Miguel Chong CNSF IIMAS-UNAM

Page 33: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

El coeficiente de correlacion lineal lo definimos como

ρ =Cov (X ,Y )√

Var(X )√Var(Y )

=σX Y

σXσY, y mide el grado de asociacion

lineal entre las variables aleatorias X y Y . A ρ2 lo llamaremos elcoeficiente de determinacion lineal, y se puede probar queρ2 ∈ [0, 1]. Por lo tanto −1 ≤ ρ ≤ 1.

Miguel Chong CNSF IIMAS-UNAM

Page 34: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Grosso modo llamaremos inferencia estadıstica al proceso de tratar deconocer algo relativo a la regularidad estadıstica de alguna medicion enuna cierta poblacion o fenomeno aleatorio. Supondremos que estaregularidad se puede modelar por con una v.a. X con una ciertadistribucion parametrica4. Entonces diremos que estamos haciendoinferencia estadıstica parametrica.

4El tipo de distribucion se asigna segun el contexto de nuestros datos.Miguel Chong CNSF IIMAS-UNAM

Page 35: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Definamos mas formalmente que entenderemos por una muestra.DefincionSea X la v.a. correspondiente a una poblacion con funcion dedistribucion F (x). Si X1,X2, . . . ,Xn son v.a.´s independientes eidenticamente distribuidas, F (x), en adelante denotado porv.a.i.i.d. Entonces a X1,X2, . . . ,Xn lo llamaremos muestraaleatoria simple o muestra aleatoria.

Miguel Chong CNSF IIMAS-UNAM

Page 36: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Estimacion de parametrosAhora una vez que suponemos que la poblacion sigue ciertocomportamiento distribucional F (x) (por ejemplo una normal), conbase en la informacion contenida en una muestra aleatoriaquisieramos saber cuales son los parametros adecuados (µ y/o σ,continuando con ejemplo de la normal).Un estimador es una formula que establece como calcular unaestimacion basada en las mediciones contenidas en una muestra.Entonces un estimador es una funcion de la muestra5 y a su vez esuna variable aleatoria.A continuacion daremos un breve respaso de algunas funciones dedistribucion que nos seran de gran utilidad.

5Que no depende del parametro que deseamos estimar.Miguel Chong CNSF IIMAS-UNAM

Page 37: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

DefinicionDiremos que una v.a. X se distribuye normal con media µ yvarianza σ2, denotado por X ∼ N(µ, σ2), si su funcion dedensidad es:

fX (x) =1

σ√

2πexp

{−(x − µ)2

2σ2

}, para −∞ < x <∞

donde , µ = E (X ), −∞ < µ <∞, Var (X ) = σ2 y σ2 > 0.A partir de cualquier v.a. X ∼ N(µ, σ2) con σ2 > 0, podemosllevarla a una v.a. normal estandar Z ∼ N(0, 1) haciendo lasiguiente transformacion

Z =X − µσ

,

a este proceso se le llama estandacion o estandarizar la v.a. X .

Miguel Chong CNSF IIMAS-UNAM

Page 38: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Una v.a. χ2 se genera a partir de la suma de variables aleatoriasindependientes normales con media cero y varianza uno. Es decir, siZ1,Z2, . . . ,Zk ∼ N (0, 1) y son independientes entonces si definimos lanueva v.a. W como

W = Z 21 + · · ·+ Z 2

k ,

entonces diremos W se distribuye como una ji cuadrada con kgrados de libertad, y lo denotaremos como W ∼ χ2

k .Observaciones

1 El numero de terminos en la suma son los grados de libertad.

2 Se puede probar que la esperanza de W es k, es decir queE (W ) = k, y

3 la varianza de W es 2k, es decir Var (W ) = 2k.

Miguel Chong CNSF IIMAS-UNAM

Page 39: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Si Z ∼ N(0, 1) y W ∼ χ2k donde Z y W son independiente. Si entonces

la v.a. definida por la transformacion

Y =Z√

Wk

,

diremos que Y se distribuye t de Student con k grados de libertad,y lo denotaremos por Y ∼ tk .Observaciones

Los grados de libertad de tk son los mismos grados de la χ2 que lagenera.

Esta funcion de distribucion es parecida a la normal centrada en cero

en el sentido de que tambien es simetrica alrededor del cero,pero la tk se diferencıa de la normal en que tiene colas maspesadas.Cuando los grados de libertad k tienden a infinito, entonces tk

tiende a una N (0, 1), y lo podemos escribir comotk −→ N (0, 1) cuando k →∞.

Miguel Chong CNSF IIMAS-UNAM

Page 40: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Si d1 y d2 son numeros enteros positivos y definimos las siguentes v.a.´scomo V ∼ χ2

d1 y W ∼ χ2d2 donde V y W son independiente. Entonces

la v.a. definida por la transformacion

K =V/d1W/d2

,

se dice que K se distribuye F de Snedecor con d1 y d2 grados delibertad, y lo denotaremos por K ∼ Fd1,d2.Observaciones

Los grados de libertad d1 y d2 de la Fd1,d2 los determinan losgrados de la χ2 en el numerador y en el denominadorrespectivemete.

Si K ∼ Fd1,d2 entonces1

K=K−1 ∼ Fd2,d1.

Miguel Chong CNSF IIMAS-UNAM

Page 41: Miguel Angel Chong R. miguel@sigma.iimas.unam.mx 29 de ... · el resultado, en otras palabras se rige bajo leyes causales. Este tipo de fenomenos no son parte de nuestro estudio.

Introduccion

Distribucion de estadısticos muestralesLos estadısticos muestrales los usaremos para estimar loscorrespondientes parametros poblacionales. Como los estadısticosmuestrales son una funcion de una muestra aleatoria (X1, . . . ,Xn),estos estadısticos son tambien variables aleatorias en algunos casosno es difıcil calcular su distribucion de probabilidad. Es importantenotar que la distribucion exacta de los estadısticos dependera deltamano muestral n, y en algunos casos habra que tomar unamuestra grande y utilizar la distribucion lımite apropiada.En concreto nos centraremos en saber la distribucion de losestadısticos X y S2 que son muy utiles en diferentes aplicacionesestadısticas, pero antes de calcula la distribucion de estosestadısticos veamos los siguientes resultados.

Miguel Chong CNSF IIMAS-UNAM