Estadistica

89
0.5 setgray0 0.5 setgray1 Fundamentos de Estadística Introducción a la Estadística Prof. Dr. Eduardo Valenzuela Dom ´ ınguez [email protected] Universidad T ´ ecnica Federico Santa Mar´ ıa Dr. Eduardo Valenzuela D.; MEE 2005 – p. 1/6

Transcript of Estadistica

Page 1: Estadistica

0.5setgray0

0.5setgray1 Fundamentos de Estadística

Introducción a la Estadística

Prof. Dr. Eduardo Valenzuela Dom ınguez

[email protected]

Universidad Tecnica Federico Santa Marıa

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 1/61

Page 2: Estadistica

Introducción

Modelación

Realidad versus Modelo

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/61

Page 3: Estadistica

Introducción

Modelación

Realidad versus Modelo

• Modelos Deterministicos

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/61

Page 4: Estadistica

Introducción

Modelación

Realidad versus Modelo

• Modelos Deterministicos• Modelos no-Deterministicos

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/61

Page 5: Estadistica

Introducción

Modelación

Realidad versus Modelo

• Modelos Deterministicos• Modelos no-Deterministicos

Toma de decisiones bajo Incertidumbre

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/61

Page 6: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 7: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 8: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería• Compañías de Seguros

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 9: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería• Compañías de Seguros• Estudios de Mercado

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 10: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería• Compañías de Seguros• Estudios de Mercado• Control de Calidad

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 11: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería• Compañías de Seguros• Estudios de Mercado• Control de Calidad• Instrumentos Financieros

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 12: Estadistica

Definición

Estadistica: Mezcla entre ciencia y arte queentrega herramientas para modelar fenómenosno-deterministicosAlgunas aplicaciones:

• Ingeniería• Compañías de Seguros• Estudios de Mercado• Control de Calidad• Instrumentos Financieros• Medicina

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/61

Page 13: Estadistica

Algunos Términos

• Población: Colección completa de todas losindividuos de interes para el investigador.

• Parámetro: Valor que caracteriza un aspectode la población.

• Muestra: Subconjunto de la población y quees representativa de esta.

• Estadistico: Medida descriptiva de la muestraque se utiliza para estimar al respectivoparámetro poblacional.

• Variable: Caracteristica de la población quese analiza en el estudio estadistico. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 4/61

Page 14: Estadistica

Técnicas de Muestreo

• Muestreo Aleatorio simple: Procedimientomediante el cuál todas las muestras de undeterminado tamaño, poseen la misma"chance" de ser extraidas.

• Muestreo Aleatorio Estratificado: Esquemade muestreo que primero particiona a lapoblación en diversos "estratos" yposteriormente extrae una mustra aleatoriasimple en cada uno de ellos.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 5/61

Page 15: Estadistica

Muestreo

• Error muestral: Diferencia entre el valor delparámetro poblacional y el producido por elestadistico o estadigrafo basado en unamuestra.

• Sesgo muestral: Tendencia a favorecer laselección de determinados individuos de lapoblación.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 6/61

Page 16: Estadistica

Muestreo• Población vs Muestra• Muestreo implica Error muestral• Acotar la probabilidad de cometer errores

Estadistica• Descriptiva• Inferencial

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 7/61

Page 17: Estadistica

Tipos de Variables

• Variables cualitativas: Caracteristica querepresenta una cualidad de los individuospoblacionales.

• Variables cuantitativas: Caracteristica quecorresponde a una magnitud asociada a losindividuos de la población.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 8/61

Page 18: Estadistica

Escalas de Medición

• Escala nominal: Nombres o clases que seutilizan para organizar los datos encategorias separadas y distintas.

• Escala ordinal: Mediciones que jerarquizanlos datos en categorias, ordenadas en virtudde un determinado criterio.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 9/61

Page 19: Estadistica

Escalas de Medición

• Escala de intervalos: Mediciones respecto deuna escala numerica en la cual la diferenciaentre valores tiene interpretación y laubicación del cero es arbitrario.

• Escala de proporciones: Mediciones respectode una escala numerica en la cual tanto ladiferencia como los cuocientes tieneninterpretación y la ubicación del cero esabsoluto.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 10/61

Page 20: Estadistica

Estadistica Descriptiva

Proporciona procedimientos que permitenorganizar, procesar y presentar los datosmuestrales con el fin de extraer informaciónrelevante que este contenida en ellos.

Datos Muestrales

Clasificación

A1, A2, . . . , Ak : clases

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 11/61

Page 21: Estadistica

Número de clases

Si se dispone de n datos muestrales, se sueleusar la regla de “Sturges”:

k = [3, 3 · log n] + 1

Ejemplo: Para n = 1000, usar:

k = [3, 3 · log 1000] + 1 = [3, 3 · 3] + 1 = 9 + 1 = 10

clases

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 12/61

Page 22: Estadistica

Observaciones y Preguntas

• Las clases deben ser excluyentes y todoelemento muestral debe pertenecer a una deellas.

• ¿Existen clases que concentren mas datos?.• ¿Se presenta un comportamiento uniforme?.• ¿Se visualiza mas de un punto de

concentración?.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 13/61

Page 23: Estadistica

Construcción de clases

Si los datos muestrales estan medidos por lomenos al nivel de intervalos y si losrepresentamos por:

x1, x2, . . . , xn

entonces la amplitud de las clases es de:

c =max xi − min xi

k

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 14/61

Page 24: Estadistica

Construcción de clases

con esto se determinan los limites superior einferior de cada clase:

clase limites relacin

A1 [a1 → b1] b1 = a1 + c

A2 ]a2 → b2] b2 = a2 + c... ... ...

Ak ]ak → bk] bk = ak + c

en donde a1 = min xi y ak+1 = bk

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 15/61

Page 25: Estadistica

Ejemplo

Consideremos una muestra de n = 50 datos:68 72 50 70 65 83 77 78 80 9371 74 60 84 72 84 73 81 84 9277 57 70 59 85 74 78 79 91 10283 67 66 75 79 82 93 90 101 8079 69 76 94 71 97 95 83 86 69

numero de clases: k = [3, 3 log 50] + 1 = 6

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 16/61

Page 26: Estadistica

Continuación Ejemplo

min xi = 50 y max xi = 102, por lo quec = 102−50

6 = 8, 7 redondeando, tomaremos c = 9,con lo que las clases quedan:

clase limites marca de clase

A1 [50 → 59] 54, 5

A2 ]59 → 68] 63, 5

A3 ]68 → 77] 72, 5

A4 ]77 → 86] 81, 5

A5 ]86 → 95] 90, 5

A6 ]95 → 104] 99, 5Dr. Eduardo Valenzuela D.; MEE 2005 – p. 17/61

Page 27: Estadistica

Gráfico de Tallo y Hoja

Una forma alternativa de visualizar los datos, esmediante el gráfico de tallo y hoja:La coma decimal esta un digito ala derecha de los dos puntos:

5 : 0796 : 05678997 : 0011223445677889998 : 0012333444569 : 01233457

10 : 12

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 18/61

Page 28: Estadistica

Distribuciones de Frecuencias

Para descubrir como se “reparten” los datosentre las clases, consideraremos las frecuencias

• Frecuencia absoluta: Es el número deobservaciones muestrales que caen en cadaclase: ni, para i = 1, . . . , k.

• Frecuencia relativa: Es la proporción dedatos con respecto a toda la muestra quepertenecen a cada clase: fi, para i = 1, . . . , k.

• Se tiene que: fi = ni

n

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 19/61

Page 29: Estadistica

Distribuciones de Frecuencias

• Frecuencia absoluta acumulada: Es la sumaacumulada de las frecuencias absolutashasta cada clase: Ni, para i = 1, . . . , k. conNi =

∑ij=1 nj, para i = 1, . . . , k

• Frecuencia relativa acumulada: Es la sumaacumulada de las fercuencias relativas hastacada clase: Fi, para i = 1, . . . , k. conFi =

∑ij=1 fj, para i = 1, . . . , k

• Se tiene que: Fi = Ni

n

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 20/61

Page 30: Estadistica

Ejemplo

clase limites ni Ni fi Fi

A1 [50 → 59] 3 3 0, 06 0, 06

A2 ]59 → 68] 5 8 0, 10 0, 16

A3 ]68 → 77] 15 23 0, 30 0, 46

A4 ]77 → 86] 17 40 0, 34 0, 80

A5 ]86 → 95] 7 47 0, 14 0, 94

A6 ]95 → 104] 3 50 0, 06 1, 00

total 50 1, 00

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 21/61

Page 31: Estadistica

Representaciones Gráficas

Otra forma de representar la informaciónmuestral, es mediante gráficos

• Histograma: Se grafican las frecuencias conrespecto a las diversas clases.

• Poligono de frecuencias: Representa lasfrecuencias en las marcas de clases unidaspor segmentos de rectas.

• Distribucion de frecuencias acumuladas: Aquise representan las frecuencias acumuladashasta cada clase.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 22/61

Page 32: Estadistica

Representaciones Gráficas

• Ojiva: Poligonal que une las frecuenciasacumulativas en cada clase.

• Gráfico de barras: Las frecuencias serepresentan por barras proporcionales aellas.

• Gráficos circulares: Las frecuencias semuestran como sectores circulares.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 23/61

Page 33: Estadistica

Histograma

50 60 70 80 90 100 110

0.0

0.01

0.02

0.03

x

Histograma de x

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 24/61

Page 34: Estadistica

Ojiva

x

Fre

c

50 60 70 80 90 100

0.0

0.2

0.4

0.6

0.8

1.0

Ojiva de x

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 25/61

Page 35: Estadistica

Pastel

Grafico circular de x

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 26/61

Page 36: Estadistica

Estadistica descriptiva bivariada

Analisis descriptivo conjunto de dos o masvariables. Si (x1, y1), (x2, y2), . . . , (xn, yn) es unamuestra bivariada de las variables X e Y . Si kes el número de clases para X y l, para Y , sedefinen:

• Frecuencia absoluta conjunta: El número deobservaciones muestrales que caen en laclase Ai segun X y en la clase Bj segun Y .

ni,j , i = 1, . . . , k, j = 1, . . . , l

• Frecuencia relativa conjunta: Proporciónmuestral de ni,j. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 27/61

Page 37: Estadistica

Tablas de contingencia

Se definen las frecuencias marginales de X e Yrespectivamente por:

ni,. =l

j=1

ni,j , n.,j =k

i=1

ni,j

y las respectivas frecuencias relativas conjuntasy marginales por:

fi,j =ni,j

n, fi,. =

ni,.

n, f.,j =

n.,j

n

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 28/61

Page 38: Estadistica

Ejemplo

[10;30] ]30;50] ]50;70] ni,.

[1000;2000] 15 8 4]2000;3000] 5 12 9]3000;4000] 2 13 10]4000;5000] 1 16 18

n.,j 113

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/61

Page 39: Estadistica

Ejemplo

[10;30] ]30;50] ]50;70] ni,.

[1000;2000] 15 8 4 27]2000;3000] 5 12 9 26]3000;4000] 2 13 10 25]4000;5000] 1 16 18 35

n.,j 113

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/61

Page 40: Estadistica

Ejemplo

[10;30] ]30;50] ]50;70] ni,.

[1000;2000] 15 8 4]2000;3000] 5 12 9]3000;4000] 2 13 10]4000;5000] 1 16 18

n.,j 23 49 41 113

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/61

Page 41: Estadistica

Ejemplo

[10;30] ]30;50] ]50;70] ni,.

[1000;2000] 15 8 4 27]2000;3000] 5 12 9 26]3000;4000] 2 13 10 25]4000;5000] 1 16 18 35

n.,j 23 49 41 113

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/61

Page 42: Estadistica

Medidas de tendencia central

Son estadisticos que proporcionan valoresrepresentativos de la muestra, de tal manera quetodos los datos muestrales caen en torno a estosvalores.

• Moda• Mediana• Media ( geométrica )• Media ( aritmética )

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 30/61

Page 43: Estadistica

Si los datos muestrales han sido agrupados enclases y estas marcas de clase son x1, . . . , xk

con frecuencias relativas fi. Se define la mediade x por

x =k

i=1

fixi =1

n

k∑

i=1

nixi

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 31/61

Page 44: Estadistica

Medidas de variabilidad

Las medidas de variabilidad o de dispersión,pretenden cuantificar el grado de homogeneidadpresente en la muestra; determinan que tanconcentrados o dispersos estan los datos.Algunas medidad de dispersión son:

• Rango• Desviación media• Rango intercuartílico• Varianza y Desviación estandar

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 32/61

Page 45: Estadistica

La varianza se define por:

S2x =

k∑

i=1

fi(xi − x)2 =1

n

k∑

i=1

ni(xi − x)2

y la desviación estandar por:

Sx = +√

S2x

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 33/61

Page 46: Estadistica

Observación

Cabe hacer notar que cuando la varianzamuestral se usa como un estimador de lavarianza poblacional, su definición se modificalevemente en la forma:

S2 =1

n − 1

k∑

i=1

ni(xi − x)2

Esta varianza modificada es preferible comoestimador, pues posee mejores propiedades queS2

x.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 34/61

Page 47: Estadistica

Desigualdad de Tschebyscheff

Una interpretación interesante de la desviacionestandar es la proporcionada por la“Desigualdad de Tschebyscheff”, que planteaintuitivamente que:En todo conjunto de observaciones y para todonumero real r > 1, se tiene que al menos 1 − 1

r2

de ellas caen en el intervalo:

[x − rSx; x + rSx]

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 35/61

Page 48: Estadistica

Gráficamente:

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 36/61

Page 49: Estadistica

Resumen

Las principales medidas descriptivas de lamuestra son:

•Resumen de $x$

Min. 1st Q. Med. Mean 3rd Q. Max.50.00 71.00 78.50 78.36 84.00 102.00

N = 50 Median = 78.5Quartiles = 71; 84

Que pueden representarse gráficamente por:Dr. Eduardo Valenzuela D.; MEE 2005 – p. 37/61

Page 50: Estadistica

Gráfico de Cajón

-1.0

-0.5

0.0

0.5

1.0

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 38/61

Page 51: Estadistica

Elementos de Inferencia Estadística

Al modelar un fenómeno en la vida real, lasvariables que nos interesan generalmente son denaturaleza no-deterministica y en consecuenciapueden representarse por variables aleatorias.Para poder obtener probabilidades asociadas aestas variables aleatorias X, podemos ocupar sufuncion de distribucion FX :

FX(x) = P [X ≤ x]

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 39/61

Page 52: Estadistica

Problema

Pero en la mayoria de los casos, esta función,dependerá de parámetros desconocidos θ, esdecir tenemos:

FX(x; θ) = P [X ≤ x]

y para que estos modelos sean de algunautilidad, se requiere previamente estimar estosparametros a partir de informacion empíricarecopilada a partir de una muestra aleatoria deX.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 40/61

Page 53: Estadistica

Problemas

Esto nos lleva a los principales problemas de lainferencia estadistica:

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/61

Page 54: Estadistica

Problemas

Esto nos lleva a los principales problemas de lainferencia estadistica:

• Estimacion puntual.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/61

Page 55: Estadistica

Problemas

Esto nos lleva a los principales problemas de lainferencia estadistica:

• Estimacion puntual.• Estimacion por intervalos de confianza.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/61

Page 56: Estadistica

Problemas

Esto nos lleva a los principales problemas de lainferencia estadistica:

• Estimacion puntual.• Estimacion por intervalos de confianza.• Prueba de hipotesis.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/61

Page 57: Estadistica

Estimacion puntual

En el ámbito de la estimacion puntual se handesarrollado diversos metodos para “construir”estimadores puntuales, entre ellos:

Lo que hace necesario definir cualidades de losestimadores, para asi poder seleccionar el“mejor” entre varios posibles.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/61

Page 58: Estadistica

Estimacion puntual

En el ámbito de la estimacion puntual se handesarrollado diversos metodos para “construir”estimadores puntuales, entre ellos:

• Método de momentos.

Lo que hace necesario definir cualidades de losestimadores, para asi poder seleccionar el“mejor” entre varios posibles.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/61

Page 59: Estadistica

Estimacion puntual

En el ámbito de la estimacion puntual se handesarrollado diversos metodos para “construir”estimadores puntuales, entre ellos:

• Método de momentos.• Método de minimos cuadrados.

Lo que hace necesario definir cualidades de losestimadores, para asi poder seleccionar el“mejor” entre varios posibles.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/61

Page 60: Estadistica

Estimacion puntual

En el ámbito de la estimacion puntual se handesarrollado diversos metodos para “construir”estimadores puntuales, entre ellos:

• Método de momentos.• Método de minimos cuadrados.• Método de máxima verosimilitud.

Lo que hace necesario definir cualidades de losestimadores, para asi poder seleccionar el“mejor” entre varios posibles.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/61

Page 61: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 62: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

• Insesgamiento

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 63: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

• Insesgamiento• Varianza minima

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 64: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

• Insesgamiento• Varianza minima• Error cuadratico minimo

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 65: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

• Insesgamiento• Varianza minima• Error cuadratico minimo• Eficiencia

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 66: Estadistica

Propiedades

Entre las principales propiedades de losestimadores se cuentan:

• Insesgamiento• Varianza minima• Error cuadratico minimo• Eficiencia• Consistencia

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/61

Page 67: Estadistica

Ejemplo

Supongamos que la variable aleatoria X estadistribuida normalmente:

X ∼ N (µ, σ2)

Se dice que X1, . . . , Xn es una Muestra aleatoriade X, si:

• Los X1, . . . , Xn son independientes• Cada Xi posee la misma ditribucion que X

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 44/61

Page 68: Estadistica

Ejemplo

Usando estos “datos” se pueden obtenerestimadores puntuales de los parametros µ y σ2,los cuales poseen varias de las propiedadesanteriores; ellos son:

Xn =1

n

n∑

i=1

Xi

S2n =

1

n − 1

n∑

i=1

(Xi − Xn)2

que son la media y varianza muestral.Dr. Eduardo Valenzuela D.; MEE 2005 – p. 45/61

Page 69: Estadistica

Ejemplo

Notemos que los valores que estos estimadoresproducen, dependen de los valores muestrales yen consecuencia cambiaran de una a otramuestra.Esto nos lleva a considerar las distribucionesmuestrales de estos estimadores.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 46/61

Page 70: Estadistica

Distribuciones muestrales

Bajo la suposicion de que:

X ∼ N (µ, σ2)

se puede verificar que la distribucion empirica dela media muestral a partir de una muestraaleatoria de tamaño n es:

Xn ∼ N (µ,σ2

n)

que es nuevamente una normal.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 47/61

Page 71: Estadistica

Distribuciones muestrales

Analogamente la distribucion empirica de lavarianza muestral es:

(n − 1)S2n

σ2∼ χ2(n − 1)

que se denomina Chi cuadrado con n − 1 grados delibertad y que para usarla al igual que la normal,hay que recurrir a tablas estadisticas

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 48/61

Page 72: Estadistica

Otras distribuciones

Ademas de estas distribuciones, es necesarioconsiderar otras mas que aparecen en losprocesos de estimacion y prueba de hipotesis,ellas son:

• La distribucion t de student con k grados delibertad, que se simboliza por t(k).

• La distribucion Fisher con k y l grados de libertad,que se representa por F (k, l).

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 49/61

Page 73: Estadistica

Otras distribuciones

Analogamente a la distribucion normal ychi-cuadrado, para evaluar probabilidadesasociadas a ellas, es necesario obtener losvalores usando una tabla estadistica, unacalculadora que las tenga implementadas o unprograma computacional adecuado.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 50/61

Page 74: Estadistica

Observación

Cabe hacer notar que si bien es cierto estosestimadores puntuales, al evaluarlos en losdatos muestrales, nos proporcionan unaestimacion puntual, que sirve para aproximar elvalor desconocido del parametro en estudio;ellos no entregan idea alguna sobre el error quese produce en este proceso de estimacion.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 51/61

Page 75: Estadistica

Observación

Para poder cuantificar este error, se requeririaestimar los parametros por medio de un intervalode confianza, que nos indique una region quepudiera contener al parametro buscado, mas unaevaluacion de la proporcion de veces quetomaremos una decision correcta al usar esteprocedimiento, para estimar los parametros; estose conoce como el coeficiente de confianza

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 52/61

Page 76: Estadistica

Estimacion por intervalos de confianza

Llamaremos un intervalo de confianza para elparametro θ con coeficiente de confianza γ, a unintervalo del tipo:

[T1(X1, . . . , Xn);T2(X1, . . . , Xn)]

que cumpla:

P [T1 ≤ θ ≤ T2] ≥ γ

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 53/61

Page 77: Estadistica

Estimacion por intervalos de confianza

Se puede ver que si X ∼ N (µ, σ2), entonces elintervalo de confianza para µ con coeficiente deconfianza γ esta dado por:

[Xn −Sn√n· t(1+γ)/2(n− 1); Xn +

Sn√n· t(1+γ)/2(n− 1)]

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 54/61

Page 78: Estadistica

Observación

Existen algunas situaciones en las cuales lavarianza σ2 se conoce y por lo tanto no serequiere previamente estimarla.Tambien en aquellos casos en que el tamañomuestral n crece tendiendo a infinito n → ∞, sepuede verificar que la distribucion t de student seaproxima en un cierto sentido a la distribucionnormal.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 55/61

Page 79: Estadistica

Observación

Para estas situaciones, que se denominanmuestras grandes, el intervalo de confianza parala media muestral Xn se transforma en:

[Xn −σ√n· z(1+γ)/2; Xn +

σ√n· z(1+γ)/2]

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 56/61

Page 80: Estadistica

Continuación

Analogamente se puede obtener el intervalo deconfianza para σ2 con coeficiente de confianzaγ, resultando:

[

(n − 1) · S2n

χ(1+γ)/2(n − 1);

(n − 1) · S2n

χ(1−γ)/2(n − 1)

]

El uso de estos intervalos de confianza nospermite estimar los parametros de interes,indicando la “precision” que permiten obtener losdatos disponibles.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 57/61

Page 81: Estadistica

Prueba de Hipótesis

Existen situaciones en las cuales se tiene algunconocimiento previo sobre los parametros deuna distribución ( Hipotesis ) y se desea analizarsi este supuesto es consecuente con los datosmuestrales. Esto lleva a una Prueba deHipótesis, para lo que se necesita:

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 58/61

Page 82: Estadistica

Prueba de Hipótesis

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 83: Estadistica

Prueba de Hipótesis

• Una hipotesis nula H0.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 84: Estadistica

Prueba de Hipótesis

• Una hipotesis nula H0.• Una hipotesis alternativa H1.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 85: Estadistica

Prueba de Hipótesis

• Una hipotesis nula H0.• Una hipotesis alternativa H1.• Una funcion de los datos T (X1, . . . , Xn), cuya

distribución bajo H0 se conozca.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 86: Estadistica

Prueba de Hipótesis

• Una hipotesis nula H0.• Una hipotesis alternativa H1.• Una funcion de los datos T (X1, . . . , Xn), cuya

distribución bajo H0 se conozca.• Un nivel de significancia 0 < α < 1.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 87: Estadistica

Prueba de Hipótesis

• Una hipotesis nula H0.• Una hipotesis alternativa H1.• Una funcion de los datos T (X1, . . . , Xn), cuya

distribución bajo H0 se conozca.• Un nivel de significancia 0 < α < 1.• Una región de rechazo.

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/61

Page 88: Estadistica

Acciones

Al tomar la decisión de rechazar o no la hipótesisnula sobre la base de los datos muestrales, seproducen las siguientes posibilidades:

acción ; realidad H0 verdadera H0 falsa

rechazar H0 Error I Correcto

no rechazar H0 Correcto Error IILa idea es limitar a valores pequeños lasprobabilidades de estos errores. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 60/61

Page 89: Estadistica

Dr. Eduardo Valenzuela D.; MEE 2005 – p. 61/61