Esta Di Stica

20
 Probabilidad La probabilidad es una medición numérica que va de 0 a 1 de la posibilidad de que un evento ocurra. Si da cerca de 0 es improbable que ocurra el evento y si da cerca de uno es casi seguro que ocurra. P (a): n de resultados en que ocurra a ! de resultados posibles Tipos de sucesos "#$austivo: se dice que dos o m%s sucesos son e#$austivos si se consideran todos los posibles resultados. Simbólicamente: p (& o ' o...) 1 !o e#$austivos: se dice que dos o m%s sucesos son e#$austivos si no cubren todos los posibles resultados. utuamente e#cluyentes: sucesos que no pueden ocurrir en *orma simult%nea: P(& y ') 0 y p(& o ') p(&) + p (') ",emplo: $ombres- mu,eres !o mutuamente e#cluyentes: sucesos que pueden ocurrir en *orma simult%nea: P (& o ') p (&) + p (') p (& y ') ",emplo: $ombres- o,os ca*és /ndependientes: Sucesos cuya probabilidad no se ve a*ectada por la ocurrencia o no ocurrencia del otro : P ( &/ ' ) P ( & ) P ( '/& ) P (') P (& ') P(&) P(') ",emplo: se#o y color de o,os 2ependientes: sucesos cuya probabilidad cambia dependiendo de la ocurrencia o no ocurrencia del otro: P ( &/ ' ) di*iere de p (&) P ( '/& ) di*iere de P(') P (& ') P ( & ) P ( '/& ) P (') P ( &/ ' ) ",emplo: ra3a y color de o,os Distribución maestral EST ADISTICA Página 1

description

Esta Di SticaEsta Di SticaEsta Di SticaEsta Di SticaEsta Di Stica

Transcript of Esta Di Stica

Universidad Andina del Cusco

ProbabilidadLaprobabilidades una medicin numrica que va de 0 a 1 de la posibilidad de que un evento ocurra. Si da cerca de 0 es improbable que ocurra el evento y si da cerca de uno es casi seguro que ocurra.P (a): n de resultados en que ocurra aN de resultados posiblesTipos de sucesos Exhaustivo: se dice que dos o ms sucesos son exhaustivos si se consideran todos los posibles resultados.Simblicamente: p (A o B o...) = 1 No exhaustivos: se dice que dos o ms sucesos son exhaustivos si no cubren todos los posibles resultados. Mutuamente excluyentes: sucesos que no pueden ocurrir en forma simultnea:P(A y B) = 0 y p(A o B) = p(A) + p (B)Ejemplo: hombres, mujeres No mutuamente excluyentes: sucesos que pueden ocurrir en forma simultnea:P (A o B) = p (A) + p (B) ? p (A y B)Ejemplo: hombres, ojos cafs Independientes: Sucesos cuya probabilidad no se ve afectada por la ocurrencia o no ocurrencia del otro :P ( AI B ) = P ( A ); P ( BIA ) = P (B) Y P (A Y B) = P(A) P(B)Ejemplo: sexo y color de ojos Dependientes: sucesos cuya probabilidad cambia dependiendo de la ocurrencia o no ocurrencia del otro:P ( AI B ) difiere de p (A); P ( BIA ) difiere de P(B);Y P (A Y B)= P ( A ) P ( BIA )= P (B) P ( AI B )Ejemplo: raza y color de ojosDistribucin maestralEl diagrama de rbol es muy til para visualizar las probabilidades condicional y conjunta y en particular para el anlisis de decisiones administrativas que involucran varias etapas.EJEMPLO: una bolsa contiene 7 fichas rojas (R) y 5 azules (B), se escogen 2 fichas, una despus de la otra sin reemplazo. Construya el diagrama de rbol con esta informacin.

ASIMETRAEs una medida de forma de unadistribucinque permite identificar y describir la manera como losdatostiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.1.1) TIPOS DE ASIMETRALa asimetra presenta las siguientes formas:Asimetra Negativa o a la Izquierda.-Se da cuando en una distribucin la minora de los datos est en la parte izquierda de la media. Este tipo de distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando elvalorde la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que lamoda, ensmbolosNota:Sesgo es elgradode asimetra de una distribucin, es decir, cunto se aparta de la simetra.Simtrica.-Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida como deLaplace(1749-1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su mediana y sumodason iguales, en smbolosMd=MoAsimetra Positiva o a la Derecha.-Se da cuando en una distribucin la minora de los datos est en la parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la izquierda.Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que lamoda, en smbolos

1.2) MEDIDAS DE ASIMETRACoeficiente de Karl Pearson

Donde:= media aritmtica.Md = Mediana.s = desviacin tpica o estndar.Nota:El Coeficiente de Pearson vara entre -3 y 3Si As < 0 ? la distribucin ser asimtrica negativa.Si As = 0 ? la distribucin ser simtrica.Si As > 0 ? la distribucin ser asimtrica positiva.Medida de Yule Bowley o Medida Cuartlica

Donde:= Cuartil uno;= Cuartil dos = Mediana;= Cuartil tres.Nota:La Medida de Bowley vara entre -1 y 1Si As < 0 ? la distribucin ser asimtrica negativa.Si As = 0 ? la distribucin ser simtrica.Si As > 0 ? la distribucin ser asimtrica positiva.Medida de FisherPara datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde:= cada uno delos valores; n = nmero de datos;= media aritmtica; f = frecuencia absoluta= cubo de la desviacin estndar poblacional; xm =marcade claseNota:Si As < 0 ?Indica que existe presencia de la minora de datos en la parte izquierda de la media, aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativaSi As = 0 ? la distribucin ser simtricaSi As > 0 ? Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica positivaEjemplo ilustrativo:Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17Solucin:Calculando la media aritmtica se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor6991212121517

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviacin estndar muestral se obtiene:

Calculando el Coeficiente de Pearson se obtiene:

Calculando la Medida de Bowley se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtieneDatos

6-166,375

9-15,625

9-15,625

120,125

120,125

120,125

1542,875

17166,375

Total12

Los clculos enExcelse muestran en la siguiente figura:

Nota:El COEFICIENTE.ASIMETRIA (A2:A9) es un valor que tiene consideraciones semejantes a la Medida de Fisher CURTOSISElCoeficiente de Curtosisanaliza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.Se definen 3 tipos de distribuciones segn su grado de curtosis:Distribucin mesocrtica:presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal).Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.Distribucin platicrtica:presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

ElCoeficiente de Curtosisviene definido por la siguiente frmula:

Los resultados pueden ser los siguientes:g2= 0(distribucin mesocrtica).g2> 0(distribucin leptocrtica).g2< 0 (distribucin platicrtica).Ejemplo: Vamos a calcular el Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos (leccin 2):VariableFrecuencias absolutasFrecuencias relativas

(Valor)SimpleAcumuladaSimpleAcumulada

xxxxx

1,20113,3%3,3%

1,214513,3%16,6%

1,224913,3%30,0%

1,232116,6%36,6%

1,241123,3%40,0%

1,252146,6%46,6%

1,2631710,0%56,6%

1,2732010,0%66,6%

1,2842413,3%80,0%

1,2932710,0%90,0%

1,3033010,0%100,0%

Recordemos que la media de esta muestra es 1,253S((xi- xm)^4)*niS((xi- xm)^2)*ni

xx

0,000049670,03046667

Luego:(1/30) * 0,00004967

g2=-------------------------------------------------- 3= -1,39

((1/30) * (0,03046667))^2

Por lo tanto, elCoeficiente de Curtosisde esta muestra es -1,39, lo que quiere decir que se trata de una distribucin platicrtica, es decir, con una reducida concentracin alrededor de los valores centrales de la distribucin.

SERIES DE TIEMPO

Se llama Series de Tiempo a un conjunto de mediciones de cierto fenmeno o experimento registrado secuencialmente en el tiempo. El primer paso para analizar una serie de tiempo es graficarla, esto permite: identificar la tendencia, la estacionalidad, las variaciones irregulares (componente aleatoria). Un modelo clsico para una serie de tiempo, puede ser expresada como suma o producto de tres componentes: tendencia, estacional y un trmino de error aleatorio. En adelante se estudiar como construir un modelo para explicar la estructura y prever la evolucin de una variable que observamos a lo largo del tiempo.Cinco son los objetivos de la leccin: Conocer los conceptos bsicos de series de tiempo, y aplicarlos en la modelacin. Al observar una serie de tiempo en un grfico, aprender a detectar las componentes esenciales de la serie. Aprender a construir los modelos de serie de tiempo, mediante las componentes: tendencia, estacional y un trmino de error aleatorio. Identificar el modelo adecuado para la serie que se est analizando. Predecir los datos de una serie de tiempo, de acuerdo con el modelo ms adecuado.CONCEPTOS BASICOS DE SERIES DE TIEMPO1.1 INTRODUCCINToda institucin, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar.Hoy en da diversas instituciones requieren conocer el comportamiento futuro de ciertos fenmenos con el fin de planificar, prever o prevenir.La planificacin racional exige prever los sucesos del futuro que probablemente vayan a ocurrir.La previsin, a su vez, se suele basar en lo que ha ocurrido en el pasado.Se tiene pues un nuevo tipo de inferencia estadstica que se hace acerca del futuro de alguna variable o compuesto de variables basndose en sucesos pasados.La tcnica ms importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es elanlisis de series de tiempo.Son innumerables las aplicaciones que se pueden citar, en distintas reas del conocimiento, tales como, en economa, fsica, geofsica, qumica, electricidad, en demografa, en marketing, en telecomunicaciones, en transporte, etc.Series De TiempoEjemplos

1. Series econmicas:- Precios de un artculo- Tasas de desempleo- Tasa de inflacin- ndice de precios, etc.

2. Series Fsicas:- Meteorologa- Cantidad de agua cada- Temperatura mxima diaria- Velocidad del viento (energa elica)- Energa solar, etc.

3. Geofsica:- Series sismologas

4. Series demogrficas:- Tasas de crecimiento de la poblacin- Tasa de natalidad, mortalidad- Resultados de censos poblacionales

5. Series de marketing:- Series de demanda, gastos, ofertas

6. Series de telecomunicacin:- Anlisis de seales

7. Series de transporte:- Series de trfico

Uno de los problemas que intenta resolver las series de tiempo es el de prediccin.Esto es dado una serie {x(t1),...,x(tn)} nuestros objetivos de inters son describir el comportamiento de la serie, investigar el mecanismo generador de la serie temporal, buscar posibles patrones temporales que permitan sobrepasar la incertidumbre del futuro.En adelante se estudiar como construir un modelo para explicar la estructura y prever la evolucin de una variable que observamos a lo largo del tiempo.La variables de inters puede ser macroeconmica (ndice de precios al consumo, demanda de electricidad, series de exportaciones o importaciones, etc.), microeconmica (ventas de una empresa, existencias en un almacn, gastos en publicidad de un sector), fsica (velocidad del viento en una central elica, temperatura en un proceso, caudal de un ro, concentracin en la atmsfera de un agente contaminante), o social (nmero de nacimientos, matrimonios, defunciones, o votos a un partido poltico).1.2 DEFINICIN DE SERIE DE TIEMPOEn muchas reas del conocimiento las observaciones de inters son obtenidas en instantes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales, trimestrales, semestrales o bien registradas por algn equipo en forma continua.LlamamosSerie de Tiempoa un conjunto de mediciones de cierto fenmeno o experimento registradas secuencialmente en el tiempo.Estas observaciones sern denotadas por {x(t1), x(t2), ..., x(tn)} = {x(t):tTR} conx(ti)el valor de la variablexen el instanteti.Si T = Z se dece que la serie de tiempo es discreta y si T = R se dice que la serie de tiempo es continua.Cuandoti+1- ti= k para todoi= 1,...,n-1, se dice que la serie es equiespaciada, en caso contrario ser no equiespaciada.En adelante se trabajar con series de tiempo discreta, equiespaciadas en cuyo caso asumiremos y sin perdida de generalidad que: {x(t1), x(t2), ..., x(tn)}= {x(1), x(2),...,x(n)}.1.3 PRIMER PASO AL ANALIZAR CUALQUIER SERIE DE TIEMPOEl primer paso en el anlisis de series de tiempo, consiste en graficar la serie. Esto nos permite detectar las componentes esenciales de la serie.El grfico de la serie permitir:a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal.Un outliers es una observacin de la serie que corresponde a un comportamiento anormal del fenmeno (sin incidencias futuras) o a un error de medicin.Se debe determinar desde fuera si un punto dado es outlier o no.Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie.Por ejemplo, en un estudio de la produccin diaria en una fabrica se present la siguiente situacin ver figura 1.1:Figura 1.1Los dos puntos enmarcados en un crculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondan a dos das de paro, lo que naturalmente afect la produccin en esos das.El problema fue solucionado eliminando las observaciones e interpolando.b) Permite detectar tendencia: la tendencia representa el comportamiento predominante de la serie.Esta puede ser definida vagamente como el cambio de la media a lo largo de un periodo (ver figura 1.2).

Figura 1.2c) Variacin estacional: la variacin estacional representa un movimiento peridico de la serie de tiempo.La duracin de la unidad del periodo es generalmente menor que un ao.Puede ser un trimestre, un mes o un da, etc (ver figura 1.3).Matemticamente, podemos decir que la serie representa variacin estacional si existe un nmerostal quex(t)=x(t + ks).Las principales fuerzas que causan una variacin estacional son las condiciones del tiempo, como por ejemplo:1) en invierno las ventas de helado2) en verano la venta de lana3) exportacin de fruta en marzo.Todos estos fenmenos presentan un comportamiento estacional (anual, semanal, etc.)Figura 1.3d) Variaciones irregulares (componente aleatoria):los movimientos irregulares (al azar) representan todos los tipos de movimientos de una serie de tiempo que no sea tendencia, variaciones estacionales y fluctuaciones cclicas.

2. MODELOS CLASICOS DE SERIES DE TIEMPO2.1 MODELOS DE DESCOMPOSICINUn modelo clsico para una serie de tiempo, supone que una seriex(1), ..., x(n)puede ser expresada como suma o producto de tres componentes:tendencia,estacionalidady un trmino deerror aleatorio.Existen tres modelos de series de tiempos, que generalmente se aceptan como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos observados.Estos son:1. Aditivo:X(t) = T(t) + E(t) + A(t)2. Multiplicativo:X(t) = T(t) E(t) A(t)3. Mixto:X(t) = T(t) E(t) + A(t)Donde:X(t)serie observada en instantetT(t)componente de tendenciaE(t)componente estacionalA(t)componente aleatoria (accidental)Una suposicin usual es queA(t)sea una componente aleatoria o ruido blanco con media cero y varianza constante.Un modelo aditivo (1), es adecuado, por ejemplo, cuandoE(t)no depende de otras componentes, comoT(t), s por el contrario la estacionalidad vara con la tendencia, el modelo ms adecuado es un modelo multiplicativo (2).Es claro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos.El problema que se presenta, es modelar adecuadamente las componentes de la serie.La figura 2.1 ilustra posibles patrones que podran seguir series representadas por los modelos (1), (2) y (3).

Figura 2.12.2 ESTIMACIN DE LA TENDENCIASupondremos aqu que la componente estacionalE(t)no est presente y que el modelo aditivo es adecuado, esto es:X(t) = T(t) + A(t),dondeA(t)es ruido blanco.Hay varios mtodos para estimarT(t).Los ms utilizados consisten en:1)Ajustar una funcin del tiempo, como un polinomio, una exponencial u otra funcin suave det.2)Suavizar (o filtrar) los valores de la serie.3)Utilizar diferencias.2.2.1 AJUSTE DE UNA FUNCINLos siguientes grficos ilustran algunas de las formas de estas curvas.1.T(t)= a + bt(Lineal)

2.T(t)= a ebt(Exponencial)

3.T(t)= a + b ebt(Exponencial modificada)

4.T(t)=b0+b1t,...,+bmtm(Polinomial)5.T(t)= exp(a + b(rt))(Gompertz 0 < r < 1)

6.T(t)=(Logstica)

Nota:i.la curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representacin de la tendencia a largo plazo.ii.La tendencia rectilnea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un perodo restringido de tiempo (por ejemplo).

Figura 2.2

BIBLIOGRAFIA Cintrn, G., Lugo, A. E., Pool, D. J. & Morris, G. (1978). Mangroves of arid environments in Puerto Rico and adjacent islands. Biotropica, 10(2),110-121. Goleman, D. (2000). La inteligencia emocional: Por qu es ms importante que el cociente intelectual. Mxico: Ediciones B. Castillo Ortiz, A. M. (Ed.). (2000). Administracin educativa: Tcnicas, estrategias y prcticas gerenciales. San Juan: Publicaciones Puertorriqueas. Estadstica Industrial Moderna. Diseo y control de la calidad y la confiabilidad. Ron S. Kenett, Shelemyahu Zacks. Internacional Thompson editores.2000.

ESTADISTICAPgina 13