Fdp y Cdf Con Matlab

23
FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD Recopilación de la aplicación a la probabilidad con MATLAB, Richard F Choque, LP 2010 1. INTRODUCCIÓN Variable Aleatoria Sea S un espacio muestral, sobre el que se encuentra definida una función de probabilidad. Sea X una función de valor real definida sobre S, de manera que transforme los resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable aleatoria. X es una función definida sobre el espacio muestral, de manera que transforma todos los posibles resultados del espacio muestral en cantidades numéricas. Se dice que una variable aleatoria X es discreta si el número de valores que puede tomar es contable (ya sea finito o infinito), y si éstos pueden arreglarse en una secuencia que corresponde con los enteros positivos. En general una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X=x) se entenderá la probabilidad de que X tome el valor de x. Se dice que una variable aleatoria X es continua si sus valores consisten en uno o más intervalos de la recta de los reales. Función de Densidad de Probabilidad (PDF) Al considerar los valores de una variable aleatoria es posible desarrollar un función matemática que asigne una probabilidad a cada realización x de la variable aleatoria X. Esta función recibe el nombre de función de distribución (densidad) de probabilidad de la variable aleatoria X. Se refiere a la colección de valores de la variable aleatoria y a la distribución de probabilidades entre éstos. La probabilidad de que un valor x ocurra es P(x), expresado con un valor o un porcentaje (Discreto). La probabilidad de que x tenga un valor entre a y b viene dado por el área bajo la curva de P(x) (Continuo). La probabilidad de que x tenga un valor entre y es 1. La función de densidad de probabilidad es 0 o positiva. Función de Densidad Acumulativa (CDF o FDA) La función de distribución acumulativa de la variable aleatoria X es la probabilidad de que X sea menor o igual a un valor específico de x. La probabilidad de que x tenga una valor entre y a es dx ) x ( P x C a x x X P ) x ( C 1 0 ) x ( C para cualquier x j i x C x C si j i x x ) x ( C x X P 1

description

manual basico de matlab relacionado a la probabilidad

Transcript of Fdp y Cdf Con Matlab

Page 1: Fdp y Cdf Con Matlab

FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD Recopilación de la aplicación a la probabilidad con MATLAB, Richard F Choque, LP 2010 1. INTRODUCCIÓN Variable Aleatoria Sea S un espacio muestral, sobre el que se encuentra definida una función de probabilidad. Sea X una función de valor real definida sobre S, de manera que transforme los resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable aleatoria. X es una función definida sobre el espacio muestral, de manera que transforma todos los posibles resultados del espacio muestral en cantidades numéricas. Se dice que una variable aleatoria X es discreta si el número de valores que puede tomar es contable (ya sea finito o infinito), y si éstos pueden arreglarse en una secuencia que corresponde con los enteros positivos. En general una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X=x) se entenderá la probabilidad de que X tome el valor de x. Se dice que una variable aleatoria X es continua si sus valores consisten en uno o más intervalos de la recta de los reales. Función de Densidad de Probabilidad (PDF) Al considerar los valores de una variable aleatoria es posible desarrollar un función matemática que asigne una probabilidad a cada realización x de la variable aleatoria X. Esta función recibe el nombre de función de distribución (densidad) de probabilidad de la variable aleatoria X. Se refiere a la colección de valores de la variable aleatoria y a la distribución de probabilidades entre éstos. La probabilidad de que un valor x ocurra es P(x), expresado con un valor o un porcentaje (Discreto). La probabilidad de que x tenga un valor entre a y b viene dado por el área bajo la curva de P(x) (Continuo).

La probabilidad de que x tenga un valor entre y es 1. La función de densidad de probabilidad es 0 o positiva. Función de Densidad Acumulativa (CDF o FDA) La función de distribución acumulativa de la variable aleatoria X es la probabilidad de que X sea menor o igual a un valor específico de x.

• La probabilidad de que x tenga una valor entre y a es

dx)x(PxC

ax

xXP)x(C

• 10 )x(C para cualquier x

jixCxC

si jixx

• )x(CxXP 1

Page 2: Fdp y Cdf Con Matlab

2.- LAS DISTRIBUCIONES EN MATLAB Características clave El Statistics Toolbox proporciona funciones que soportan: • Modelización lineal y no lineal • Estadística multivariante • Estadística descriptiva • Cálculo y ajuste de distribuciones de probabilidad • Análisis de varianza (ANOVA) • Verificación de hipótesis • Estadística industrial (control de procesos estadísticos, diseño de experimentos) • Representación gráfica estadística y gráficos interactivos Statistics Toolbox El Statistics Toolbox incluye una GUIA interactiva que permite experimentar, describir o ajustar sus datos a una variedad de diferentes probabilidades. Por ejemplo, puede usar la GUI para representar gráficamente una función de densidad de probabilidad o una función de distribución acumulativa para investigar cómo los parámetros de distribución afectan a su posición y forma. Además, puede usar el generador de números aleatorios para simular el comportamiento asociado a distribuciones particulares. Usted puede usar entonces estos datos aleatorios para obtener modelos bajo diferentes condiciones. El Statistics Toolbox aporta 20 distribuciones de probabilidad diferentes. Las funciones soportadas para cada distribución incluyen: • Función de densidad de probabilidad (pdf) • Función de distribución acumulativa (cdf) • Inversa de la función de distribución acumulativa • Media y varianza • Generador de números aleatorios Hay disponibles funciones adicionales para calcular estimaciones de parámetros e intervalos de confianza para las distribuciones guiadas por los datos, por ejemplo beta, binominal, exponencial, gamma, normal, Poisson, uniforme y Weibull. Nota importante: Nos vamos a enfocar en la función de densidad de probabilidad (PDF) y en los generadores de números aleatorios (RND), que son los dos tipos de funciones.

Nota: teclear en MATLAB:

>>help stats

Aquí se mostrarán todas las funciones que hay para las distintas distribuciones. Para consultar la ayuda de alguna en particular, teclear help seguido de su nombre:

>>help normrnd

A continuación mostramos algunas de las funciones del Statistics Toolbox más útiles:

Distribuciones Funciones de Densidad de Probabilidad (pdf)

betapdf - Beta density

binopdf - Binomial density

Page 3: Fdp y Cdf Con Matlab

chi2pdf - Chi square density (chi cuadrado)

exppdf - Exponential density

fpdf - F density gampdf - Gamma density geopdf - Geometric density hygepdf - Hypergeometric density lognpdf - Lognormal density nbinpdf - Negative binomial density (pascal) ncfpdf - Noncentral F density nctpdf - Noncentral t density ncx2pdf - Noncentral Chi-square density normpdf - Normal (Gaussian) density pdf - Density function for a specified distribution poisspdf - Poisson density raylpdf - Rayleigh density tpdf - T density unidpdf - Discrete uniform density unifpdf - Uniform density weibpdf - Weibull density

Funciones de Distribución Acumulada (cdf)

betacdf - Beta cdf

binocdf - Binomial cdf cdf - Specified cumulative distribution function chi2cdf - Chi square cdf expcdf - Exponential cdf fcdf - F cdf gamcdf - Gamma cdf geocdf - Geometric cdf hygecdf - Hypergeometric cdf logncdf - Lognormal cdf nbincdf - Negative binomial cdf ncfcdf - Noncentral F cdf nctcdf - Noncentral t cdf ncx2cdf - Noncentral Chi-square cdf normcdf - Normal (Gaussian) cdf

poisscdf - Poisson cdf raylcdf - Rayleigh cdf tcdf - T cdf unidcdf - Discrete uniform cdf unifcdf - Uniform cdf weibcdf - Weibull cdf

Generadores de Números Aleatorios

betarnd - Beta random numbers

binornd - Binomial random numbers

chi2rnd - Chi square random numbers exprnd - Exponential random numbers frnd - F random numbers

Page 4: Fdp y Cdf Con Matlab

gamrnd - Gamma random numbers geornd - Geometric random numbers hygernd - Hypergeometric random numbers lognrnd - Lognormal random numbers mvnrnd - Multivariate normal random numbers mvtrnd - Multivariate t random numbers nbinrnd - Negative binomial random numbers ncfrnd - Noncentral F random numbers nctrnd - Noncentral t random numbers ncx2rnd - Noncentral Chi-square random numbers normrnd - Normal (Gaussian) random numbers poissrnd - Poisson random numbers random - Random numbers from specified distribution raylrnd - Rayleigh random numbers trnd - T random numbers unidrnd - Discrete uniform random numbers unifrnd - Uniform random numbers weibrnd - Weibull random numbers

Estadísticos

betastat - Beta mean and variance binostat - Binomial mean and variance chi2stat - Chi square mean and variance expstat - Exponential mean and variance fstat - F mean and variance gamstat - Gamma mean and variance geostat - Geometric mean and variance hygestat - Hypergeometric mean and variance lognstat - Lognormal mean and variance nbinstat - Negative binomial mean and variance ncfstat - Noncentral F mean and variance nctstat - Noncentral t mean and variance ncx2stat - Noncentral Chi-square mean and variance normstat - Normal (Gaussian) mean and variance poisstat - Poisson mean and variance raylstat - Rayleigh mean and variance tstat - T mean and variance

unidstat - Discrete uniform mean and variance unifstat - Uniform mean and variance weibstat - Weibull mean and variance

Disttool Es una herramienta de MATLAB que permite visualizar de forma gráfica las características de cada distribución con la posibilidad de variar sus parámetros. Las funciones que muestra son PDF y CDF. Al activar este comando: >> disttool Se despliega una ventana donde podemos elegir el tipo de distribución además de sus parámetros y ver su PDF o su CDF.

Page 5: Fdp y Cdf Con Matlab

2.1- FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD (PDF) 2.1.1- DISTRIBUCIONES CONTINUAS 2.1.1.1- DISTRIBUCIÓN UNIFORME CDF PDF

Descripción: • Computa la función de distribución uniforme continua para el valor X y los parámetros A y B. X, A y B deben ser del mismo tamaño. El parámetro B debe ser mayor que A. • Genera una matriz de tamaño m x n, formada por números aleatorios que cumplen que su distribución sobre la recta real es de la forma indicada. (m y n son parámetros opcionales y pueden no ser necesaria su inclusión). • El resultado Y es la probabilidad de que ocurra X en el intervalo (A,B). • La distribución uniforme estándar tiene A=0 y B=1. • Ocurre en un evento donde una variable aleatoria toma valores de un intervalo finito, de manera que éstos se encuentran distribuidos igualmente sobre el intervalo. Esto es, la probabilidad de que la variable aleatoria tome un valor en cada subintervalo de igual longitud es la misma. • Se aplica con un conocimiento muy general o poco conocimiento sobre la distribución. También para errores de redondeo en la medida, generación de números aleatorios y llegadas (cuando son independientes y el número total está determinado). Sintaxis:

Y = unifpdf(X,A,B,m,n) EJEMPLO 1. Coincidiendo con los valores de X, A y B para obtener las gráficas previas se tiene: >> Y = unifpdf(1,0,1) % X=1, A=0, B=1 Y se despliega: Y = 1

EJEMPLO 2. Para A y B fijados, para un rango de 0.1 a 0.6 , con diferencia de 0.1, la pdf uniforme es constante.

>> X = 0.1:0.1:0.6; Y = unifpdf(X) Y se despliega: Y = 1 1 1 1 1 1 Agregando plot(X,Y); grid; xlabel('x'); ylabel('p') para obtener la gráfica :

Page 6: Fdp y Cdf Con Matlab

EJEMPLO 3. ¿Qué ocurre si X no está Entre A y B? Y = unifpdf(-1,0,1) Y se despliega: Y = 0 EJEMPLO 4. La cantidad de agua consumida al mes en una vivienda, medida en m3, sigue una distribución uniforme continua en el intervalo (20, 40). Calcula la probabilidad de que se consuman: (a) 28 m3, (b) menos de 35 m3 , (c) entre 25 y 35 m3 , (d) más de 28 m3 . Calcular la función de distribución, así como el número esperado de m3 consumidos. Del enunciado obtenemos los extremos del intervalo es decir A = 20 y B=40

a) se requiere encontrar la probabilidad )X(P 28

>> Y = unifpdf(28,20,40) Y = 0.0500

Es decir que 0500028 .)X(P

b) menos de 35 m3, es decir la probabilidad )X(P 35

>> Y = unifcdf(35,20,40) % el comando unifcdf para calcular la función de densidad % acumulada Y = 0.7500

Es decir que 7500035 .)X(P

c) entre 25 y 35 m3, )X(P 3525

>> Y = unifcdf(35,20,40)- unifcdf(25,20,40) % se evalúa para la CDF para el límite % superior = 35 menos % el límite inferior = 25 Y = 0.5000

Es decir que 50003525 .)X(P

d) más de 28m3 , es decir )X(P)X(P 28128

>> Y = 1 - unifcdf(28,20,40) Y = 0.6000

Es decir que : 600028 .)X(P Para la gráfica de la función de distribución acumulada: >> X = 20:40; Y = unifcdf(X,20,40) Se despliega Y = Columns 1 through 9

Page 7: Fdp y Cdf Con Matlab

0 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 0.4000 Columns 10 through 18 0.4500 0.5000 0.5500 0.6000 0.6500 0.7000 0.7500 0.8000 0.8500 Columns 19 through 21 0.9000 0.9500 1.0000 >> plot(X,Y); >> grid

y despliega :

Para el valor esperado no es más que 302

4020

)x(E

Es decir que el valor esperado es 30 m3. 2.1.1.2- DISTRIBUCIÓN NORMAL (GAUSIANA) PDF CDF

Descripción: • Computa la función de distribución exponencial negativa para el valor X y los parámetros MU y SIGMA. X, MU y SIGMA pueden ser vectores, matrices y arreglos que deben ser del mismo tamaño. El parámetro SIGMA debe ser positivo. • La distribución normal estándar tiene MU = 0 y SIGMA = 1. • Fluctuaciones simétricas alrededor de un valor medio (MU). • Se aplica para describir atributos humanos o de objetos: peso, altura, etc. dentro

De lo que se puede deducir que la

pendiente es positiva, es 20

1 y pasa por

X=20 Entonces

40

4020

20

020

200

X

X

XX

)x(FCDF

Ajustando con el MATLAB nos da la ecuación: y = 0.05* x - 1

Page 8: Fdp y Cdf Con Matlab

de un grupo (variaciones en las notas de exámenes), medidas de errores angulares o lineales, generación de ruido y pequeñas perturbaciones, datos meteorológicos como temperatura y precipitación pluvial, errores de instrumentación, etc. Sintaxis:

Y = normpdf(X,MU,SIGMA) EJEMPLO 5. Coincidiendo con los valores de X, MU y SIGMA la gráfica de la PDF previa se tiene: >> Y = normpdf(0.019048,0,1) % X=0.019048, MU = 0, SIGMA= 1 Y se despliega:

Y = 0.3989 EJEMPLO 6. Si MU es un arreglo de valores entre 0 y 2, con una diferencia de 0.1 >> mu = [0:0.1:2]; % el rango va desde 0 a 2, con un incremento de 0.1, teniendo 21

% valores >> Y = normpdf(1.5,mu,1) Y se despliega: Y = Columns 1 through 8 0.1295 0.1497 0.1714 0.1942 0.2179 0.2420 0.2661 0.2897 Columns 9 through 16 0.3123 0.3332 0.3521 0.3683 0.3814 0.3910 0.3970 0.3989 Columns 17 through 21 0.3970 0.3910 0.3814 0.3683 0.3521 EJEMPLO 7. Si X es un arreglo de valores entre 150 y 180, con una diferencia de 5 >> X = (150:5:180); Y = normpdf(X,165,5) % con MU = 165 y SIGMA = 5 Y se despliega: Y = 0.0009 0.0108 0.0484 0.0798 0.0484 0.0108 0.0009 Agregando: plot(X,Y); grid; xlabel('x'); ylabel('p') para obtener la gráfica de la izquierda.

Page 9: Fdp y Cdf Con Matlab

EJEMPLO 8. Una compañía de suministro de electricidad ha determinado que el consumo, medido en Kw/h, de una vivienda familiar durante un mes, sigue una distribución normal de media 300 y desviación típica 50. (a) Calcula la probabilidad de que una familia consuma 245 kw/h en un mes. (b) Calcula la probabilidad de que se consuman entre 200 y 300 Kw/h. (c) ¿Qué porcentaje de viviendas consumirán más de 300 kw/h? (d) ¿Qué porcentaje de viviendas familiares consumirán más de 250 Kw/h? ¿Y menos de 350? Del enunciado tenemos, que MU= 200 y el SIGMA =50

a) se quiere encontrar )X(P 245

>> Y = normpdf(245,200,50) Despliega Y = 0.0053

Es decir que 00530245 .)X(P

b) se quiere encontrar 300200 XP

>> Y = normcdf(300,200,50) - normcdf(200,200,50) % se evalúa para la CDF para el % límite superior = 300 menos % el límite inferior = 200 Y = 0.4772

c) se quiere encontrar )X(P)X(P 2001200

>> Y = 1- normcdf(200,200,50) Y = 0.5000

d) más de 250 Kw/h )X(P 250

>> Y = 1- normcdf(250,200,50) Y = 0.1587

Menos de 350 )X(P 350

>> Y = normcdf(350,200,50) Y = 0.9987 2.1.1.3- DISTRIBUCIÓN EXPONENCIAL (NEGATIVA) PDF CDF

Page 10: Fdp y Cdf Con Matlab

Descripción: • Computa la función de distribución exponencial negativa para el valor X y el parámetro MU. X y MU deben ser del mismo tamaño. El parámetro MU debe ser positivo. • La pdf exponencial es la pdf gamma con su primer parámetro (a) igual a 1. • La variable aleatoria exponencial es el tiempo que transcurre hasta que se da el primer evento de Poisson. Es decir, la distribución exponencial puede modelar el lapso entre dos eventos consecutivos de Poisson que ocurren de manera independiente y a una frecuencia constante. • Se utiliza en sucesos independientes entre sí. Es apropiada para modelar tiempos de espera cuando dicho tiempo se supone independiente del tiempo que haya transcurrido hasta ese momento. Por ejemplo, la probabilidad de que una bombilla deje de lucir en el próximo minuto es relativamente independiente del tiempo que haya estado luciendo hasta ahora. Tiempos entre roturas, tamaño de pedidos, tiempos de procesos, llegada de personas a una tienda y, en general, acciones por unidad de tiempo. Sintaxis: Y = exppdf(X,MU) EJEMPLO 9. Coincidiendo con los valores X y MU de la gráfica de la PDF previa se tiene: >> Y = exppdf(10,3) % con X= 10 y MU = 3 Y se despliega: Y = 0.0119 EJEMPLO 10. Con un arreglo de valores para X desde 1 a 5 al igual que para MU en el mismo rango, se tiene: >> Y = exppdf(1:5,1:5) Y se despliega: Y = 0.3679 0.1839 0.1226 0.0920 0.0736 Para obtener la gráfica del ejemplo, definimos X primero y luego de esta manera con el comando plot(X,Y): >> X = (1:1:5); >> Y = exppdf(X,1:1:5) >> plot(X,Y); grid; xlabel('x'); ylabel('p') Y se despliega el gráfico:

Page 11: Fdp y Cdf Con Matlab

2.1.1.4- DISTRIBUCIÓN LOG-NORMAL PDF CDF

Descripción:

Computa la función de distribución log-normal para el valor X con media MU y desviación estándar SIGMA. X, MU y SIGMA deben ser del mismo tamaño, que determina el tamaño de Y.

Es una distribución normal asimétrica.

Se utiliza para modelar tiempos de procesos y reparación, averías de un coche con el tiempo, población de un sitio con respecto al dinero, estancia de tiempo en un banco, etc. Sintaxis: Y = lognpdf(X,MU,SIGMA)

EJEMPLO 11. Coincidiendo con los valores X y MU de para obtener la gráfica de la PDF previa se tiene: >> Y = lognpdf(3,0,1) Y = 0.0727 EJEMPLO 12. Con un arreglo de valores para X desde el 1 al 10, tomados de uno en uno

>> X = (1:1:10); % arreglo desde 1 a 10, tomados de 1 en 1 Y = lognpdf(X,0,1) % con MU = 0 y SIGMA = 1 Y = Columns 1 through 8 0.3989 0.1569 0.0727 0.0382 0.0219 0.0134 0.0086 0.0057 Columns 9 through 10 0.0040 0.0028 para incluir la gráfica, se agregan: plot(X,Y); grid; xlabel('x'); ylabel('p')

Page 12: Fdp y Cdf Con Matlab

2.1.1.5- DISTRIBUCIÓN GAMMA (ERLANG) PDF CDF

Descripción:

Computa la función de distribución gamma para el valor X y los parámetros A y B. X, A y B deben ser del mismo tamaño. A y B deben ser positivos y X tiene que estar dentro

del intervalo ),[ 0 .

La pdf de gamma es útil en los modelos de dependencia de ciclos de vida. La distribución gamma es más flexible que la exponencial. Los casos especiales de la función gamma son las funciones: exponencial y chi-cuadrado.

Se aplica para tiempos de procesos, tiempos de reparación, tiempos entre llegadas (con poca aleatoriedad), incluso ingresos familiares, edad del hombre al contraer matrimonio por primera vez, etc. Sintaxis:

Y = gampdf(X,A,B) EJEMPLO 13. Coincidiendo con los valores X, A y B de para obtener las gráficas previas de la PDF y de la CDF se tiene: >> Y = gampdf(1,1,2) % donde X=1, A=1 y B=2 Y se despliega: Y = 0.3033 EJEMPLO 14. Con un arreglo de valores para B, desde 1 a 5, de 1 en 1, con X=1 y A=1 >> X =(1:1:5); Y = gampdf(1,1,X) Y se despliega: Y = 0.3679 0.3033 0.2388 0.1947 0.1637 Incluyendo la gráfica, tenemos:

Page 13: Fdp y Cdf Con Matlab

2.1.1.6 DISTRIBUCIÓN BETA: CDF PDF

Descripción:

Computa la función de distribución gamma para el valor X y los parámetros A y B. X, A y B deben ser del mismo tamaño. A y B deben ser positivos y X tiene que estar dentro del intervalo [0,1].

La distribución uniforme en [0,1] es un caso derivado de la distribución beta donde A=1 y B=1.

X, A, y B pueden ser vectores, matrices, o arreglos multidimensionales que tengan la misma dimensión. Una entrada escalar se expande a un arreglo constante con las mismas dimensiones de las otras entradas.

La distribución beta para un valor dado x y un par de parámetros a y b es

)x(Ixxb,aB

b,axfy),(

ba

10

11 11

donde B( · ) es la función Beta. La function inidcador )x(I),( 10

asegura que solo los valores

de x en el rango (0 1) tengan una probabilidad distinta a cero. La distribución uniforme en (0 1) es un caso degenerado de la pdf de beta donde a= 1 y b = 1.

Permite generar una gran variedad de perfiles. Se puede usar para representar la distribución de artículos defectuosos sobre un intervalo de tiempo específico, etc. Sintaxis:

Y = betapdf(X,A,B) EJEMPLO 15. Coincidiendo con los valores de X, A y B para obtener las gráficas previas se tiene:

>> Y = betapdf(0.5,1.9,1.9) % X= 0.5, A=1.9, B=1.9 Y se despliega:

Y = 1.4574 EJEMPLO 16. Con un arreglo matricial y con x = 0,5 >> A= [0.5 1; 2 4]; Y = betapdf(0.5,A,A) Se despliega: Y = 0.6366 1.0000 1.5000 2.1875

Page 14: Fdp y Cdf Con Matlab

2.1.2- DISTRIBUCIONES DISCRETAS 2.1.2.1- DISTRIBUCIÓN UNIFORME PDF CDF

Descripción:

Computa la función de distribución uniforme discreta para el valor X y el parámetro N. X y N deben ser del mismo tamaño y N un entero positivo.

El resultado Y es la probabilidad de que ocurra X de entre N números, que en este caso, por ser uniforme, será la misma para cualquier X entre 1 y N.

Se usa para generar números aleatorios de entre N. Por ejemplo podemos calcular la probabilidad de sacar un número X (del 1 al 6) al tirar un dado. Sintaxis: Y = unidpdf(X,N) EJEMPLO 17. Para un rango de valores de X desde 1 a 6, avanzando de 1 en 1, en 10 ensayos , además de su gráfica >> X = (1:1:6); >> Y = unidpdf(X,10) Y = 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 >> plot(X,Y,'+'))

Page 15: Fdp y Cdf Con Matlab

Para un N fijado, la pdf uniforme discreta es una constante. EJEMPLO 18: Ahora fijamos x y variamos n. >> X = (4:1:9); % el rango de valores de 4 a 9 ,incrementados de 1 en 1 probabilidad = unidpdf(5,X) Se despliega: probabilidad = 0 0.2000 0.1667 0.1429 0.1250 0.1111 2.1.2.2- DISTRIBUCIÓN BINOMIAL FDP CDP

Descripción:

Computa la función de distribución binomial para el valor X y los parámetros N y P. X, N y P deben ser del mismo tamaño. N debe ser un entero positivo y P tiene que estar en el intervalo [0,1].

El resultado Y es la probabilidad de observar X sucesos en N pruebas independientes, donde la probabilidad de que ocurra el suceso (acierto) viene dada por el parámetro P, que permanece constante para cada prueba, y la probabilidad de que no ocurra el suceso (fracaso) es 1-P.

Sus áreas de aplicación incluyen inspección de calidad, ventas, mercadotecnia, medicina, investigación, de opiniones y otras. Por ejemplo, un proceso de manufactura produce un determinado producto en el que algunas unidades son defectuosas; si la proporción de unidades defectuosas producidas por este proceso es constante durante un periodo razonable y, si como procedimiento de rutina, se seleccionan aleatoriamente un determinado número de unidades, entonces las proposiciones de probabilidad con respecto al número de artículos defectuosos puede hacerse mediante el empleo de la distribución binomial. Sintaxis: Y = binopdf(X,N,P) EJEMPLO 19: Coincidiendo con los valores X, N y P de para obtener las gráficas previas de la PDF y de la CDF se tiene: >> Y = binopdf(5,10,0.5) Y = 0.2461

lo que equivale a la probabilidad )X(P 5

Page 16: Fdp y Cdf Con Matlab

Y para la CDF: >> Y = binocdf(5,10,0.5) Y = 0.6230

lo que equivale a la probabilidad )X(P 5

EJEMPLO 20: Un inspector de comercio testea al día 200 muestras de un producto. Si el 2% de ellas son defectuosas, cuál es la probabilidad de que el inspector no encuentre ninguna defectuosa ese día?

Es decir se quiere encontrar 0XP , aquí entonces tenemos x=0, N =200 y la

probabilidad P=0.02 >> binopdf(0,200,0.02) ans = 0.0176 Cuál es el número más probable de piezas defectuosas que se encontrará? >> defectuosos = 0:200; % definimos el rango de valores de X Y = binopdf(defectuosos,200,0.02); [x,i] = max (Y); defectuosos (i) ans = 4 Es decir se encontrarán 4 piezas defectuosas. EJEMPLO 21. Un jugador de dardos da justo en la diana 2 de cada cinco veces que lanza. Si en una partida dicho jugador lanza 10 veces, (a) calcula la probabilidad de que acierte en la diana tres veces, (b) calcula la probabilidad de que acierte en la diana por lo menos una vez. (c) ¿Cuántas veces se espera que el jugador haga diana? (d) Calcula la probabilidad de que el jugador haga más dianas de las esperadas en el partido. Del enunciado se determina que la probabilidad P es 2/5 =0.4, el número de ensayos N=10

a) se pide encontrar: )X(P 3

>> binopdf(3,10,0.4) ans = 0.2150

Es decir que 215003 .)X(P

b) por lo menos una vez, se refiere que como mínimo una , se pide encontrar

)X(P)X(P)X(P 01111

>>Y = 1 - binocdf(0,10,0.4) % utilizamos el comando binocdf porque se trata de la % función de densidad acumulada con x=0, N=10 y P =0.4

ans = 0.9940

Es decir que 994001 .)X(P

c) valor esperado es : E = NP = 10 *0.4 = 4 dianas

d) más de las esperadas se refiere a más de cuatro: )X(P)X(P 414

>> 1 - binocdf(4,10,0.4) ans = 0.3669

Page 17: Fdp y Cdf Con Matlab

2.1.2.3- DISTRIBUCIÓN BINOMIAL NEGATIVA O DE PASCAL FDP CDP

Descripción:

Computa la función de distribución binomial negativa para el valor X y los parámetros R y P. X, R y P deben ser del mismo tamaño. La función de densidad es 0 a menos que X sea un entero.

La variable aleatoria representa el número de ensayos necesarios para observar R éxitos. Los ensayos son independientes entre sí. La probabilidad de éxito en cada ensayo es constante e igual a P.

La aplicación principal de esta distribución es una alternativa adecuada para el modelo de Poisson cuando la frecuencia de ocurrencia no es constante en el tiempo o el espacio. También se emplea para modelar las estadísticas de accidentes, datos psicológicos, compras del consumidor y otras eventos similares en donde la frecuencia de ocurrencia entre grupos o individuos no se espera que sea la misma. Sintaxis: Y = nbinpdf(X,R,P) EJEMPLO 21. Para un rango de valores de X desde 0 a 10, en 10 ensayos, donde se repite 3 éxitos, donde la probabilidad es p= 0.5. Incluir la gráfica de >> X = (0:10); >> Y = nbinpdf (X,3,0.5) Se despliega: Y = Columns 1 through 9 0.1250 0.1875 0.1875 0.1562 0.1172 0.0820 0.0547 0.0352 0.0220 Columns 10 through 11 0.0134 0.0081 Su gráfica de la PDF: plot(X,Y,'+') set(gca,'Xlim',[-0.5,10.5]) % fijando los límites del eje de las X desde -0.5 a 10.5

Page 18: Fdp y Cdf Con Matlab

2.1.2.4- DISTRIBUCIÓN DE POISSON PDF CDF

Descripción:

Computa la función de distribución de Poisson para el valor X y el parámetro LAMBDA. X y LAMBDA deben ser del mismo tamaño y LAMBDA positivo. X puede ser cualquier entero no negativo. La función de densidad es 0 a menos que X sea un entero.

La variable aleatoria representa el número de eventos independientes que ocurren a una velocidad constante en el tiempo o en el espacio.

Ofrece una aproximación muy buena a la función de probabilidad binomial cuando p es pequeño y n grande.

Es el principal modelo de probabilidad empleado para analizar problemas de líneas de espera. Se usa para estimar el número de personas que llegan a una tienda de autoservicio en un tiempo estimado, el número de defectos en piezas similares para el material, el número de bacterias en un cultivo, número de solicitudes de seguro procesadas por una compañía en un período específico, etc. Sintaxis: Y = poisspdf(X,LAMBDA) EJEMPLO 22.Un fabricante de discos duros para ordenadores ha observado que ocurren defectos en el proceso de fabricación aleatoriamente con una media aproximada de 2 defectos por disco de 4 Gb. Se considera este término de fallos aceptable para el proceso. ¿ Cuál es la probabilidad de que un disco duro cualquiera sea fabricado sin fallos ? Para este caso, LAMBDA = 2 y X = 0

Se quiere calcular )X(P 0

>> P = poisspdf(0,2) P = 0.1353

Es decir que 135300 .)X(P o sea un 13.53% de que un disco duro sea fabricado sin

fallos. EJEMPLO 23. El número de vehículos que llegan a una intersección de caminos durante una hora sigue una distribución de Poisson de parámetro λ = 10. (a) Calcula la probabilidad de que sólo llegue un vehículo.

Page 19: Fdp y Cdf Con Matlab

(b) ¿Cuál es el número medio de vehículos que se espera que lleguen al cruce en una hora? (c) Calcula la probabilidad de que el número de vehículos que llegan al cruce sea mayor al número esperado Para este caso , LAMBDA= 10

a) se quiere encontrar )X(P 1

>> P = poisspdf(1,10) P = 4.5400e-004

Es decir que 410540041 .)X(P o sea un 0.05% de que llegue sólo un vehículo

b) el número medio o esperado = LAMBDA= 10 vehículos

c) se quiere encontrar )X(P)X(P 10110

>> P = 1- poisscdf(10,10) P = 0.4170

Es decir, 4170010 .)X(P o sea 41.70 % de vehículos mayor al valor esperado

EJEMPLO 24. Supóngase que un libro de 585 páginas contiene 43 errores tipográficos. Si esos errores están distribuidos aleatoriamente en el libro, ¿Cuál es la probabilidad de que 10 páginas, seleccionadas al azar, estén libres de error?

Para este caso la probabilidad de encontrar un error tipográfico es 585

1p

El valor de LAMBDA será: LAMBDA= 585

43

585

143 pN

Para la probabilidad de no encontrar error, se necesita calcular )X(P 0

>> N = 43; % cantidad de errores >> p = 1/585; % probabilidad de que una hoja tenga un error

>> LAMBDA= N*p

LAMBDA = 0.0735 >> P = poisspdf(0,LAMBDA) P = 0.9291 Para determinar la probabilidad de que 10 páginas están libres de error, recurrimos a la

distribución binomial, con la probabilidad P y X= 10. Es decir )X(P 10

>> Y = binopdf(10,10,P) Y = 0.4795 2.1.2.4- DISTRIBUCIÓN GEOMÉTRICA Descripción

computa la función de distribución geométrica de cada uno de los valores de X usando las probabilidades correspondientes en P. X y P puede ser vectores, matrices o arreglos multidimensionales que tengan el mismo tamaño. Los parámetros en P debe estar en el intervalo [0 1]. SÍNTAXIS Y = geopdf(X,P)

Page 20: Fdp y Cdf Con Matlab

PDF CDF

EJEMPLO 25.Suponga que se lanza una moneda común repetidamente, puede salir cara o sello. Si la moneda cae y sale cara, eso es un éxito. ¿Cuál es la probabilidad de que exactamente salgan tres sellos antes de obtener una cara? En este caso la probabilidad de éxito, es p= 0.5

Se quiere encontrar )X(P 3

>> p = geopdf(3,0.5) p = 0.0625

Por tanto 062503 .)X(P

2.1.2.5- DISTRIBUCIÓN HIPERGEOMÉTRICA Descripción

computa la function distribución hipergeométrica de cada uno de los valores de X usando los parámetros en M, K, y N. X, M, K, y N pueden ser vectores, matrices, o arreglos multidimensionales que tengan el mismo tamaño.

Los parámetros M, K, y N deben ser enteros positivos, con N = M. Los valores de X deben ser menores o iguales a todos los valores de los parámetros.

La distribución de probabilidad hipergeométrica es

N

M

xN

KM

x

K

N,K,Mxfy ,

el resultado, y, es la probabilidad de sacar exactamente x de unos artículos posibles de K artículos de N extracciones sin reemplazo de un grupo de M objetos. Sintaxis Y = hygepdf(X,M,K,N) EJEMPLO 26. Supongo que Ud. tiene un LOTE de 100 discos floppys y se sabe que 20 de ellos son defectuosos. ¿Cuales son las probabilidades de tener de 0 a 5 discos floppys defectuosos, si se seleccionan 10 al azar? Calcular la probabilidad de que salgan exactamente tres defectuosos, y de que salgan tres o menos defectuosos?

Page 21: Fdp y Cdf Con Matlab

En este caso, M = 100, los discos defectuosos son K=20 y se toman N = 10 al azar Se quiere hallar la función de probabilidad >> X = 0:5; p = hygepdf(X,100,20,10) p = 0.0951 0.2679 0.3182 0.2092 0.0841 0.0215 Para hallar la gráfica, agregamos el comando plot

Para la probabilidad de que salgan exactamente tres )X(P 3

>> p = hygepdf(3,100,20,10) p = 0.2092

Es decir que 209203 .)X(P o sea que hay un 20.92 % de que se extraigan 3

defectuosos.

Para la probabilidad de que salgan tres o menos )X(P 3

>> p = hygecdf(3,100,20,10) p = 0.8904

Es decir que 890403 .)X(P o sea que hay un 89.04 % de que se extraigan 3 o menos

defectuosos. 2.2 GENERADORES DE NÚMEROS ALEATORIOS (RND) Descripción:

En el apartado <distribución> se coloca el nombre de ésta entre comillas simples.

Los parámetros corresponden a la distribución usada en cada caso y deberán cumplir las condiciones que esta exija.

La generación de números aleatorios es útil para la simulación de eventos en los intervengan un factor aleatorio pero del que conocemos su distribución.

Las distribuciones pueden ser: ‘beta', 'Binomial', 'Chisquare', 'Exponential', 'F', 'Gamma', 'Geometric', 'Hypergeometric', 'Lognormal', 'Negative Binomial', 'Noncentral F', 'Noncentral t', 'Noncentral Chi-square', 'Normal', 'Poisson', 'Rayleigh', 'T', 'Uniform', 'Discrete Uniform', 'Weibull'.

Page 22: Fdp y Cdf Con Matlab

Cadenas aceptables para las distintas distribuciones:

'beta' (Distr. Beta)

'bino' (Distr. Binomial)

'chi2' (Distr. Chi- cuadrado)

'exp' (Distr. Exponencial)

'ev' (Distr. valor extremo)

'f' (Distr. F )

'gam' (Distr. Gamma )

'gev' (Distr. Valor extreme Generalizado)

'gp' (Distr.Generalizada Pareto)

'geo' (Distr. Geométrica)

'hyge' (Distr. Hipergeométrica)

'logn' (Distr. Lognormal)

'nbin' (Distr. Binomial negativa)

'ncf' (Distr. F No central)

'nct' (Distr. T no central)

'ncx2' (Distr. Chi- cuadrado No central)

'norm' (Distr. Normal)

'poiss' (Distr. Poisson)

'rayl' (Distr. Rayleigh)

't' (Distr. t)

'unif' (Distr.Uniforme)

'unid' (Distr. Uniforme discreta)

'wbl' (Distr. Weibull)

Sintaxis: R = RANDOM (<distribución>,<parámetros>) (ó R = <distribución>rnd (<parámetros>) Ej: R = lognrnd(...) ) EJEMPLO 27. Generar con una distribución binomial con los siguientes parámetros: X = 10, P=0.2 >> RANDOM('bino',10,0.2,1,5) ans = 4 0 4 2 4 EJEMPLO 28. Se quiere comprobar la eficiencia de una maquina empaquetadora a la que le llegan piezas de repostería casa 5minutos. El número de piezas en cada remesa viene dado por una distribución uniforme con un mínimo de 5 y un máximo de 13. >> Remesa = RANDOM('unid',5,13) Remesa = 2 4 3 1 3 5 3 2 3 4 4 2 5 4 1 2 5 3 3 5 4 4 2 4 4 4 4 2 2 5 4 2 3 5 2 5 4 3 3 3 3 3 5 4 1 5 2 4 2 5 5 4 4 5 2 2 4 4 4 4 3 4 2 5 3 4 1 2 3 1 4 5 4 1 1 4 2 4 1 5 4 1 1 3 2 1 1 2 2 4 3 1 4 2 3 2 1 4 4 4 1 1 3 4 5 2 5 2 3 2 2 2 3 3 4 3 3 1 1 5 1 4 1 4 5 1 4 3 5 5 1 3 4 1 3 2 4 1 2 3 3 2 2 3 3 2 3 5 3 1 3 4 3 4 2 1 5 1 3 1 4 3 2 3 1 4 4 1 1

Page 23: Fdp y Cdf Con Matlab

PROBLEMAS PROPUESTOS

1. Se sabe que aproximadamente el 90% de los matriculados en Ingeniería son hombres. (a) Calcula la probabilidad de que en un grupo de cinco estudiantes escogidos al azar haya alguna chica. (b) Calcula la probabilidad de que en una clase de 30 estudiantes no haya ningún chico. (c) Calcula la probabilidad de que en una clase de 40 personas, menos del 20% sean mujeres. Respuestas. a) 0.4095; b) 10-30 ; c) 0.9489 2. Si se lanza un dado 150 veces, ¿cuál es la probabilidad de que salga 30 veces un seis? Respuesta. 0.048 3. En un colegio se realizan una serie de pruebas psicotécnicas para determinar el coeficiente de inteligencia de los alumnos, quedando establecido que dicha medida se distribuye según una distribución normal de parámetros 100 y 10. (a) Calcula la probabilidad de que un alumno seleccionado al azar tenga un coeficiente intelectual por encima de 120. (b) Calcula el porcentaje de alumnos cuyo coeficiente intelectual está comprendido entre 95 y 105. (c) ¿Qué valor del coeficiente intelectual verifica que sólo el 10% de los alumnos tienen un coeficiente superior? (d) Se decide repetir las pruebas a aquellos alumnos con un coeficiente demasiado alto, que resultan ser un 5% del total, y a aquellos con coeficiente demasiado bajo, que representan un 2%. Calcula los valores del coeficiente de inteligencia a partir de los cuales se repetirán las pruebas. Respuestas. a) 0.0228; b) 0.383; c) 112.816; d) Por encima de 116.45 y por debajo 79.46. 4. Según estudios realizados por una compañía de seguros, se sabe que la probabilidad de que una mujer mayor de sesenta años sufra un accidente de circulación es del 0.001%. Sabiendo que la compañía tiene 40000 clientes de esas características, calcular la probabilidad de que tenga que soportar más de 4 siniestros de este tipo. Respuesta. 0.0001 5. Según las encuestas previas a las elecciones se supone que el 25% de los electores de la ciudad de La Paz votan por un determinado candidato. Se eligen al azar 50 votantes en un distrito electoral paceño. Calcular la probabilidad de que más de 20 voten por dicho candidato. Respuesta. 0.0045 6. Una máquina de lavado a presión está diseñada para suministrar 25 litros de limpiador por minuto, pero se ha comprobado que la máquina suministra una cantidad aleatoria entre 24 y 26 litros, siguiendo una distribución uniforme. a) Calcular la probabilidad de suministrar ma´s de la cantidad esperada por minuto b) Calcular la probabilidad de que la cantidad suministrada en un minuto sea menor de 25 litros y medio, sabiendo que ha sido superior a la cantidad esperada. Respuestas. a) 0.5; b) 0.5