Simulacion Ultima Guia y Clase

23
Tiem o de servicio. min Frecuencia 1 30 1 2 30 3 20 4 10 10 100 5 o más Total -- 1889 7555 J8320 5548 2353 ! 4186 9912 ; 9910 0252 7862 7151 H>140 2213 í 2053 2400 1071 6878 15'22 !-' 5025 201i:9 J 7588 3033 ! 40 r -. 4 2319 * 1647 i 90E;6 9215 -11.4233 1 8530 1840 T4205 9032 5807 5817 39C1 ! 014 5781 -h 33o0 [4144 4864 9082 1215 6273 1062 H- 2461 6669 3548 9025 Distribuciones de Probabilidad Problernario Unidad - Pruebas de bondad de z!justo 1. Verifique si los siguientes datos se ajustan a una distribución normal de poi:ab:H:1.1-d. Clase de datos Rango 1 10-12 2 12-14 3 14-13 4 16-18 5 18-20 6 20-22 7 22-24 Total --- I Frecuencia 1_ 1 9 -r i 18 ! 30 1 1 12 I ¡ 6 11— 90 ....) 2. Chequear si los siguientes datos representan una función exponencial pa-a l os tieí:!pcs de servicios de un establecimiento comercia! 3. Les datos siguientes se obtuvieron de registrar los 1.1empos de Pegadas de d'en una oficina contable Tiempo entre Ile_gaclas, min ! Frecuencia I _.< I 1 12 !-- i 1. 1 2 41 1 3 30 4 10 5 o más 7 Total 130 ¿Se aceptará el ajuste per medio de la función de Poisson? 4. Los siguientes dígitos.oleatorios fueron generados por una comoutadoia IBM usando la subrutina RANDU de su biblioteca. USn una prueba de bondad de ajuste ji- cuadrada con a = 0.01 para determina r si están c:stribuidos unitonimente. 5. La tabla siguiente presenta !a distción de flec.,enca del r-!1rnero encontrados en el análisis de :es ultims 200 artículos producidos en t y - proces.:: "2:5 producción. Usando un nix..al de cora:v2a ¿Je.' desea 'terlficar mediante t;.1. prueba ii-cuadrado si dichos valores oroceden de una distribución de Poi:son co , un:'9 media de 3.5 defectos pu articulo. [Frecuencia Número de defectos 1 9 i '' ' 1 3 . 4 i 5 _ ! 1 7 T 8 : 1• : : . _ s ' - , ,. __. : 10 "1 1 4 .1 1 1; 1 0 I 31 1 21 F-- c -t- f s -h- 1 --'- - -- - - n , _L__ 13ki- I ;ción - " ro `. :

Transcript of Simulacion Ultima Guia y Clase

Page 1: Simulacion Ultima Guia y Clase

Tiem o de servicio. min Frecuencia1 30 12 30 3 204 10

10 100

5 o másTotal

--

1889 7555 J83205548 2353 ! 41869912 ; 9910 02527862 7151 H>1402213 í 2053 2400

1071 6878 15'22!-' •5025 201i:9 J 75883033 • ! 40r-. 4

2319 * 1647 i 90E;6 9215 -11.42331 8530 1840 T4205 9032 5807

5817 39C1 ! 014 5781 -h 33o0

[4144 4864

9082 1215

6273 1062

H-2461 6669

3548 9025

Distribuciones de Probabilidad

Problernario Unidad - Pruebas de bondad de z!justo

1. Verifique si los siguientes datos se ajustan a una distribución normal de poi:ab:H:1.1-d.

Clase de datos Rango1 10-122 12-143 14-134 16-185 18-206 20-227 22-24

Total • ---

I Frecuencia1_1 9

-ri 18! 3011 12I¡ 611— 90....)

2. Chequear si los siguientes datos representan una función exponencial pa-a l os tieí:!pcsde servicios de un establecimiento comercia!

3. Les datos siguientes se obtuvieron de registrar los 1.1empos de Pegadas de d'enuna oficina contable

Tiempo entre Ile_gaclas, min ! Frecuencia I_.<I 1 12!-- i

1.1 2 41 1

3 304 10

5 o más 7 Total

•• 130

¿Se aceptará el ajuste per medio de la función de Poisson?

4. Los siguientes dígitos.oleatorios fueron generados por una comoutadoia IBMusando la subrutina RANDU de su biblioteca. USn una prueba de bondad de ajuste ji-cuadrada con a = 0.01 para determina r si están c:stribuidos unitonimente.

5. La tabla siguiente presenta !a distción de flec.,enca del r-!1rneroencontrados en el análisis de :es ultims 200 artículos producidos en ty- proces.:: "2:5

producción. Usando un nix..al de cora:v2a ¿Je.' desea 'terlficar mediante t;.1.prueba ii-cuadrado si dichos valores oroceden de una distribución de Poi:son co , un:'9media de 3.5 defectos pu articulo.

[FrecuenciaNúmero de defectos 1 9 i '' ' 1 3 . 4 i 5 _! € 1 7 T 8 : 1• :: ._ s • ' • -, ,. • __.

: 10 "1 1 4 .1 1 1;1

0 I 31 1 21 F-- c-• t- fs -h- 1 --'- - --- • - n , _L__

13ki- I ;ción - " ro `. :

Page 2: Simulacion Ultima Guia y Clase

Distribuciones de Probabilidad

6. A un grupo de 80 empleados se !es ha aplicado una prueba ce habilidad z.spacial.una graduación de 0 a 100 han obtenido !as puntuaciones dadas en la tabla siguienteSe pide verificar la hipótesis de qi.:e pentajes se pueden ajustar a una distrilz..iciónnormal.

I .__29 78 48 29 30 44772 1 73 ¡ 45 T82 84 71 • 75 84i 47 32 33 54 56 33 i 62 163 ¡ 64 i 36 38 53

154 38

I 42 51 52 53 56 57 1 58 1 71 l 76 77 58 60 30 6214 16 73 74 45 21 ; 23 i 66 1 67 42 43 151 1 37 7C55 27 78 48 49 50 ¡ 51 I 86 : 58 59 89 1 36 1: 37 91

Si un ingeniero de control de calidad tp ,',ia una muestra de 10 neumático:, :lie salenuna línea de ensamblaje y él desea verificar sobre la base de los datos que sigue-.números de llantas con defectos observadas el 200 días, si es cierto que el 5% cj(

todos los neumáticos tienen defecto; es decir, si el muestrea poblacón binerriacon n= 10 y p = 0.05

Número de unidades con defecto Número de muestras 0 138

2 ó más 9

Considérese los juegos de la NFL efectuados entre los 28 ecuiocs que componenliga. Se X el número de anotaciones ce 6 puntos (?ouchdown) de cada egi i pc poijuego.

X -o 1 2 3 4 7 5

Frecuencia 35 I 99 ¡¡ 104 110 I 6 ¡ 2ti

¿Existe alguna razón para creer que el número de anotaciones es . na variablealeatorio con distribución de Poisson? Utilice c = 0.10

9. El gerente de una planta industrial pretende determinar si el número de emp-eados queasisten al consultorio médico de !a pianta se encuentra distribudo da forma equitat;vadurante los cinco días de trabajo de la semana. Con base en una muestra aleatorio . de4 semanas completas de trapajo, se observó e! siguiente número de consJias:

Lunes Martes —I Miércoles 1- Jueves 1..iernes 49 35 32 39 45

¿Existe alguna razón para creer que el número de empleados que asisten alconsultorio no se encuentran distribuidos en forma equitativa durar te. los C19:1 :i detrabajo de la semana? Utilice a = 0.05

— r v.: f. A 1.ir1.1..,

Page 3: Simulacion Ultima Guia y Clase

Distribución de Probabilidad

Si alguno; de los elementos del sistema se comportanestocástic:amente, un problema que surge varias veces durante unestudio Je simulación típico es aquel de la prueba decompatibilidad de un conjunto de frecuencias observadas conalgunas frecuencia teórica. Es decir, deseamos contestar lapregunta "pudieron haberse originado los valores de las muestraso datos que observé, de cierta distribución probabilidadespecifica". Si la frecuencia de los datos observados se asemejade manera conveniente con la frecuencia teórica o esperada,entonces pc demos usar la distribución teórica en el modelo pararepresentur la población principal. Por lo general, no podernosformular una hipótesis o suposición razonable acerca de ladistribución de una variable aleatoria, hasta que hayamos( ~pilado y analizado los datos (ya sean históricos yxperimercu les).

Simulación Prof Andrés Lillo

nimrribtsci.4 d Padw

t3I111l/1,11.

I

I ;

Distribución de Probabilidad

Prof. Andrés Lillo

Distribuci. npo.mial •

Simulación — Prof Andrés t ¡lió

fstn j

tc ;$ 1

Page 4: Simulacion Ultima Guia y Clase

Distribución de Probabilidad'—1 \

t isualmente los datos compilados se agrupan en una distribuciónde frecuer cia. Si estamos manejando un variable discreta,registramo:; la frecuencia con la que ocurre cada valorindividual. Si la variable es continua dividimos la zama devalores en ntervalos o clases iguales y registramos la frecuencia,lue tiene Ligar dentro de cada intervalo o clase. Usualmente elatimero de intervalos de clases se toma enre 5 y 20: esto dependede los datos. Entonces, la frecuencia relativa de cada intervalo,es la surru, de las frecuencias observadas en cada intervalo,dividida en re el número total de elementos de datos.A continuación se presentan algunos ejemplos:

Simulación - Prof Andrés Lillo

Simulación

Distribución de frecuencia

Ejemplo: Tabli I. Distribución de frecuencia de consultas telefónicas porimervalos de tma hora (valores discretos)

Númerode consultas Probabilidad

FrecuenciaRelativa

0 315 0.619

1 142 0.279

2 40 0.078

3 9 0.018

4 2 0.004

5 1 0.002

total 509 1.000

Simulación - Prof Andrés Lillo

aaasierirraun r ararnausrmaresaiiruarirammour

Page 5: Simulacion Ultima Guia y Clase

Distribución de frecuencia

Iijm: Tabla 2. .)istribución de frecuencia de la producción semanal (valorescontinuos).

Producción :,emanal Frecuencia P(x)

menos d 1 46 1 0,008

46 - 55 1 0,008--

56 • 65 3 0,025

66 . 7' 7 0,058

76 85 11 0,092

86 9. 21 0,175

96 - 105 28 0,234

106 . 1 5 16 0,134

116 . 1: 5 22 0,183

126 .• vs 7 0,058

136 . 1,5 1 0,008

146 o más 2 0,017

Simulación — Prof. Andrés Lillos"...,A,cousamoomaUN inionurras~dume

„NU1U1d:Al/11

Grafica de la distribución de frecuencia

Í0 ,00

0 600

0.500 -

0.300

0.200

0.100

1 2 3 4 5

Diagrama de frecuencia relativa

Simulación prof Andrés l.illo "..0111.14•11411~~17ilal 1•11111~1111.~EMICZOIMILAINIMILIIIIMIV

3

Page 6: Simulacion Ultima Guia y Clase

Grafica de la distribución de frecuencia

0 300

0.?00

0. 00

45 55 65 75 85 95 1(15 115 125 135 145 155

Diagrama de frecuencia relativa

Simulación — P of. Andrés Lillo

-.•••n•41•11111111111111111~

—I 1

:51111111dCW11

Distribución de Probabilidad

Después de que el analista obtiene una distribución de frecuenciarelativa, la selección de posibles distribuciones de probabilidad apartir de las cuales se derivó, se vuelve un asunto de juicio yexperiencia. Una ayuda es comparar visualmente la distribuciónde frecuencia, observada con aquellas distribuciones teóricas. Lascomparaciows visuales de las distribuciones solo sirven parasugerir cuales distribuciones se quiere probar; éstas nuncarepresentan un justificación suficiente para aceptar la hipótesis odistribución teórica.

Simulación — Prof Andrés Lillo

illUI Affilla~~0111•11111••••111•13111421111,

4

Page 7: Simulacion Ultima Guia y Clase

a

Algunas distribuciones de probabilidad

1 r-

Distribución Normal

Simulación - Prof Andrés Lillo

Distribuí ión Uniforme

Distribución tic Poisson

r

Distribucion exponencial x

Simulación - Prof Andrés Lillos"....~araaseusub zar usiusaiuwaarsammuarcauaksuaawamman

Algunas distribuciones de probabilidad

5

Page 8: Simulacion Ultima Guia y Clase

Prueba Ji-cuadrada de la bondad del ajuste 1\\

Después que el analista identificó una co más distribucionesteOrieas tales como la normal, la Poisson, la binomial, lagamma, c c, que podrían ajustarse a sus datos empíricos,entonces d determinar los parámetros de la distribución demanera gut pueda proseguir con la prueba estadística.Pana prOba: . estadísticamente !a hipótesis de que un conjunto deJatos empf -icos o de muestra no difieren signifieati‘amentc deaquellas que se esperan a partir de alguna distribúción teóricaespecifica, podemos considerar una prueba de -bondad deajuste". Una medida o prueba de discrepancia que existe entre unfrecuencia )bservada y una esperada, es proporcionada por elestimador ,12 (ji-cuadrada). La prueba ji-cuadrada la propusoKarl Pearson en 1903, sin embargo, Sir Ronald Fisher ladesarrolló totalmente y publicó en 1924 la tabla de valorescríticos que se utiliza en la actualidad.

Simulación - Prof Andrés Lillo

El estimador ji-cuadrada lo proporciona:

_y- 2

(fo fe)2 fe

Donde:

fo frecuenci a observada para cada clase o intervalo.

frecuenci a esperada para cada clase o intervalo predicho porla jincibucióil teórica.

Simulación - Prof Andrés Lillo

[ Prueba. Ji-cuadrada de la bondad del ajuste

simuiacton

6

Page 9: Simulacion Ultima Guia y Clase

sinnuiacion

Prueba Ji-cuadrada de la bondad del ajuste

Al usar la prueba de bondad de ajuste X3 deben considerarsevarios asuntos:

1. Las fi:..cuencias relativas o porcentajes no pueden usarse, esdecir, debernos usar conteos de números frecuenciasrealesLas I ecuencias esperadas para cada intervalo de clasedeben equivaler a 5 o más. Si no es así, entonces debenagruparse o compilarse en clases o intervalos adyacentes.

">. Los g .ados de libertad están dados por y = k - 1 — m,dondea) 1 , = grados de libertad,h) k = número de clases o intervalos, yc) n. = número de datos empíricos o de muestra de los

parámetros de la población necesarios para calcular lasfrecuencias esperadas.

• •-- Simulación — Prot Andrés Lillo

7- ---Prueblt Ji-cuadrada de la bondad del ajuste

Lil hipótesis que siempre vamos a probar es Ho: La distribuciónde los resultados de la muestra se asemeja a una distribuciónteórica. Si las frecuencias observadas se acercan a lascorrespondientes frecuencias esperadas, el valor de X2 serápequeño, lo que indica un buen ajuste. Si las frecuenciasobservadas difieren considerablemente de las • frecuenciasesperadas, el X2 será grande y el ajuste muy pobre. Un buenajuste conduce a Ho y un mal ajuste conduce a su rechazo. Laregion critica, por lo tanto caerá en la cola derecha de ladistribución ji cuadrada. Nota: No debe utilizarse el criterio dedecisión descrito aquí a no ser que cada una de las frecuenciasesperadas sea al menos igual a 5. Esta decisión puede requerir lacombinación de celdas adyacentes. lo que resulta en unareducción d l número de grados de libertad.

SimulacIón — prof. Andrés Lillo ‘-"•-amialurnammara-al.

7

Page 10: Simulacion Ultima Guia y Clase

•;upórigase que el dado se lanza 120 veces y se reinsu a cada unode los resultados. Teóricamente, si el dado no está , cargado, seesperaría que cada lado cayera 20 veces.

'fabla 3

Cara

2 3 4 5 6

20 22 17 18 19 24

20 20 20 20 20 20

Simulación - Prof Andrés L llo

Observada

LEsperada

I 1 Prueba Ji-cuadrada de la bondad del ajuste

Ejemplo: Consideremos el lanzamiento de un dado. Se formulala hipótesis de que la distribución de resultados es uniformediscreta:

f(x) 1/6, x = 1 .5.6.

Simulación - Prof Andrés LiloIL11.•11~11/1~ MINVIIIIIMIIIiiiiIi111~111.0111~1•1101111.-1111

31111111i1U1L111

(r. Prueba Ji-cuadrada de la bondad del ajust:

Aplicamos: x 2(j'o— .)2

L—.• f,

+ 0 7-20Y

20

— 20)2=1.7

20 20 20

Al buscar en la tabla de la distribución X2 se encuentra queX- 0.05 = 11.070 con v=5 grados de libertad. Dado que 1.7 esmenor que el valor critico, no se rechaza H 0 . Se concluye que nohay evidenci suficiente para rechazar la hipótesis de que ladistribución cel muestreo es uniforme.

(20x2 = — 20)2-4-

(22

(19-20)2

— 20)2

(I8-20)2

20 20

(24

\

8

Page 11: Simulacion Ultima Guia y Clase

imutacion

Prueba Ji-cuadrada de la bondad del ajuste

Para nitietras de números continuos se deben construir unadistribue ó 1 de frecuencias agrupadas en clases o intervalos.Ejemplo: t, continuación se presenta un muestreo de la vidapromedio c e 40 baterías de vehículos: ,

Duración de las baterías de automóvil

2,2 4,1 3,5 4,5 3,2 3,7 3 2,6

3,4 1,6 3,1 3,3 3,8 3,1 4,7 3,7

2,5 4,3 3,4 3,6 2,9 3,3 3,9 3,1

3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4

4,7 3,8 3,2 2,6 3,9 3 4,2 , 3,5

I

Prof: Andralillo

Prueba Ji-cuadrada de la bondad del ajuste

Se ordenan las muestras de manera ascendentes, se construyenlos intervalos de clases, se agrupan y calculan las frecuencias.

Tabla 4. Distribución de FrecuenciasIntervalode clase Punto medio Frecuencia

Frecuenciarelativa

1,45 - 1,95 1,7 2 0,0501,95 - 2,45 2,2 1 0,0252,45 • 2,95 2,7 4 0,1002,95 - 3,45 3,2 15 0,3753,45 - 3,95 3,7 10 0,2503,95 -4,45 4,2 5 0,1254,45-4,95 4,7 8 0,075

Simulación - Prof Andrés Lillo.12n • 6111141.1n1 -& 11.1017...1.1n11~1111111111~~.11•111=1.1.0"

9

Page 12: Simulacion Ultima Guia y Clase

011111.1141..1V11

Prueba Ji-cuadrada de la bondad del ajuste

Luego se :onstruve un histograma para tener noción de cual es eltipo de diitribución teórica que se quiere probar. En este ejemploel hist(4,n ma se asemeja a una distribución normal.

Simulación — Prof Andrés Lillo••nn•n 14~1~11.1111111

1.1.375

O 250

0.125

4.7a:o 1.- 2/ 2." 31 3.1

Histograma de Frceuenclas Relativas

Prueba Ji-cuadrada de la bondad del ajuste

Se plantea 1¿ hipótesis de que la distribución de frecuencia de lasduraciones de las baterías dadas en la tabla anterior puedenaproximarse a una distribución normal con pt = 3.5 y unadesviación estándar de cs = 0.7. Las frecuencias esperadas paralas 7 clases se obtienen calculando las áreas bajo la curva normalhipotética que caen entre os varios limites de la clase.

Frecuencias observadas y esperadas

Intervalo declases

FrecuenciaObservadas (fo)

FrecuenciaEsperadas (fe)

1,45 - 1,95 2 0.5

1,95 - 2,45 1 2.1

2,45 - 2,95 4 5.9

2,95 - 3,45 15 10.3

3,45 - 3,95 10 10.7

3,95 - 4,45 5 7.0 1

4,45 . 4,95 3 15mutaciónProf Andrés Lillo

LIII41111415~wia allal•~1•11111111111111111

1

Page 13: Simulacion Ultima Guia y Clase

1111111Z1ClUll

Prueba Ji-cuadrada de la bondad del ajuste

Como las frecuencias esperadas de las primeras dos clases noson mayo -es o iguales a 5 (0.5 y 2.1), se agrupan junto a latercera clase para cumplir con la condición. Igual sucede con laUltima clase (3.5), en este caso se agrupa con clase con la

Frecuencias observadas y esperadas

Intervalo declases

FrecuenciaObservadas (fo)

FrecuenciaEsperadas (fe)

1,45 — 2.95 7 8.5

2,95 - 3,45 15 10.3

3,45 - 3,95 10 10.7

3,95 - 4,95 8 10.5

Simulación — Prof Andrés Lillo

......seameramma ~Immo

Prueba Ji-cuadrada de la bondad del ajusten 1

---Se plantea la hipótesis de que la distribución de frecuencia de lasduraciones de las baterías dadas en la tabla anterior puedenaproximarse a una: distribución normal con pt = 3.5 y unadesviación estándar de a --- 0.7. Las frecuencias esperadas paralas 7 clases s.: obtienen calculando las áreas bajo la curva normalhipotética qu.: caen entre los varios limites de la clase.'

(7 :1. i)'

-4-

(15 -10.3Y

4-

(10 —10.7Y

-1-

(8 —10.5Y=3.05

8.5 10.3 10.7 10.5

Dado que el valor calculado de X2 es menor que X20.05=7.815para 3 grados de libertar, no hay razon para rechazar la hipótesisnula y se conc luye que una distribución normal con pt — 3.5 y a0.7 proporciona un buen ajuste a la distribución de la muestra.

Simulación — Prof. Andrés Lillo

•••••..ww.awalaw~m ammou~:~iBuse

Page 14: Simulacion Ultima Guia y Clase

IPrueba Ji-cuadrada de la bondad de) ajuste— - ---

Ljemplc: Supongamos que deseamos probar las tabla de lasfrecuencias de las llamadas telefónicas (tabla 1) para ajustarnos auna distribución de Poisson a un nivel de significancia de 0.95.Sabemos eue la distribución de Poisson es como sigue:

n!Donde:P/x=n}-p,obabilidad de obtener n ocurrencias.e 2.71823

una constante positiva (que es tanto la media como lavarianza)

Simulación — Prof Andrés

"...wrairriwz~~ rewszuw~rwrim

13 {..v n}.

Prueba Ji-cuadrada de la bondad del ajuste

Cuando la distribución elaborada mediante la hipótesis es unafuwión de cos parámetros , usualmente se pueden estimar estosparámetros partir de la media y la varianza de la muestra. Paradatos agruNdos, podemos calcular la media y la varianza de lasiguiente manera:

ÁM ,F, M , 2 F, — njl72

Varianza = S" = 1^1

nn — 1Donde

total del tamaño de la muestra

k número dé c lases o intervalos

Mi = punto rrec io del iésismo intervalo o valor de la iésima clase si los datosson discretosFi = Irecuencia iésimo intervalo o en la iésima clase.

Simulación — Prof Andrés Lillo

."~-aaraukrazurar ama wawami

= X =

01111t. 1 ink., 1

3

Page 15: Simulacion Ultima Guia y Clase

Prueba Ji-cuadrada de la bondad del ajuste

Cálculo de parámetros para la tabla de llamadas telefónicas

F , I M,F, Mz,F,mo

—1— 315 O o1 142 142 142

2 40 80 160

3 9 27 81

4 2 8 32

5 5 25

Total 509 262 440

262 440 - 509 (0.5147 )2

-- = .5H7 S2 = = 0.6007

509 509 -1

Simulación - Prof. Andrés Lillo

a IIIIIIII~11101

Prueba Ji-cuadrada de la bondad del ajuste

Stmulacion

Salmnos, con base en la estadística, que para la distribución dePoi: son, la media = X y también que la varianza = X.; es decir, lamedia y la varianza son iguales. Como se observa en los cálculosanteriores la media y la varianza no son iguales para los datosobservados (es decir, 0.5147 < 0.6007), lo cual podría llevarnosa rechazar 11 hipótesis de una distribución de Poisson. Sinembargo, en este caso en particular tenemos razones teóricas ypracticas para sospechar que es de tipo Poisson. Si deseamoscontinuar considerando a la distribución de Poisson como unaposibilidad, podríamos hacerlo dejando que equivalga alpromedio de la media y de la varianza de ]a muestra, o sea:

0.5147 + 0.6007= = 0.5577

2Simulación - Prof Andrés Lillo

ah11~1~1. ZUI INCIZ1111~111i1MIN/M1

4

Page 16: Simulacion Ultima Guia y Clase

Prueba Ji-cuadrada de la bondad del ajuste

Para este ejemplo — 0.55 7 7 para los datos de las muestra, porle tanto H 0 es 'no existe una diferencia significativa entre losdatos observados y aquellos que serían proporcionados por lasdistribución de Poisson con media = 0.5577"

r

!! i

—rPx{n - rea

i• jr0 (fl; " ./19 2 1e

O 0,571 291 315 1,98

1 0,319 162 142 2,47

2 0,089 45 40 • 0,56

3 0,017 9 9--1

4 0,003 1f-1 2 0,09

5 0,001 1 i

1,000 509 509 5,1

Simulación — Prof. Andrés Lillo

s...--mualaaJaarstamn umaiwar~~~~eare

NI111111aC1011

Prueba Ji-cuadrada de la bondad del ajuste -1

Para obtener Fe, multiplicamos la probabilidad calculada por509. Por lo tanto nuestra X2 calculada — 5.10. Consultando elvalor critico n la tabla Ji-cuadrada para un nivel de confianza de0.95 y grado:; de libertad = 4-1-1 =2, encontramos que X2 = 5.99.Por lo tamo, debido a que nuestra X2 calculada es menor al valorcritico tabulado de X2 , no rechazamos la Hipótesis nula 1-1 0 de nodiferencia. Lis últimas tres clases se agruparon en los cálculospara obtener ma frecuencia de por I() menos 5 en cada clase; porlo tanto tener ros 4 clases en vez de las 6 originales. Además, aldeterminar lcs grados de libertad, quitamos un grado adicionalde libertad dcbido a que utilizamos 2, de los datos observadospara calcular a frecuencia esperada.

Simulación — Prof. Andrés Lillo"......aismaxiaawara.ma MULIM1111~~~111111111•M

5

Page 17: Simulacion Ultima Guia y Clase

011111.1tclUltill

Prueba Ji-cuadrada de la bondad del ajuste

Simulación - Prof. Andrés Lillo

N'''-maarrmararalair 1111~1111•1111~1~~111.11

Ejemplo: 1,os siguientes datos son las edades de una muestra depersonas seleccionadas entre los visitantes de un Bingo:

32, 23. 64. 31, 74.44. 61, 33, 66, 73,27, 65, 40, 54, 23, 43, 58, 87, 58, 62.68, 89, 93, 24, 73. 42, 33, 63. 36. 48,77, 75, 37, 59, 70, 61, 43, 68, 54, 29,48, 81, 57, 97, 35, 58, 56, 58, 57, 45

Ordenamos los datos de menor a mayor y realizamos una tablade frecuencias con 4 clases.

20-40 40-60 60-80 80-100 ' Total12 18 15 5 50

Clase

Frecuencia

Prueb{ Ji-cuadrada de la bondad del ajuste

Tenemos que hallar una estimación para la media y la desviacióntípica. Usamos en esta ocasión la media y la desviación típica dela muestra cano estimadores. Para realizar los cálculos, y con elpropósito de simplificarlos se han empleado la tabla de datosagrupados en lugar de los datos primitivos, resultando:

= x = 55.2, a S = 18.7

Simulación - Prof. Andrés Lillo"..~..isaussammizmizoi ma.aamosaamateusizi

6

Page 18: Simulacion Ultima Guia y Clase

..11M111aC1011

7

Simulación — Prof Andrés Lillo•s...LIS.11411~1~nn =11. MIN~1111•~1~1111.111M

Prueba Ji-cuadrada de la bondad del ajuste I

Calcula;-n )s ahora la probabilidad para cada clase usando ladist, ir ución Nonnal(55.2, 18.7) I.,a probabilidad quecorres londería a las distintas clases si se cumple la hipótesisnula d que los datos siguen una distribución Normal (55.2.18.7)es:

1 )(7: 4.1) 1. t...-....1(, r 18. 7 ) 0.2(18 i1'(40 60) = Normal (60; 552. :5.7) - Normal (40; 55.2. 18.7) =0.60125 — 0.20816 0.39313P(60 ) < 80) = Normal (80; 55.2,18.7) - Normal (60; 55.2, 18.7) =-0.90761 - 0.60129 = 0.30632 • 'P(80 > )= 1 - Normal (80; 55.2, 18.7) = 9.2386 x 10-2

1

Prueba J1-cuadrada de la bondad del ajuste

Multiplicam)s por el número total de datos estas probabilidadespara obtener la frecuencia esperada:

5.e < 40 40-60 60-80

15

>80 Total)encíarvada (Fo , 12 18 5 50abilidaddada 0,21 0,39 0,31 0,09 1..enciarala (Fe) 10,5 19,66 15,32 4,5 50

El valor experimental de Ji es:

(12 — 10.5) .(18 —19.66) 2 (15 —15.32Y (5 —4.5)2 0.41569\'

10.5 19.66 4" 15.32 -I- 4.5

Simulación — Prof. Andrés Lillo

_....~1.11n1.11~1a MILICIIEN11~~11011.1110£11WILSW11n1111~11n11

rciaFrectObS

ProbCalc e

Ft ecEsp

Page 19: Simulacion Ultima Guia y Clase

Prueba de Kolmogorov - Smirnov

Otra prueba de ajuste de bondad ampliamente utilizada es laprueba de Kolmogorov-Smirnov. Esta la sugirió Smirnov en1939 y desarrollaron Kolmogorov y Smirnov quienes supusieronque la distribución de probabilidad que se encontraba a prueba,era continua y que se conocía la media y la varianza de lapoblación. La tabla de Smirnov de los valores críticos de publicóen 1948. igual que la prueba .1i-cuadrada, la pruebaKolmogorov-Smirnov puede emplearse para probar el grado deconcordancia entre la distribución del conjunto de datosempíricos o ce muestra de alguna distribución teórica especifica.La prueba se realiza desarrollando o especificando ladistribución de probabilidad acumulativa que podría resultar dela distribución teórica y comparándola con la distribución deprobabilidad itcumulativa de los datos empíricos o de muestra.

Simulación — Prof. Andrés Lillo'''''''....n-•01.11111111•~1111•5•11n 1•1•1n11111•111111111•11111MILS=1.11~~•71

SlrIltIlaCIOrl

Prueba Ji-cuadrada de la bondad del ajuste

1-1311ando el valor crítico que corresponde a X 2 4 _2_ 1 ,0.95 = 3. 84,resulta que el intervalo de aceptación es (0, 3.84). Como el valor

perimcnial. 0.41669, pertenece a este intervalo se decidetc.eptar clac los datos siguen una distribución Normal con media

,A-55") v dsviación cstándar dc.

Simulación — Prof. Andrés Lillmoi

8

Page 20: Simulacion Ultima Guia y Clase

01111U10,1-1l31 ►

Prueba de Kolmogorov - Smirnov

I broclAhrliento de Kohnol2orov-Smirnov prueba la hipótesisde que la distribución acumulada de una variable aleatoria x es1 : ,,tx 1. Pan, probar esta hipótesis. una muestra de tamaño n esobtenida distribución F(x). En seguida, se determina la

a...umulada de la 'nuestra, la cual se ,I.denota porF„(x). Posteriormente l'„(x) es comparada con la distribuciónhipotética Fo(x). Si 1 :„(x) difiere demasiado de F o(x), entoncesesto es una amplia evidencia de que 1 :„(x) no es igual a Fo(x).

Simulación — Prof Andrés Lillo

...uraiaanw~an zza amozzausa~i

Prueba de Kolmogorov - Smirnov

La aplicación de esta prueba puede ser descrita en los siguientespasos:

Obtener los valores de la muestra.Ordena' dichos valores en orden ascendente.

Calcula la distribución acumulada de los números con lasiguiente expresión:

F n(x) n

donde es la posición que ocupa el número

Calcular el estadístico Kolmogorov-Smirnov del modosiguiente : D„ = máx IF„(x) - para toda

5. Si D„ < „ , entonces no se puede rechazar la hipótesis deque los valores observados proviene de una distribuciónhipotétic t Simulación — Prof Andrés Lillo

alliIIMEI•di Mes 11•1111111111~Will~1~

Page 21: Simulacion Ultima Guia y Clase

Simulación

Prueba de Kolmogorov - Smirnov

bla i . Distribución de frecuencia de consultas telefónicas porinter; tilos 1 una hora (valores discretos)

Númerode consultas

FrecuenciaFrecuencia Relativa

,, 315 'ú.619E

1 142 0.279

2 40 0.078

3 9 0.018

4 2 0.004

5 1 0.002

total __..509 1.000

Simulación - Prof. Andrés Lillo

11•1011111~~11~11•1•12

(i-- [ Prueba de Kolmogorov - Smirnov'

Utilizaremos los datos de la tabla 1 para ejemplificar el método.La hipótesis H 0 es "no existe ninguna diferencia significativaentre los datos observados y aquellos que podrían proporcionaruna distribución de Poisson con media = 0.5577 y n = 509".Primero debemos obtener las distribuciones acumulativas tantopara los dalos observados como para aquellos que podríapropc rcionar la distribución teórica.

lelas

IFrecuenciaobserva< a

IIProbabilidadobservada

IIIProbabilidad

Teórica

IVAcumulativo

II

yAcumulativo

III

VI1 D 1

(IV - V) 1

315 0,619 0,571 0,619 0,571 0,048

142 0,279 0,319 0,898 0,890 0,008

40 0,078 0,089 0,976 0,979 0,003

9 0,018 0,017 0,994 0,996 0,002

2 0,004 0,003 0,998 0,999 0,001

1 0,002 0,001 1,000 1,000 0,000

Simulación - Prof. Andres Lillo

"Imaiamen~~~ wizain~e~~

Num.Consul

o

2

3

4

5

I n

Page 22: Simulacion Ultima Guia y Clase

Simulaclon

Prueba de Kolmogorov - Smirnov—

Segtin la tabla anterior la mayor desviación absoluta es de 0.048para cero t unsultas. Esta es la desviación que se quiere compararcon los valores críticos que se presentan en la tabla de1< , .., knouorov-Smirnov. En esta tabla se puede observar que parau 50¿-i c –0.05 el valor critico está dado por:

„ 1.36Do 05 , > 10o =

1.36 1.36DCrilaa = = 0.0603

509 22.56

Debido a c ue nuestra desviación más grande fue de 0.048, y0.048 < 0.043 no rechazamos la hipótesis nula.

Simulacion — Prof Andrés Lillo .~.11,1"~la 1111111111111•111111111~11111111E

1 Prueba de Kolmogorov - Smirnov

La pregunta referente a cuándo usar la prueba ji-cuadrada ycunado usar a pniba de Kolmogorov-Smimov, surge de maneranatural. En general, para muestras muy pequeñas la ,prueba ji-

cuadrada no es del todo aplicable y debe usarse la deKohnogorov-Smimov. También, cuando el tamaño de la muestraes h) suficientemente pequeño de modo que tengamos quecombinar elwes adyacentes a fin de usar la prueba X 2, se pierdecierta potenc;a. Por otra parte, si el tamaño de la muestra esgrande la prueba X2 es probablemente preferible. Cada pruebatiene ciertos 'untos fuertes y ciertos puntos débiles y sólo sepueden propwcionar guías generales para escoger entre ellas. Laprueba ji-cuajada es muy poderosa para muestras grandes

00), ne . existe razón alguna para no usar la prueba deKolmogorov-1;mimov en el rango 99 > n > 0.

Simulación — Prof Andrés Lillo

..~ .141"11~11•11~1~ Mal

Page 23: Simulacion Ultima Guia y Clase

r'rueba de Kolmogorov - Smirnov

1:11 las prt ebas ji-cuadrada de bondad de ajuste y Kol n , analista debe especificar el número de clases. Esta

elección e; importante, ya que determina los grados de libertadpara cada micha, y, en general. mientras más grados de libertadpueda u.-;¿.-Li uno, rnás diSefitititiadurd belí1 la prueba. , En la pruebaji-cuadrad, el número de clases o intervalos a menudo sedetermina ; )or la necesidad de un mínimo de cinco elementos dedatos de el da clase. La prueba de Kolmogorov-Smirnov, puedeusar un grupo de datos o emplear cada observación como unaclase indi\ ideal, lo que permite así al análisis efectivo demuestras m 'ts pequeñas.

;irnulación - Prot. Andrés• • .~11711. MIL 1M1n•••/1~1115~11.14 Mf.f.M11~~11nW 1