Ajustar Datos - Input Analyzer

16
Input Analyzer Magíster Víctor Andrade Soto

Transcript of Ajustar Datos - Input Analyzer

Input AnalyzerMagster Vctor Andrade Soto

Anlisis de los Datos de entrada Un primer problema a resolver es si el modelado tendr entradas determinsticas o aleatorias. En la realidad lo ms probable es que en trminos de produccin muchos procesos mecanizados tengan duraciones determinsticos, sin embargo, si existe participacin humana a travs de operarios estos procesos suelen ser aleatorios en su duracin. Un modelo aleatorio siempre es un modelo correcto. Un modelo determinstico suele ser un modelo incorrecto dado que no existe variabilidad en el sistema.

Recopilacin de datos La informacin suele tomarse de: Observacin Entrevistas Data histrica

Sin embargo a travs de cualquiera de estas fuentes es probable que los datos que se obtengan no sean suficientes. Por ello se requiere mantener las siguientes pistas de ayuda: Anlisis de sensibilidad Correspondencia del detalle con la calidad de los datos Costo Basura que entra es basura que sale

Uso de datos Desde el punto de vista terico, los datos recopilados representan lo que pas en el pasado y no lo que pasar en el futuro. Puede que la cantidad de datos recopilados no sea suficiente para soportar el anlisis o para realizar un buen ajuste. Arena cuenta con dos posibilidades: Leer los datos histricos: a travs de ficheros texto, excel, acces u otros Ajustar los datos a una o muchas distribuciones de frecuencia: empleando el Input Analyzer que viene con Arena.

Input Analyzer Debemos colocar los datos histricos en un fichero de texto con formato ASCII para que el software nos proporcione parmetros vlidos para la distribucin de frecuencia que estemos validando o para que nos informe acerca de la mejor distribucin a la que se ajustan los datos. Existen 2 tipos de distribuciones: tericas y empricas. Asimismo cada una de ellas se divide en Continua y Discreta. Luego veremos una lista de las distribuciones que Input Analyzer utiliza. Entonces debemos Tener el archivo de texto Ajustar los datos Seleccionar la distribucin a usar Copiar la expresin generada al modelo en Arena.

Los datos Generamos un conjunto de valores aleatorios que supongan nuestra observacin y los guardamos en un fichero del block de notas con extensin dst (datos1.dst) Ejecute el input Analyzer. File-New. Aparece una hoja en blanco. Ahora File Data File Use Existing y seleccione el fichero datos1.dst. Aparecer un histograma en la parte superior y un resumen estadstico bsico de los datos en la parte inferior. Puede ajustar o maximizar el tamao de la ventana.

Hagamos click en el men Fit(ajustar). Elijamos una distribucin ms o menos apropiada al histograma mostrado (usar uniforme ya que los datos fueron creados siguiendo esta distribucin). Ahora muestra el ajuste (en este caso una lnea recta sobre las barras). Un fichero UNIFORM.OUT se ha creado en la carpeta donde est el fichero. Muestra el resumen estadstico y la prueba de ajuste (que se ven el el analizador) as como la distribucin de frecuencias de los datos. Muestra el error cuadrtico encontrado en el ajuste que en este caso es de 0.008 (cuanto ms se acerque a 0 es mejor) que indica un buen ajuste. La expresin exacta a usar en arena sera UNIF(3,13)

Si planeamos utilizar una distribucin terica y no tenemos ni la ms remota idea de cual usar podramos ir a Fit-Fit All Ajusta todas las distribuciones aplicables a los datos, calcula estadsticas de prueba de cada una y presenta la distribucin que tiene el menor valor en el error cuadrtico. Podemos ver el resumen de este valor para todas las distribuciones posibles si vamos al men Window-Fit All Sumary. En el ejemplo planteado la mejor curva es Beta (que es un tipo de uniforme) y la expresin a pasar es: 3 + 10 * BETA(0.947, 1.23)

La decisin acerca del empleo de una un otra distribucin puede no depender solamente del error cuadrtico. En el Resumen se muestran 2 pruebas adicionales: Chi cuadrado y Kolgomorov Smirnov. En ambos observamos el p-valor correspondiente que siempre ser un nmero entre 0 y 1. Es la probabilidad de obtener un conjunto de datos que es ms inconsistente con la distribucin ajustada que el conjunto de datos que tenemos si se asume que su ajuste es la verdad. En este caso se busca que el nmero sea alto (digamos superior a 0.1). Para el ejemplo proporcionado las tres pruebas indicaran que lo correcto es usar un distribucin de tipo Beta, aunque una uniforme no es una mala eleccin. Por ltimo podramos ejecutar el modelo con las dos expresiones para comparar si hay diferencias significativas.

Podemos restringir la eleccin a distribuciones con o sin lmites. La distribucin tringulas tiene lmites a ambos lados mientras la normal no los posee. Podramos usar cualquiera de ellas para representar tiempos de proceso. Sin embargo una distribucin normal con promedio cercano a 0 puede devolvernos valores negativos y en contextos donde dichos valores no tienen sentido Arena los convierte en 0 por lo que la simulacin podra no ser vlida. Es ms fcil ajustar distribuciones con parmetros conocidos. Por ejemplo los parmetros de la exponencial son ms fciles de entender que los de 1 distribucin de tipo beta. Sin embargo estas dudas deben ser guiadas por los resultados obtenidos por el analizador de entradas.

Cuando no existen datos Dependeremos de suposiciones arbitrarias que debemos tratar de dignificar de la mejor manera. Debemos tratar de obtener informacin que represente caractersticas de funcionamiento del sistema (por ejemplo falla entre el 12% y 15% del tiempo, llega a producir entre 10 y 12 piezas por hora). Para seleccionar la distribucin adecuada en ausencia de datos empricos guese de la siguiente tabla.

Distribucin

Parmetros

Caractersticas

Ejemplo de uso Tiempo entre llegadas Tiempo para fallas Tiempo de actividad

Exponencial

Media

Varianza Alta Lmite a la izquierda

Triangular

Mnimo, Moda, Mximo

Simtrica o Asimtrica Lmite a ambos lados Todos los valores igualmente parecidos en probabilidad Lmites a ambos lados

Uniforme

Mnimo, Mximo

Poco conocimient o del proceso