DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA VARIABLES … · 2017-09-14 · 0 desarrollo...
Transcript of DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA VARIABLES … · 2017-09-14 · 0 desarrollo...
0
DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA
VARIABLES ALEATORIAS CON DISTRIBUCIÓN SIMÉTRICA O
ASIMÉTRICA, BASADO EN EL RECONOCIMIENTO DE PATRONES
POR REDES NEURONALES ARTIFICIALES.
Tesis
QUE PARA OBTENER EL GRADO ACADÉMICO DE
Doctor en Ciencia y Tecnología
en la especialidad de
Ingeniería Industrial y de
Manufactura
PRESENTA
José Antonio Vázquez López
León, Guanajuato, México, Agosto del 2009
1
RESUMEN
Los gráficos de control de medias y rangos y de la fracción de disconformes usados en el
control estadístico de procesos son herramientas importantes para el mejoramiento de la
calidad de la producción. Los principios de dichas herramientas fueron desarrollados en los
años 1920’s y han sido implementados en las empresas manufactureras desde entonces. No
obstante su trascendental aplicación, se reconoce que tienen limitaciones prácticas ya que
dependen de la apreciación y juicio humano además de considerar a la variable aleatoria con
distribución de probabilidad normal (simétrica), para el establecimiento de sus límites de
control. Los procesos de manufactura modernos, han generado cambios en la forma de la
distribución de probabilidad de las variables aleatorias, pasando de aproximadamente
normales con dispersión moderada a sesgadas con baja dispersión; lo que genera problemas
importantes para la implementación y uso de éstos gráficos de control.
En recientes investigaciones, soluciones alternas se han observado mediante el empleo de
herramientas de inteligencia artificial como son las Redes Neuronales Artificiales. Aunque las
investigaciones mencionadas son amplias y demostrativas de esto, se debe reconocer que estos
estudios aun se encuentran en fase de experimentación con datos simulados en el
reconocimiento de patrones de variación de los datos.
En esta investigación se propone un método novedoso de control estadístico de procesos que
es alterno a los gráficos de control de medias y rangos y de la fracción disconforme. Este
método se basa en el reconocimiento de patrones del proceso de manufactura, en los estados
de control y fuera de control del proceso. Se propone el uso de la red neuronal
FuzzyARTMAP, cuyos parámetros han sido determinados a través de diseño de experimentos
para identificar niveles significativos de eficiencia. El método de control estadístico aquí
propuesto ha sido validado experimentalmente con datos simulados por el método de Monte
Carlo y por su aplicación a dos casos de empresas diferentes entre sí, lo que demuestra que el
método desarrollado no recurre a supuestos de normalidad ni a juicios humanos para
determinar si el proceso de manufactura se encuentra o no en control estadístico.
2
ABSTRACT
3
DEDICATORIA
4
AGRADECIMIENTOS
5
ÍNDICE GENERAL
RESUMEN………………………………………………………………………………… 1
ABSTRACT……………………………………………………………………………….. 2
DEDICATORIA…………………………………………………………………………… 3
AGRADECIMIENTOS……………………………………………………………………. 4
1. INTRODUCCIÓN………………………………………………………………………
10
1.1. Gráficos de control……………………………………………………………….. 13
1.2. Control estadístico de procesos y RNA………………………………………… 16
1.3.Contribución original……….…………………………………………………… 18
1.4.Organización de la tesis…….…………………………………………………… 19
2. DEFINICIÓN DEL TEMA………………………………………………………………. 21
2.1. Hipótesis de investigación….…………..…………………………………………. 21
2.2. Alcance de la investigación……………………………………………………… 21
3. JUSTIFICACIÓN Y OBJETIVOS………………………………………………………. 22
3.1. Justificación……………………………..………………………………….…….. 22
3.2. Objetivos………………………………….……..………………………………… 23
4. FUNDAMENTACIÓN…………………………………………………………………... 24
4.1. Redes neuronales artificiales…………………………………………….………… 24
4.2. Breve historia………….………………………………………..…………………. 26
4.3. Retropropagación……………………….…………………………………………. 28
4.4. FuzzyARTMAP………….……………………………………………………….. 29
4.4.1. Parámetros de la FuzzyARTMAP y nomenclatura.……………………….. 31
4.5. Investigaciones recientes…………………………………………………………. 31
4.5.1. Reconocimiento del patrón natural mediante redes neuronales…………… 31
4.5.2.Reconocimeinto de patrones natural y especiales mediante redes
neuronales………………………………………………………………….. 32
4.6. Bases estadísticas de la redes neuronales…………………………………………. 35
4.7. Tipos de patrones especiales……………………………………………………… 36
4.7.1. Simulación de X por Monte Carlo…………………………………………. 37
4.7.2. Patrón natural en estados de control y fuera de control estadístico………... 38
4.7.3. Patrón de cambio superior en la media…………………………………….. 40
4.7.4. Patrón de cambio inferior en la media…………………………………….. 43
4.7.5. Patrón de tendencia creciente……………………………………………... 43
4.7.6. Patrón de tendencia decreciente…………………………………………… 44
5. PROCEDIMIENTO EMPLEADO Y RESULTADOS OBTENIDOS………………….. 46
5.1. Especificación de los valores de µ y σ para el patrón natural……………………. 47
5.2. Generación de vectores de datos del patrón natural………………………………. 47
5.3. Codificación de los datos del patrón natural……………………………………… 47
5.4. Entrenamiento de la FuzzyARTMAP para el patrón natural…………………… 48
5.5. Prueba de la FuzzyARTMAP para el patrón natural……………………………… 49
6
5.6. Aplicación del Diseño Experimental para el patrón natural……………………… 49
5.6.1. Diseño del experimento…………………………………………….……… 49
5.6.2. Análisis de varianza para el experimento con el patrón natural……………. 50
5.6.3. Determinación de efectos principales y de coeficientes…………………… 52
5.6.4. Análisis gráfico del experimento sobre el patrón natural………………… 52
5.6.5. Optimización de la eficiencia de la red neuronal………………………… 57
5.6.6. Validación experimental…………………………………………………… 58
5.6.7. Comparación con otros estudios…………………………………………… 58
5.7. Especificación de los valores del efecto de variación especial…………………… 59
5.7.1. Cambio superior e inferior en el nivel de la media………………………… 60
5.7.2. Tendencia creciente y decreciente…………………………………………. 60
5.8. Generación de vectores de datos de patrones especiales………………………….. 61
5.9. Codificación de los datos de los patrones especiales…………………………… 61
5.10. Entrenamiento de la FuzzyARTMAP para los patrones especiales…………… 62
5.11. Prueba de la FuzzyARTMAP para los patrones especiales……………………… 62
5.12. Aplicación del Diseño Experimental para patrones especiales………………… 63
5.12.1. Diseño del experimento………………………………………………… 63
5.12.2. Análisis de Varianza……………………………………………………… 63
5.12.3. Efectos y coeficientes…………………………………………………… 64
5.12.4. Análisis grafico…………………………………………………………… 64
5.12.5. Validación experimental………………………………………………… 67
6. MÉTODO PROPUESTO DE CONTROL ESTADÍSTICO DE PROCESOS………… 68
6.1. Método propuesto de control de procesos por reconocimiento de patrones………. 68
6.2. Determinación de causas especiales de variación………………………………… 72
6.3. Validación del algoritmo de identificación de la estabilidad del proceso………… 73
7. CONCLUSIONES……………………………………………………………………… 91
REFERENCIAS……………………………………………………………………………..
93
ANEXO A. Programa codificador de datos hecho en MATLAB………………….……… 97
ANEXO B. Comparación de las propiedades estadísticas entre datos no codificados y
codificados……………………………………………………………………. 98
ANEXO C. Exploración preliminar para ubicar al área de factibilidad experimental con
vectores de tamaño pequeño………………………………………………… 100
ANEXO D. Exploración preliminar para ubicar al área de factibilidad experimental con
vectores de tamaño grande…………………………………………………… 107
ANEXO E. Evolución de la eficiencia de la red neuronal en la clasificación de patrones….. 110
ANEXO F. Artículos………………………………………………………………………… 112
ANEXO G. Algoritmos empleados para la implementación de la red FuzzyARTMAP……. 113
7
LISTA DE FIGURAS
Figura 1.1. Importancia de la simetría de X para el establecimiento de los límites de
control……………………………………………………………………… 15
Figura 4.1. Red neuronal biológica…………………………………………………….. 25
Figura 4.2. Representación de una red neuronal……………………………………… 28
Figura 4.3 Arquitectura FuzzyARTMAP. ………………………….…………..…… 29
Figura 4.4 Arquitectura básica ART………………………………………………… 30
Figura 4.5 Arquitectura del sistema híbrido para el reconocimiento de patrones…….. 33
Figura 4.6 Forma típica del patrón natural…………………………………………….. 38
Figura 4.7 Forma típica de la distribución normal…………………………………… 39
Figura 4.8 Elementos del patrón cambio superior de la media……………………… 41
Figura 4.9 Mezcla de poblaciones normales del patrón cambio superior del nivel de la
media……………………………………………………………………….. 42
Figura 4.10 Patrón de cambio inferior en la media……………………………………... 43
Figura 4.11 Patrón de tendencia creciente………………………………………………. 43
Figura 4.12 Asociación del patrón de tendencia creciente con la distribución de
probabilidad de X (d = 1,2 y 3)……………………………………………. 44
Figura 4.13 Patrón de tendencia decreciente……………………………………………. 45
Figura 5.1 Efectos significativos del experimento con el patrón natural……………… 53
Figura 5.2 Magnitud de los efectos de los factores de variación del experimento con el
patrón natural………………………………………………… 54
Figura 5.3 Residuales contra orden de corrida experimental para el experimento con
el patrón natural………………………………………………… 55
Figura 5.4 Residuales contra el factor ρab del experimento con el patrón natural…….. 55
Figura 5.5 Residuales contra valores ajustados del factor ρab del experimento con el
patrón natural………………………………………………………………. 56
Figura 5.6 Gráfica de probabilidad normal de los residuales del experimento con el
patrón natural……………………………………………………………….. 56
Figura 5.7 Efectos de los factores significativos de la experimentación con patrones
especiales…………………………………………………………………… 65
Figura 5.8 Residuales contra el orden de las corridas experimentales de la
experimentación con patrones especiales…………………………………... 66
Figura 5.9 Residuales contra valor ajustado de la experimentación con patrones
especiales…………………………………………………………………… 66
Figura 5.10 Gráfica de probabilidad normal de los residuales del experimento con
patrones especiales………………………………………………………… 66
Figura 6.1 Método de control de procesos…………………………………………….. 68
Figura 6.2 Algoritmo de control del proceso………………………………………….. 69
Figura 6.3 Gráficas de los 21 vectores X de la empresa del caso 1…………………… 79
Figura 6.4 Forma sesgada de la distribución de probabilidad para el caso de
validación 1………………………………………………………………… 81
Figura 6.5 Análisis de idoneidad de las comparaciones de las medias de las muestras.. 88
8
LISTA DE TABLAS
Tabla 4.1 Resumen de resultados de investigaciones previas en la clasificación del
patrón natural a valores diferentes de µ y σ Hindi (2004)……………… 32
Tabla 4.2 Resumen de resultados de investigaciones previas en la clasificación del
patrón natural a valores diferentes de µ y σ Guh R.S. (2005)………..… 34
Tabla 4.3 Combinaciones de los parámetros de la distribución normal…………… 40
Tabla 5.1 Asociación binaria para entrenamiento de red neuronal………………… 48
Tabla 5.2 Resumen del diseño experimental para el patrón natural……………… 49
Tabla 5.3 Listado de corridas experimentales para el patrón natural……………… 50
Tabla 5.4 Análisis de varianza para el patrón natural……………………………… 51
Tabla 5.5 Tabla de efectos principales y coeficientes del modelo experimental…… 52
Tabla 5.6 Optimización de la eficiencia de la red neuronal en la clasificación del
patrón natural……………………………………………………………. 57
Tabla 5.7 Valores de los parámetros de la red neuronal que maximizan su eficiencia 58
Tabla 5.8 Resultados de la prueba confirmatoria de resultados…………………… 58
Tabla 5.9 Comparación de los resultados de esta investigación con un estudio
similar……………………………………………………………………... 59
Tabla 5.10 Tipo de distribución del vector X a distintos valores de “d”……………… 60
Tabla 5.11 Asociación del patrón especial con el código binario para el
entrenamiento de la FuzzyARTMAP…………………………………… 62
Tabla 5.12 Resumen del experimento para clasificar patrones especiales………… 63
Tabla 5.13 ANOVA para el experimento de clasificación de patrones especiales…… 64
Tabla 5.14 Tabla de efectos principales y coeficientes del modelo experimental para
patrones especiales……………………………………………………… 64
Tabla 5.15 Resultados de la prueba confirmatoria del experimento con patrones
especiales………………………………………………………………… 67
Tabla 6.1 Estados de uso de la red neuronal………………………………………… 71
Tabla 6.2 Clasificación del patrón por algoritmo…………………………………… 72
Tabla 6.3 Identificación de patrones especiales y su relación con causas de
variación 73
Tabla 6.4 Tipos de patrones para validación experimental………………………… 74
Tabla 6.5 Resultados de la validación experimental………………………………… 75
Tabla 6.6 Vectores móviles………………………………………………………… 77
Tabla 6.7 Número de unidades defectuosas en una muestra de tamaño n, en el
tiempo t…………………………………………………………………… 78
Tabla 6.8 Fracción no conforme de unidades revisadas en la empresa caso 1……… 82
Tabla 6.9 Datos estandarizados de la empresa del caso 1…………………………… 82
Tabla 6.10 Datos codificados de la empresa del caso 1……………………………… 8.3
Tabla 6.11 Clasificación de los vectores de acuerdo al tipo de su distribución de
probabilidad……………………………………………………………… 83
Tabla 6.12 Resultados obtenidos por el algoritmo identificador de estados de control
para la empresa del caso 1……………………………………………….. 84
Tabla 6.13 Mediciones del peso en gramos de un producto alimenticio……………… 86
Tabla 6.14 Resultados obtenidos por gráfico de control y algoritmo para los datos de
la empresa del caso 2 de la validación práctica…………………………
87
Tabla 6.15 ANOVA de las comparaciones de las medias de las muestras…………… 87
9
LISTA DE ABREVIATURAS
PARÁMETRO DE LA RED
NEURONAL
DESCRIPCIÓN
ABRE-
VIATURA
Vigilancia en el módulo de entrada 1 Vigilancia en el modulo de entrada en entrenamiento de
la red neuronal ρa1
Vigilancia en el campo de mapeo 1
Vigilancia en el campo de mapeo en entrenamiento de la
red neuronal ab1
Razón de aprendizaje 1
Razón de aprendizaje en entrenamiento de la red
neuronal
β1
Vigilancia en el módulo de salida
Vigilancia en el modulo de salida ρb1,2
Vigilancia del campo de mapeo 2
Vigilancia del campo de mapeo en prueba de la red
neuronal ab2
Razón de aprendizaje 2
Razón de aprendizaje en prueba de la red neuronal β2
Vigilancia en el módulo de entrada 2
Vigilancia en el modulo de entrada en prueba de la red
neuronal
ρa2
10
Capítulo 1
INTRODUCCIÓN
La calidad de los productos manufacturados es evaluada por los clientes, cuando ellos los
adquieren y usan; sin entrar en definiciones, por calidad se puede entender que algo es
adecuado para el uso que se le da. Esta explicación corta de lo que significa calidad, conlleva
a la necesidad de emplear la métrica en diversas características físicas de los productos, para
poder expresar objetivamente el nivel de calidad que éstos tienen en función del grado en que
sus mediciones generan valores numéricos dentro de las especificaciones o estándares de
calidad.
La serie de datos numéricos obtenida por el proceso de medición de la calidad de un producto,
genera, lo estadísticamente denominado, variables aleatorias. Toda variable aleatoria tiene un
comportamiento estadístico que es estudiado para poder generar esquemas de comprensión de
la forma en que el sistema de manufactura opera. Actualmente, los sistemas de manufactura
han evolucionado al grado tal que la producción masiva es ya un hecho natural, debido a que
las empresas han automatizado gran parte de sus procesos. El requerimiento de fuerza de
trabajo proveniente del hombre, es actualmente menor que en el pasado, pero del humano se
necesita ahora otro tipo de trabajo, que es, el intelectual.
Derivado de esto, resalta el hecho de que los sistemas de control estadístico de la calidad
creados en el pasado, ya no pueden funcionar con la misma eficiencia que tenían, pues la
interacción entre dos sistemas (manufactura automatizada y gente) no tiene las mismas
condiciones que antes, donde el grado de automatización era menor. Esto genera la necesidad
de revolucionar a los sistemas de control de calidad.
Entre las metodologías más difundidas para el aseguramiento y control de la calidad, sobresale
el Control Estadístico de Procesos (CEP), que en esencia consiste en monitorear la
11
manufactura de los productos para mantener sus mediciones dentro de lo esperado al eliminar
o reducir los efectos de variación nocivos a la calidad. Las herramientas más importantes en
el CEP, son los gráficos de control (GC). En la época actual, las principales desventajas de los
GC son (i) su incapacidad para identificar en tiempo-real el tipo de patrón de variación
presente en el proceso de manufactura y (ii) el requerimiento de normalidad en la distribución
de la variable estudiada. Los GC no necesariamente funcionan en tiempo-real y suelen, por
otro lado, estar asociados a una necesidad de elevados muestreos cuando no hay simetría en la
distribución de la variable observada.
Los GC están diseñados para identificar momentos de variación especial, más no patrones de
variación especial. Actualmente, se prefiere lo segundo basado en muestreos rápidos y
eficientes en tiempo-real que no dependan de la aplicación de criterios apoyados en la
apreciación humana.
Son dos los estados generales que un proceso de manufactura puede tener. Estos son,
estabilidad (proceso en control estadístico) e inestabilidad (proceso fuera de control
estadístico). El primero se presenta cuando los valores de los parámetros esenciales de la
característica de calidad se mantienen cercanos o iguales a los deseados. El estado de
inestabilidad ocurre por la presencia de una causa de variación especial y esto hace que los
valores de los parámetros cambien considerablemente.
Como alternativa al uso de los GC destaca el control estadístico por reconocimiento de
patrones, sin embargo, esto es una de las tareas complejas en la aplicación del CEP porque
ello no está considerado en la metodología ofrecida por el CEP tradicional. No obstante,
recientemente, se ha investigado con éxito el uso de inteligencia artificial y específicamente, el
de las Redes Neuronales Artificiales (RNA) para este propósito. Éstas son útiles cuando un
sistema numérico tiene complejidad para ser modelado debido a diversas “incertidumbres” o
causas de variación que actúan en dicho sistema.
Asociado al CEP tradicional se ubica el supuesto de que la característica de calidad en
supervisión debe distribuirse aproximadamente normal para que el establecimiento de los
12
límites de control sea correcto. Esta característica no es una condición para el uso de una
RNA, por lo que el enfoque del control de calidad tradicional cambia, de la identificación de
los momentos de inestabilidad del proceso a través de la observación gráfica del
comportamiento de la característica de calidad, que se asume normal, a la identificación de
patrones de estabilidad e inestabilidad sin importar el tipo de distribución. Por estas razones,
es útil el uso de inteligencia artificial. En esta tesis se usa la RNA denominada
FuzzyARTMAP, por sus características en la predicción de patrones de variación.
La FuzzyARTMAP tiene parámetros de operación y uno de los más importantes es el de la
“vigilancia” de la red, el cual afecta a la selectividad o granularidad de la eficiencia de su
predicción. Existen otros parámetros de funcionamiento, que en conjunto deben ser colocados
en los valores ideales para maximizar la eficiencia de su predicción. La selección de los
parámetros adecuados y su ubicación en el valor correcto es un punto importante de esta tesis.
En esta investigación se propone la combinación de los parámetros de la RNA que
demostraron ser significativamente influyentes en su selectividad o eficiencia para cada caso
de comportamiento de la variable aleatoria estudiada. Se muestra la forma de su detección,
prueba y selección de mejores niveles de rendimiento. Para ello, se aplicó un proceso de
experimentos diseñados y se presentan los resultados obtenidos tanto en la experimentación
como en su aplicación a dos procesos de manufactura. En la experimentación se recurrió al
uso del proceso generador de variables aleatorias por simulación de Monte Carlo.
Finalmente, los resultados obtenidos condujeron a la prueba y propuesta de un método que
tiene por objetivos la identificación de estados de control del proceso, entre estable e inestable,
y la correcta clasificación del patrón con el que una muestra de datos se comporta. Este
método tiene importancia en el control de calidad de procesos de manufactura automatizados,
donde es complejo la aplicación de las técnicas tradicionales para el monitoreo y control de las
características de calidad.
13
1.1 Gráficos de control
Los GC fueron introducidos por el Dr. Walter A. Shewhart en 1924 con el propósito de
observar el comportamiento del proceso de manufactura para mantenerlo en un estado de
control estadístico que asegure una elevada calidad en la producción. Se pueden señalar los
propósitos generales de estas gráficas (Montgomery, 1991):
a) Rastreo y vigilancia del proceso.
b) Reducción de la variabilidad del proceso.
c) Estimación de los parámetros del producto o del proceso.
El poder de un gráfico de control estriba en su capacidad para separar la variación total (VT),
ocurrida en un proceso de manufactura y reflejada en la variable aleatoria X, en dos grupos o
tipos: variación natural (VN) y variación especial (VE). De este modo, la VT se puede
expresar en función de estos dos tipos de variación, de acuerdo a la ecuación 1.
𝑉𝑇 = 𝑓 𝑉𝑁, 𝑉𝐸 = 𝑉𝑁 + 𝑉𝐸 (1)
En términos de (1), se debe hacer notar que los objetivos del control estadístico de procesos
son:
𝑎. 𝑉𝑇 → 𝑉𝑁
𝑏. 𝑉𝐸 → 0
Nótese que no se expresa VT → 0 como objetivo del CEP, pues esto forma parte de técnicas
avanzadas de control de calidad, como el diseño de experimentos. Así entonces, si VE→0
hasta que VE << VN, el proceso de manufactura operará de manera estable; por el contrario, si
VE crece, de tal modo que VE >> VN, habrá inestabilidad.
De forma general, un sistema de manufactura presenta VT debido a los efectos variables de
sus componentes, tales como maquinaria, equipo, mano de obra, medio ambiente, materiales,
14
materia prima y método de trabajo. La VN es normal en todo proceso y ésta se mantiene
relativamente baja de tal forma que no afecta a la calidad del producto en el sentido de que
solo pequeñas cantidades de unidades producidas estarán fuera de las especificaciones del
mismo. La VE también es ocasionada por los mismos elementos del proceso de manufactura
mencionados, solo que la suma total es magnificada debido a la presencia de una causa
específica en éstos.
La esencia de funcionamiento de los GC es la detección de los dos componentes de la VT
(ecuación 1), lo cual se consigue mediante el monitoreo constante y continuo de una o más
características de calidad del producto manufacturado en una gráfica bidimensional de la
medición de su calidad en función del tiempo. En este sentido, a cierto momento en el tiempo,
cuando en la gráfica se observan señales de VE, se debe tomar la decisión de si estas señales
son verdaderas indicadoras de inestabilidad y no falsas alarmas, posiblemente derivadas de la
subjetividad de la apreciación visual. Aquí, se prueban las hipótesis de afirmar que el proceso
no es estable cuando verdaderamente lo sea, o bien de aceptar que lo es cuando en realidad
está fuera de control. Aceptar o rechazar ambas hipótesis conduce a los errores estadísticos
tipo I y II. Gutiérrez y de la Vara (2004), los explican así: Error tipo I, reaccionar ante un
cambio o variación como si proviniera de una causa especial, cuando en realidad no lo es.
Error tipo II, tratar un efecto o cambio como si procediera de causas comunes de variación,
cuando en realidad se debe a una causa especial. Se puede reducir o evitar un tipo de error,
pero no ambos.
La forma de detectar a la VN y a la VE en un GC, asociada a la presencia de causas naturales
y especiales de variación, respectivamente, es como sigue: Si se observa un punto fuera de los
límites de control, o bien, si todos los puntos están dentro de dichos límites pero presentan un
patrón no aleatorio (detectado de forma visual), entonces se tiene una clara señal de que una
causa especial está actuando y se tendrá variación especial mayor a la natural (Gutiérrez y De
la Vara, 2004). En este caso se puede asumir la inestabilidad del proceso de manufactura.
El sustento probabilístico del funcionamiento de los GC es la distribución normal, la cual es
simétrica respecto a la media. La simetría en la distribución de la característica de calidad
15
estudiada posibilita el cálculo de los límites de control del proceso, que son, el superior (LSC)
y el inferior (LIC). Éstos se obtienen a partir de un valor central (la media del proceso, µ) y de
una distancia deseada de separación, expresada en desviaciones estándar (σ), entre µ y los
límites de control. De este modo:
LSC = media + k desviaciones estándar.
LÍNEA CENTRAL = media general.
LIC = media - k desviaciones estándar.
Así es como el establecimiento de los límites de control presupone una simetría en la forma de
la distribución de la variable aleatoria X. Ver figura 1.1.
Figura 1.1. Importancia de la simetría de X para el establecimiento de los límites de
control.
El funcionamiento del GC es sencillo y práctico, pero tiene desventajas importantes, como ya
se mencionó. Entonces, con los GC sólo se puede saber con precisión “el cuándo y el dónde”
hay variación especial mas no “el qué” se presentó, de forma eficiente, generando entonces
diagnósticos apresurados y a veces erróneos (Guh, 2005).
Para intentar saber “el cuándo y el dónde” de la ocurrencia de variación especial, se recurre al
uso de reglas establecidas para ese fin. Éstas requieren del juicio humano, lo cual, como se
dijo, es una desventaja de los GC. Aunque su uso es adecuado para saber “el cuándo y el
dónde” de una variación especial, esto no lo es, cuando se busca la identificación de patrones
estadísticos especiales de la variable aleatoria X, lo cual daría la respuesta correcta a la
pregunta del ¿qué ocurrió? (Guh, 2002; Lucy, 1993).
LSC
Línea central
LIC
+k desviaciones estándar
-k desviaciones estándar
16
La implementación de los GC suele conducir a casos donde sea necesario controlar
estadísticamente características de calidad tomadas como variables aleatorias X que pueden
tener distribución de probabilidad no simétrica, o bien, no normal. Con esto presente en X,
suele incrementarse la complejidad para obtener de forma eficiente resultados satisfactorios en
el uso de los GC, pues se debe incrementar el nivel de muestreo o su frecuencia, o ambas
cosas, para obtener muestras grandes que aseguren normalidad1; no obstante, esta medida
correctiva incrementa el costo de los GC al requerir más recursos, tales como cantidad de
pruebas, personal especializado, etc.
También es posible recurrir al uso de transformación de datos2 cuando X es asimétrica, lo cual
constituye en sí un paso adicional que agrega trabajo al proceso de control de la calidad.
Además de lo anterior, las transformaciones de datos implican un grado de complejidad
matemática y no funcionan para todos los rangos de variación de X.
En resumen, se señalan cuatro desventajas de los GC: (i) no detectan eficientemente el tipo de
patrón presentado en X cuando hay evidencias de variación especial, (ii) El establecimiento de
los límites de control precisa de distribución normal de X, (iii) siempre es necesario calcular y
revisar los límites de control y (iv) requieren de la apreciación y juicio de personal experto.
Estas desventajas no se presentan en el uso de redes neuronales para el control estadístico de
procesos.
1.2 Control estadístico de procesos y RNA
En la revisión de la literatura se ha encontrado que diversos investigadores sugieren el uso de
redes neuronales como una manera de trabajar el CEP conociendo las desventajas en el uso de
las técnicas de control tradicionales (Zobel y Cook, 2004; Guh, 2002; Ho y Chang, 1999; Guh
y Tannock, 1999; Wani y Pham, 1999; Zorriassantine y Tannock, 1998; Cheng, 1997; Cheng,
1995; Hwarng y Chong, 1995). Una red neuronal consiste en un número de elementos (nodos)
1 Teorema del Límite Central.
2 Transformaciones estadísticas conocidas como Box Cox y Johnson.
17
fuertemente interconectados que tienen la habilidad de procesar información como resultado
de un proceso de trabajo dinámico de esos nodos y de conexiones a puntos externos a la red.
La importancia señalada en el uso de las redes neuronales se describe mediante sus principales
ventajas sobre las técnicas de control estadístico basadas en gráficos de control (Guh, 2005;
Zobel y Cook, 2004; Pacela, Semeraro y Anglania, 2004; Swift, 1987). Las ventajas
principales son:
a) Las redes neuronales empleadas con el fin del reconocimiento de patrones estadísticos
de los datos permiten fácilmente reconocer, en tiempo-real, distribuciones no
normales con rapidez y eficiencia elevadas, especialmente cuando la distribución
presenta sesgos (Guh, 2005).
b) El uso de las redes neuronales no requiere del supuesto de normalidad en los datos o
de la independencia de los mismos (Pacela, Semeraro y Anglania, 2004).
c) Las RNA han tenido aplicación diversa en el campo de la estadística, especialmente
cuando se requiere manejar una gran cantidad de datos en tiempo-real que presentan
cierta complejidad (Pacela y Semeraro, 2005).
Los GC no están diseñados para la detección de patrones, a diferencia de las RNA que hacen
esto de forma sistemática. La importancia de detectar patrones en X es que estos se relacionan
directamente con la VE y la VN y no requieren el uso de reglas ni del juicio humano.
Las RNA se pueden entrenar para identificar y clasificar a un grupo de datos muestrales
tomados de la línea de producción, en patrones típicos de VE y VN, con lo que se puede en
consecuencia, diagnosticar si un proceso de manufactura opera dentro o fuera de control
estadístico. Algunos antecedentes de uso estadístico de las RNA:
a) Ripley (1994), propone una comparación entre los métodos estadísticos y las RNA
para la clasificación de patrones.
18
b) Hwang y Ding (1997) y De Veaux (1998), consideraron el problema de la
construcción de intervalos de confianza mediante RNA.
c) La aplicación de las RNA puede clasificarse en dos categorías (Pacela y Semeraro,
2005): (i) Reconocimiento de patrones y (ii) Detección de patrones no naturales. La
primera categoría provee mecanismos para identificar diferentes tipos de patrones
comunes en tiempo-real y la segunda categoría proporciona información básica
para identificar las causas de generación de patrones no naturales en los procesos
de manufactura. Estudios de este tipo fueron hechos por Hwarng y Hubele (1993),
Hwarng y Chong (1995), Cheng (1995, 1997), Chang y Aw (1996), Cook y Chiu
(1998), Guh y Hsieh (1999), Guh y Tannock (1999), Chang y Ho (1999) y Perry
(2001).
1.3 Contribución original
Esta tesis trata sobre la propuesta de un método novedoso de control estadístico de procesos
automatizados de manufactura. Dicho método es alterno a los gráficos de control de
mediciones individuales, de medias y rangos y de la fracción disconforme, mejorando sus
condiciones de aplicación.
Durante el desarrollo del modelo, se recurrió al diseño de experimentos aplicado a la red
neuronal FuzzyARTMAP, lo cual, en el mejor entendimiento del autor, no se tiene
precedentes en estudios previos. Con esto, se contribuye también a la generación de
conocimiento sobre la forma estadística en que funcionan los parámetros de la red neuronal
referida; lo cual, también es poco conocido.
En resumen, con el método propuesto se tienen las siguientes ventajas:
1. Los parámetros de la RNA se determinaron a través de Diseño
Experimental para maximizar la eficiencia.
19
2. Los parámetros de la RNA son seleccionados de acuerdo a la forma de la
distribución de probabilidad.
3. El método no requiere de normalidad en la distribución de los datos.
4. No se requiere tamaño grande de la muestra para garantizar que exista una
distribución normal como en el caso de los GC.
5. El modelo desarrollado refina su conocimiento a través de datos del
proceso de manufactura.
Finalmente, el método propuesto se probó con datos simulados y con datos reales de
producción, identificando los tipos de patrones de variación y estados de control del proceso,
cuyos resultados se compararon favorablemente en relación a los gráficos de control lo que
valida la metodología propuesta.
1.4 Organización de la tesis
Este trabajo se organizó en siete capítulos seguidos del resumen. La descripción general de
esta tesis se explica a continuación: En el resumen se expresa un panorama general de la tesis,
con algunos antecedentes del control estadístico de procesos importantes para el seguimiento
de este trabajo. En el capítulo 1, introducción, se informa al lector sobre los tipos de variación
existentes en los datos tomados de un proceso de manufactura y la importancia de la simetría
en su distribución de probabilidad para establecer el control estadístico de procesos
tradicional; finalmente, se introduce el tema de las redes neuronales y su relevancia en el
enfoque de control estadístico de procesos establecido en esta tesis. El capítulo 2, define el
tema de investigación estableciendo la hipótesis de trabajo. En el capítulo 3, la justificación y
los objetivos son mostrados, como consecuencia del establecimiento del tema de
investigación. El capítulo 4 trata sobre la fundamentación de esta investigación en los temas
20
de la red neuronal FuzzyARTMAP, en investigaciones recientes relacionadas con el
reconocimiento de patrones y se termina con el establecimiento de los patrones de variación
estudiados. En el capítulo 5 se muestra el procedimiento de investigación empleado y los
resultados experimentales obtenidos, para abordar el capítulo 6, donde se colocó el método y
algoritmo resultantes de esta investigación. Se termina con el capítulo 7 donde se escriben las
conclusiones. Finalmente, los anexos del trabajo contienen las bases del desarrollo
experimental, el análisis estadístico y las publicaciones desarrolladas.
21
Capítulo 2
DEFINICIÓN DEL TEMA
La definición del tema se expresa como la hipótesis de la investigación y delimitación de la
misma, mostradas a continuación.
2.1. Hipótesis de investigación.
Mediante la identificación oportuna del patrón de variación que sigue una variable aleatoria
de un proceso de manufactura, se puede elaborar un diagnóstico objetivo sobre el estado de
control del proceso de fabricación, teniendo así, facilidad en la identificación de causas de
variación naturales y especiales que afecten al proceso de fabricación, sin recurrir al uso de
medios gráficos que asumen normalidad.
2.2. Alcance de la investigación.
El alcance de la investigación comprende la clasificación de patrones presentados en los
gráficos de control, mediante redes neuronales. Básicamente, este trabajo separa a los
patrones en cuestión en dos grupos: los que denotan control estadístico del proceso y los que
indican estados fuera de control. Se señala entonces que la finalidad es identificar estados de
control mediante la identificación del tipo de patrón que se esté presentando en los datos
monitoreados en el proceso de manufactura, sin gráficos ni límites de control.
La investigación incluye el análisis de una variable aleatoria de calidad aplicable a los gráficos
de control de mediciones individuales, de medias y rangos y de la fracción de disconformes.
22
Capítulo 3
JUSTIFICACIÓN Y OBJETIVOS
3.1. Justificación.
De forma general, la justificación de la presente tesis se explica por las limitaciones de los GC
tradicionales para responder a las condiciones tecnológicas actuales de los sistemas de
manufactura, las que han cambiado en el tiempo debido a la evolución de la interacción entre
el sistema de manufactura automatizado y el tipo de requerimiento de trabajo de la gente, que
es ahora más intelectual que antes y menos físico. Por tanto, la presente investigación está
justificada desde los enfoques científico y tecnológico, al ofrecer un proceso sistemático para
el aseguramiento de la calidad de procesos de manufactura automatizados, alterno a los GC
tradicionales.
De forma puntual, esta tesis se justifica por lo siguientes motivos:
a) Los GC asumen normalidad en la variable aleatoria y existen casos donde dicha
variable no se comporta simétricamente. Asegurar una distribución normal, cuando no
se tiene, requiere de incrementos en costo por inspección y muestreo.
b) Los GC no están diseñados para detectar patrones de variación, debiendo recurrir al
criterio humano para tal fin.
c) Cambio de enfoque: es más eficiente determinar patrones de variación que señales de
variación especial.
23
3.2. Objetivos.
El objetivo general es:
Diseñar un proceso sistemático para el control estadístico de procesos de manufactura
automatizados, a través del reconocimiento de patrones de variación naturales y especiales,
que no esté basado en el establecimiento de límites de control y que de forma objetiva
diagnostique el estado de control del proceso.
Y los específicos son:
a) Mejorar las condiciones de los trabajos similares en cuanto a la eficiencia de
funcionamiento en la predicción de patrones o en la facilidad de aplicación en procesos en
línea.
b) Evitar el requerimiento de la apreciación humana en el establecimiento de estados de
control de procesos.
c) Obtener un algoritmo robusto probado de forma experimental y aplicada.
24
Capítulo 4
FUNDAMENTACIÓN
En el presente capítulo se introduce el concepto de Red Neuronal Biológica, así como su
modelo conocido como Red Neuronal Artificial (RNA). Se explica de forma cualitativa el
funcionamiento de las mismas y se presentan dos de las arquitecturas empleadas en el trabajo
relacionado a esta tesis como son la red de Retropropagación empleada por Guh (2005) y la
Red FuzzyARTMAP empleada por Hindi (2004) y se definen ampliamente los patrones a
utilizar y el método de simulación empleado para la generación de los mismos.
4.1. Redes Neuronales Artificiales (RNA’s).
Las Redes Neuronales Artificiales (RNA’s) son métodos computacionales para la
representación del conocimiento y el procesamiento de información. Como su nombre
implica, las redes neuronales artificiales están inspiradas por la arquitectura neuronal biológica
y la operación del cerebro humano. Debido a su estructura, las redes neuronales tienen
algunas capacidades únicas en el procesamiento de información. Tales capacidades están
demostrando que las redes neuronales son muy útiles en una amplia gama de aplicaciones de
ingeniería.
Las neuronas biológicas están conectadas con otras neuronas vía redes neuronales, grupos de
enlaces organizados de comunicación entre células. Las conexiones entre neuronas permiten
el flujo de información a través de grandes distancias por todo el cuerpo gracias a las dendritas
y axones como se muestra en la figura 4.1. Las conexiones axónicas están determinadas
genéticamente, mientras que las conexiones dendríticas son generadas mediante el
aprendizaje. Pero las redes neuronales hacen algo más: permiten al sistema nervioso
modificar, filtrar y cernir información que viaja hacia y desde el cerebro.
25
Figura 4.1. Red Neuronal Biológica
Un grupo de unidades de procesamiento que replican las operaciones básicas de las neuronas
reales es el encargado de procesar tales funciones. A medida que las redes neuronales
aprenden o son entrenadas, un conjunto de pesos de las conexiones entre las unidades de
procesamiento es modificado basado en las relaciones percibidas entre los datos.
Los problemas que las redes neuronales pueden resolver están categorizados en cuatro tipos:
Clasificación.
Son aquéllos cuya meta es etiquetar cada patrón de entrada como miembro de cierta clase. Un
ejemplo simple de un problema de clasificación es cuando una red neuronal tiene como
propósito etiquetar a una persona como hombre o mujer (las dos clases) basado en su estatura
y peso. La entrada para la red neuronal sería los datos de altura y peso, mientras que la salida
deseada sería el sexo.
Aproximación de funciones.
Son aquéllos cuyo objetivo es determinar un valor numérico dado un conjunto de entradas.
Éste es similar al problema de clasificación, excepto porque la salida es numérica. Un
ejemplo sería determinar el factor viento (la salida deseada) dadas la temperatura, la humedad
y la velocidad del viento (las entradas). En estos problemas, la red neuronal intentará
aproximar la relación funcional entre la entrada y la salida deseada.
26
Predicción.
Son aquéllos cuya meta es determinar una salida futura dado un conjunto de entradas y la
historia pasada de las entradas. La principal diferencia entre los problemas de predicción y los
anteriores es que los problemas de predicción usan la entrada actual y las entradas previas (la
historia temporal de la entrada) para determinar un valor de salida futuro. Un caso típico es
emplear el historial del precio de cierre de unas acciones como entrada (por ejemplo los
precios de hoy y de los tres días anteriores) para tratar de predecir el precio de cierre de
mañana.
Agrupamiento.
Son aquéllos en los cuales es deseado que la red neuronal extraiga información sólo de los
datos de entrada para conocer el número de grupos significativamente distintos que existan.
4.2 Breve historia
Propiamente, fue a partir de los años 40 que dio inicio la investigación científica de las redes
neuronales artificiales. No obstante, hasta mediados de los años 80, el progreso realizado en
este dominio era frenado por el costo elevado de las computadoras capaces de ejecutar los
algoritmos correspondientes. En efecto, tales algoritmos necesitan una gran capacidad de
cálculo; por consecuencia, demandan recursos de hardware importantes, tanto en la fase de
concepción como de utilización de la red. Desde entonces, gracias a la construcción de
computadoras poderosas ha sido posible remediar los problemas de velocidad y de recursos
anteriormente impuestos. Esto produjo un mayor interés en la investigación y aplicación de
las redes neuronales, debido probablemente a que conjugan múltiples disciplinas y hacen uso
de ideas y técnicas novedosas entre distintos dominios de la ciencia: física estadística, análisis
funcional, estadística, teoría de sistemas dinámicos, entre otros. Sobre todo, los esfuerzos
conjugados de la biología y las ciencias cognitivas.
Existen en la actualidad una innumerable cantidad de arquitecturas de RNA clasificadas por
tres criterios principales:
27
Forma de aprendizaje
Supervisado (requiere entrenamiento previo)
No supervisado (empleado en problemas de clasificación)
Aprendizaje reforzado (aprendizaje basado en una función objetivo)
Arquitectura
Una capa
Múltiples capas
Recurrente (con/sin retroalimentación en la salida/capa escondida)
Tipo de aprendizaje
Se refiere a la forma en que se actualizan los pesos de la RNA y pueden ser:
Corrección de error
Basado en memoria
Hebbiano
Competitivo
Boltzman
De los tipos de aprendizaje, quizás el más conocido es el tipo por corrección de error que
consiste en actualizar los pesos en cada iteración hasta que la diferencia de la salida de la red
neuronal y la salida deseada sean menores a un valor predeterminado. Este tipo de aprendizaje
es empleado por la red de retropropagación.
28
4.3 Retropropagación (perceptrón multicapa)
Esta red es conocida también como perceptrón multicapa. De acuerdo a la figura 4.2, los
círculos representan las neuronas de procesamiento y las flechas los canales de flujo de
información entre las neuronas, denominadas interconexiones. Los rectángulos representan
únicamente el almacenamiento de los datos de entrada a la red. Cada neurona de
procesamiento posee una cantidad limitada de memoria y realiza un cálculo local que
transforma las entradas en salidas. El cálculo se denomina función de activación o función de
transferencia de la neurona. Estas funciones pueden ser lineales o no, y pueden ser ecuaciones
algebraicas o diferenciales. El concepto de retropropagación se refiere al tipo de aprendizaje
empleado, lo que origina el nombre de esta red.
Figura 4.2. Representación de una red neuronal (perceptrón)
Este tipo de aprendizaje tiene algunas particularidades que lo distinguen de un problema
convencional de optimización. Si se dispone de una muestra de M pares de valores X y Y, de
entrada y salida, respectivamente, estos datos deben ser presentados de forma secuencial a la
Entradas
Capa de Entrada
Salidas
Capa de Salida
Capa Escondida
X
Y
V kl
W ij
29
red, calculándose una actualización de los coeficientes de peso de las interconexiones (Wij,
Vkl) para cada par de datos, hasta agotarlos. Es muy frecuente que un solo ciclo o época no
sea suficiente para lograr un valor aceptablemente pequeño del error para todos los pares de
datos, entonces es necesario reciclarlos (iniciar una nueva época). Dependiendo del tamaño de
la muestra de entrenamiento, serán las épocas requeridas, pudiendo ser éstas desde unas
decenas, hasta cientos o miles.
El método de retropropagación, basado en el algoritmo del descenso más rápido tiene la virtud
de ser simple, sin embargo, en algunos casos puede resultar demasiado lento. Además, no
siempre se garantiza la convergencia a un mínimo absoluto, es decir, puede quedar atrapado en
un mínimo local.
4.4 FuzzyARTMAP
La arquitectura FuzzyARTMAP (Carpenter et al, 1992) es una red neuronal artificial
perteneciente a la familia de ART (Adaptive Resonance Theory). Esta teoría fue desarrollada
por Grossberg y Carpenter en la Universidad de Boston. FuzzyARTMAP puede efectuar
aprendizaje supervisado. Esta red neuronal crea varias neuronas de acuerdo al número de
patrones presentados en su entrenamiento y a las diferencias entre ellos. Está basada en las
siguientes características. Ver figura 4.3. Esta red tiene dos módulos Fuzzy ART, uno para
manejar las entradas y el segundo para las salidas (ARTa y ARTb). También tiene un campo de
correspondencia (Map Field) Fab que liga las clases de entrada con las de salida.
Figura. 4.3. Arquitectura FuzzyARTMAP
A = (a,ac)
a
xa
ya
F1a
F2a
i wa
ARTa
reset
b
xb
yb
i
ARTb
reset
Xab
j
wab
match tracking
ab
a b
wb
F2b
F1b
F0a F0
b B = (b,bc)
map field
Fab
30
La forma de operación de un módulo básico (ARTa ó ARTb) es como un módulo básico ART
como se ilustra en la figura 4.4. Dicho módulo consta de 2 subsistemas, atención y
orientación. El primer subsistema tiene dos capas de nodos hacia arriba, F1 y F2. Así, la
información de salida del elemento de procesamiento reverbera hacia atrás y hacia delante
entre las dos capas. Si una resonancia estable toma lugar entonces puede ocurrir aprendizaje o
adaptación. El subsistema de orientación reinicia el subsistema de atención cuando ocurre un
evento no común. Si el patrón de entrada no es reconocido inmediatamente entonces la red
entrará a un estado de resonancia, después de lo cual un nuevo patrón es almacenado por
primera vez. De este modo la red responde rápidamente a datos aprendidos previamente.
Atención Orientación
Figura 4.4. Arquitectura básica ART
El parámetro de vigilancia de la red () mide la diferencia permitida entre los datos de entrada
y los patrones almacenados. Por tanto, este parámetro es el determinante para afectar a la
selectividad o granularidad de la predicción de la red. El parámetro referido tiene 3 factores:
vigilancia en el módulo de entrada (a), vigilancia en el módulo de salida (b1,2) y vigilancia
del campo de mapeo (ab).
Para una mejor comprensión del escrito, los detalles del algoritmo empleado para la
implementación de la arquitectura FuzzyARTMAP se presentan en el Anexo G.
Patrón de entrada
Control de ganancia
STM F1
STM F2
LTM +
+ + -
+ STM reset wave
A
31
4.4.1 Parámetros de la FuzzyARTMAP y nomenclatura.
En esta tesis se usarán los parámetros de la red neuronal FuzzyARTMAP y nomenclatura
siguientes: Vigilancia en el módulo de entrada (ρa), Vigilancia del campo de mapeo (ρab),
Razón de aprendizaje (β), y Vigilancia en el módulo de salida (ρb1,2). Cuando se empleen los
subíndices 1 y 2 en cada parámetro, significan las etapas de entrenamiento (1) y prueba (2).
4.5. Investigaciones recientes.
En esta sección se describen las investigaciones más recientes localizadas en la revisión de la
literatura, que están cercanamente relacionadas con el tema de estas tesis, mismas que a su
vez, son la base de la formulación de este estudio.
4.5.1. Reconocimiento del patrón natural mediante redes neuronales.
Se han hecho diversas investigaciones sobre el establecimiento de los estados de control del
proceso, a partir del patrón natural cuando los datos X muestran cambios en sus parámetros
importantes, concluyendo que las redes neuronales pueden imitar a los GC. Guo y Dooley
(1992) usaron la red neuronal backpropagation en combinación con los gráficos de la suma
acumulativa. Smith (1994) usó arquitecturas diferentes de redes neuronales para igualar el
desempeño de los GC. Stützle (1995) también usó la red neuronal backpropagation para
probarla en la identificación de cambios en los patrones naturales observados.
Hindi (2004), usó la red neuronal FuzzyARTMAP para el propósito descrito. En su
investigación probó dicha red neuronal para determinar el tipo de cambio presentado en los
parámetros del proceso, la media (µ) y la desviación estándar (σ), por separado y de forma
simultánea. Compara estos resultados con los obtenidos por la aplicación de los gráficos de
control para la media y rangos, esto es, Rx . Utilizó 8,000 vectores con 10 valores de X, para
cuatro casos de valores de μ y σ, dejando 6,000 para entrenamiento y 2,000 para prueba. Usó
los valores 0 y 3 para μ y 1 y 3 para σ, considerando la combinación μ = 0 y σ = 1 para
representar un estado de control estadístico del proceso. Hizo esta experimentación a valores
32
fijos de la red neuronal, basado en resultados de investigaciones previas de otros autores. Los
parámetros y valores empleados fueron: Razón de aprendizaje (β) y vigilancia en el módulo de
entrada (ρa), a los valores 1 y 0.8, respectivamente. No especifica valores para los parámetros
de ρab y ρb1,2, basado en la afirmación de Carpenter y Grossberg (1992) de que a un
aprendizaje rápido de la red neuronal, éstos dos parámetros pueden tomar cualquier valor entre
0 y 1 sin afectar a los resultados. Sus resultados se muestran en la tabla 4.1.
Tabla 4.1. Resumen de resultados de investigaciones previas en la clasificación del patrón
natural a valores diferentes de µ y σ Hindi (2004)
µ σ TIPO DE
DISTRIBUCIÓN
RED
NEURO-
NAL
PARÁMETROS
CONSIDERADOS
CLASIFICACIÓN
CORRECTA
DE LAS
MUESTRAS
EFICIENCIA
0 1
Normal Fuzzy
ARTMAP
β = 1.0
ρa = 0.8
490 98.0%
3 1 478 95.6%
0 3 441 88.2%
3 3 449 89.8%
4.5.2. Reconocimiento de patrones natural y especiales mediante redes neuronales.
En la investigación realizada por Guh (2005) se propone el uso de la red neuronal denominada
Backpropagation (BPN) en combinación con un árbol de decisión que en conjunto, se
incluyen en un proceso para el reconocimiento de patrones estadísticos de los datos en tiempo-
real. Guh estudió los patrones de variación denominados: natural, cambio superior de la
media, cambio inferior de la media, tendencia creciente, tendencia decreciente, mezcla, ciclos
y sistemático. Desarrolló un sistema híbrido para el reconocimiento de estos patrones, el cual
se muestra en el esquema de bloques de la figura 4.5.
33
Figura 4.5. Arquitectura del sistema híbrido para el reconocimiento de patrones3.
La figura 4.5 hace referencia a tres módulos, llamados A, B y C. El módulo A consiste en
preparar los datos X para que puedan ser procesados por la RNA4. El módulo B funciona de
forma general como los GC y detecta casos anormales de variación. Este módulo clasifica a la
serie de datos en uno de cuatro grupos de patrones: (i) Natural, (ii) Cambio de la media
(Superior o Inferior) y Tendencia (Creciente o Decreciente), (iii). Cíclico y (iv). Sistemático y
Mezcla. Después, si el conjunto de datos X se clasifica como patrón especial (casos ii, iii y iv),
entonces éste es procesado por el módulo C.
3 Tomado de Guh (2005).
4 Estandarizado y codificado de X. Estandarizado para convertir la serie de datos a valores con µ = 0 y σ = 1.
Codificado para transformar a los datos estandarizados a una serie comprendida entre 0 y 1.
Proceso de manufactura
Introducción de los datos
de la muestra en la ventana
de reconocimiento
Módulo A
(pre procesado de los datos
para la extracción de
rasgos)
Módulo B
(Clasificación gruesa:
RNA )
¿Cómo es
el patron?
Natural
Especial
Módulo C
(Clasificación fina:
Árbol de decisión)
Fin
34
Esta investigación consideró, para cada patrón especial de 24 datos cada uno, una familia de
patrones formados a partir de pequeñas variaciones en estos. Todas las series de datos usadas
fueron generadas con el proceso de simulación de Monte Carlo, a partir de una variable
aleatoria con distribución normal y µ = 0 y σ = 1, pero, con variaciones en el tamaño del
efecto de patrón especial, lo que permitió tener subpatrones de cada patrón especial.
Finalmente, el módulo C, el árbol de decisión, es un algoritmo heurístico que describe la
forma en que se decide el tipo de patrón que tiene una serie de datos. Los resultados obtenidos
(sobre los patrones de variación considerados en esta tesis) se muestran en la tabla 4.2.
Tabla 4.2. Resumen de resultados de investigaciones previas en la clasificación del patrón
natural a valores diferentes de µ y σ Guh (2005)
PATRÓN RED NEURONAL EFICIENCIA
Sin módulo C Con módulo C
Cambio superior en µ
Backpropagation
95% 95%
Cambio inferior en µ 87% 95%
Tendencia creciente 0% 93%
Tendencia decreciente 1% 92%
Esta investigación demuestra que el uso combinado de la red neuronal con el árbol de
decisión, crea un sistema híbrido con altos niveles de eficiencia de la predicción de patrones
especiales. Este sistema de clasificación de patrones puede ser empleado como mapa para la
toma de decisiones en la identificación de estados de control del proceso. Tiene la
particularidad de simplificar y agilizar la aplicación computacional de las redes neuronales al
ofrecer rutas claras de acción y resalta el hecho de que este sistema puede ser computarizado y
adicionado al sistema de control del proceso industrial, para no hacer necesaria la intervención
del factor humano en la interpretación de gráficos ni en la toma de decisiones respecto al
patrón de comportamiento de la variable. Finalmente, este sistema híbrido tiene las siguientes
características:
a) Fue desarrollado para una gráfica de control del tipo Rx .
35
b) Los patrones típicos que pueden presentarse en una gráfica Rx son de 6 a 8.
c) Sólo se puede tratar una característica de calidad.
d) Las causas comunes de variación permanecen constantes.
e) No elimina el uso del gráfico de control Rx .
f) No considera variaciones del patrón natural, solo de los especiales.
g) Pone de manifiesto la necesidad de combinar la red neuronal con un algoritmo de
decisión.
4.6. Bases estadísticas de las redes neuronales.
En esta sección se presentan algunas afirmaciones hechas por investigadores que han
estudiado la clasificación de patrones naturales y especiales mediante el uso de redes
neuronales. Se presenta la información en forma de lista.
a) Un proceso de manufactura adopta un estado de “fuera de control estadístico” a partir
del momento en que uno o más de sus parámetros han cambiado de valor (Evans y
Lindsay, 1993).
b) El tamaño del vector de los datos de prueba afecta a la operación de la RNA. Un
mayor tamaño del vector reduce los valores de los errores tipo I y tipo II (Pacela y
Semeraro, 2005).
c) El valor del parámetro de vigilancia ρ afecta al error tipo II; un valor alto en ρ genera
un valor bajo en éste (Pacela y Semeraro, 2005).
d) El tamaño del vector de los datos influye significativamente en el desempeño de la red
neuronal. Un tamaño pequeño detecta patrones especiales más rápidamente que un
tamaño grande y puede producir un nivel bajo del error tipo I (Guh, 2005).
e) El tamaño del vector de los datos influye en la eficiencia de la RNA. Un tamaño
grande puede reducir la eficiencia porque incrementa el tiempo requerido para la
36
clasificación de los patrones. El tamaño apropiado genera un balance adecuado entre
los errores tipo I y II (Guh, 2005).
4.7. Tipos de patrones especiales.
Gutiérrez y de la Vara (2004) señalan 5 patrones especiales de variación de los datos, que son
comúnmente observados en los GC. Estos son:
a) Desplazamientos o cambios en el nivel del proceso. Tiene dos formas: desplazamiento
superior del nivel del proceso y desplazamiento inferior del nivel del proceso. Los
criterios de su detección son:
i. Un punto fuera de los límites de control.
ii. Tendencia clara y larga de los puntos5, a que caigan de un solo lado
(superior o inferior) de la línea central.
b) Tendencias en el nivel del proceso. Tiene dos formas: tendencia creciente y tendencia
decreciente. Los criterios de su detección son:
i. Seis o más puntos consecutivos ascendentes o descendentes.
ii. Un movimiento muy largo en tendencia, aunque no de puntos
consecutivos.
c) Ciclos recurrentes (periodicidad). La forma de su detección es por observación de
series de puntos consecutivos con tendencia creciente seguidos de otra serie con
tendencia decreciente.
d) Mucha variabilidad. La forma de su detección es como sigue:
5 Al menos 8 puntos.
37
i. Ocho puntos consecutivos en ambos lados de la línea central, pero
ninguno cercano a la línea central.
ii. Por apreciación de ciclos.
e) Falta de variabilidad (estratificación). La forma de su detección es como sigue:
i. Quince puntos consecutivos concentrados en la línea central.
ii. Por apreciación.
De estos patrones especiales se consideraron los dos primeros en esta tesis. La razón de esto,
es que en la población de datos bajo estudio, tomados de los procesos de producción de las
empresas estudiadas, solo se presentaron dichos casos de patrones de variación. Además de lo
anterior, bien se podría demostrar que los patrones no considerados pueden ser determinados
por lo que si lo fueron, por ejemplo, un patrón cíclico podría detectarse mediante una
combinación alternada de los patrones de tendencia creciente y decreciente.
Ahora, se mostrará la composición y comportamiento de cada uno de estos 3 patrones, pero
antes, es necesario explicar el proceso de generación de datos por Simulación de Monte Carlo.
4.7.1. Simulación de X por Monte Carlo.
Todos los datos de la variable aleatoria X que describen los patrones indicados, son series de
tiempo, o series de datos ordenadas en el tiempo. A un conjunto de “n” datos Xt, para
t=1,2,3,…n, se le denomina en esta tesis vector X, o simplemente X. Como se explicó
anteriormente, la variación total de X depende de dos tipos de variación, la natural y la
especial. En el proceso de simulación de datos por Monte Carlo empleado en esta tesis, la
primera variación se le representa por “nt” donde t=1,2,3,…n y para la segunda variación se
emplea el término “dt”, para t=1,2,3,…n. Ahora bien, cada valor Xt está compuesto por estas
dos variaciones y por un efecto global, que es µ.
38
Entonces, cada valor de X tiene tres efectos: global, variación natural y variación especial, que
de acuerdo a la nomenclatura indicada y a la generación de datos por simulación de Monte
Carlo se tiene la ecuación 26.
t t tX n d (2)
donde:
Xt : valor de la variable aleatoria en el momento t.
µ : efecto de la media global del proceso de manufactura.
nt : efecto de la variación natural del proceso de manufactura, en el momento t.
dt : efecto de la variación especial del proceso de manufactura en el momento t.
Cuando una serie de datos sugiere la presencia de un patrón de los considerados en esta tesis,
se debe entender que, para que el patrón sea natural, entonces dt → 0, y para los patrones
especiales, 0 < nt < dt. .
4.7.2. Patrón natural en estados de control y fuera de control estadístico.
Un patrón natural se presenta cuando el vector X tiene un comportamiento gráfico libre de
cualquiera de los otros patrones mencionados en la sección 4.7. Tipos de patrones especiales.
Esto implica que la gráfica de los n puntos de X tenga una forma “aleatoria”, tal como se
muestra en la figura 4.6.
Figura 4.6. Forma típica del patrón natural.
6 Tomado de Guh (2005)
39
Estadísticamente, el vector X que se comporte como este patrón, tendrá una distribución
normal con media µ y desviación estándar σ, lo que se representa como X~N(µ,σ), ver figura
4.7. Esta afirmación está basada en el análisis realizado a un grupo de 100 conjuntos de 20
datos cada uno con distribución normal con µ = 0 y σ = 1. Se tomaron vectores de tamaño 20,
ya que esto fue lo considerado en la presente investigación. Este tamaño de vector ofrece
mejores posibilidades de mantener bajos los errores tipo I y II de las pruebas de hipótesis
sobre el control del proceso de manufactura.
C15
Fre
qu
en
cy
3.01.50.0-1.5-3.0
20
15
10
5
0
Mean -0.1034
StDev 0.9391
N 30
Histogram of C15Normal
Figura 4.7. Forma típica de la distribución normal.
Debido a que X se define en función de los dos parámetros indicados, su posición (µ) y forma
(σ) pueden cambiar cuando dichos parámetros cambian de valor.
En un proceso de manufactura, mientras los valores de µ y σ se mantengan semejantes o
iguales a los valores deseados, entonces el proceso se mantendrá en control estadístico.
Cuando ocurre un cambio en cualquiera de los dos parámetros, o bien, en ambos, entonces se
suscita el estado fuera de control del proceso, el cual podría ser visto en los gráficos de
control7 o detectado mediante los criterios vistos en la sección 4.7. Tipos de patrones
especiales.
De manera general, se pueden exponer casos de combinaciones de µ y σ que sean distintos a
su valor original, como 0 y 1, respectivamente, que advierten sobre estados fuera de control
del proceso. Esto queda representado en la tabla 4.3. Los 4 casos indicados en esta tabla,
7 Se requiere habilidad y entrenamiento para observar esto.
40
representan estados tanto de estabilidad estadística del proceso (caso I) como de inestabilidad
(casos II, III y IV).
Tabla 4.3. Combinaciones de los parámetros de la distribución normal.
σ 3 Caso III Caso IV
1 Caso I Caso II
0 3
µ
Los valores referidos en la tabla 4.3 fueron seleccionados a partir del estudio de Hindi (2004)
Por último, para generar al vector X con este tipo de patrón, la ecuación 2 se modifica a:
Xt=+nt (3)
4.7.3. Patrón de cambio superior en la media.
Este patrón de X se explica como un cambio repentino y abrupto del valor de µ hacia otro
valor, superior, debido a la presencia de una causa de variación especial en el proceso de
manufactura. En este caso, se hace referencia a dos medias poblacionales, µ1 y µ2, a un punto
t donde ocurre dicho cambio y a la magnitud “d” del cambio de µ1 a µ2. El término dt de la
ecuación 2 se compone de dos factores, según se muestra en la ecuación 4.
dt = p(d) …………….(4)
donde:
p: parámetro que determina la posición t del cambio en X.
para i=1,…, n, asumiendo que el cambio se da en el tiempo t
𝑝 = 0, 𝑖 ≤ 𝑡1, 𝑖 > 0
d: magnitud del cambio de la media en unidades de desviación estándar.
41
Entonces, el vector X es una variable aleatoria que contiene dos poblaciones de datos, X1 y X2.
Así, X1~N(µ1,σ) cuando en un valor “t = p”, donde 0 < p < n, ocurre un cambio de magnitud
“d” en los valores sucesivos de X1 haciendo que se genere la población de datos de X2, donde
X2~N(µ2,σ) porque µ1 < µ2 , ver figura 4.8.
El patrón de cambio en la media es una unión de dos de los 4 casos mostrados en la tabla 4.3.
Se genera este patrón al relacionar a los casos I y II o bien, III y IV.
Figura 4.8. Elementos del patrón cambio superior de la media.
Al elaborar el histograma de X se observará la mezcla de dos poblaciones, a medida que d
crece. Considerando X~N(0,1) y d=0,1,3,4 y 7 se puede observar este fenómeno. Ver figura
4.9. A medida que d es más grande que 0, se puede demostrar que X:
a) Tiene distribución normal para los datos X1.
b) Tiene distribución normal para los datos X2.
c) No tiene distribución normal.
p p + 1
X2~N(µ2,σ)
X1~N(µ1,σ)
n
X
d
42
d HISTOGRAMA PATRÓN DISTRIBUCIÓN
0
Fre
qu
en
cia
0.640.560.480.400.32
20
15
10
5
0
100806040200
0.7
0.6
0.5
0.4
0.3
Normal
1
Fre
qu
en
cia
0.70.60.50.40.3
30
25
20
15
10
5
0
100806040200
0.8
0.7
0.6
0.5
0.4
0.3
Normal
3
Fre
qu
en
cia
0.90.80.70.60.50.4
20
15
10
5
0
100806040200
0.9
0.8
0.7
0.6
0.5
0.4
0.3
Normal
4
Fre
qu
en
cia
1.050.900.750.600.450.30
18
16
14
12
10
8
6
4
2
0
100806040200
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
No normal
7
Fre
qu
en
cia
1.21.00.80.60.40.2
18
16
14
12
10
8
6
4
2
0
100806040200
1.2
1.1
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
No normal
Figura 4.9. Mezcla de poblaciones normales del patrón cambio superior del nivel de la
media.
43
4.7.4. Patrón de cambio inferior en la media.
La explicación de este patrón es semejante a la del patrón de cambio superior, salvo que:
a. µ1 < µ2.
b. El término dt de la ecuación 2, que se compone de los factores indicados en la ecuación
4, es negativo.
La figura 4.10 muestra el patrón típico de cambio inferior en la media.
Figura 4.10. Patrón de cambio inferior en la media
4.7.5. Patrón de tendencia creciente.
Una representación general de este patrón se observa en la figura 4.11.
Figura 4.11. Patrón de tendencia creciente
Es evidente que los puntos de la figura 4.11 se pueden ajustar a una recta con pendiente
positiva. Así, se puede demostrar que para toda t, Xt < Xt+1. La magnitud de la diferencia
X1
X2
44
aritmética Xt+1- Xt está relacionada con la pendiente de la recta de ajuste. La pendiente de esta
recta es modelada por d en el proceso simulador de Monte Carlo en la ecuación 2. Cabe hacer
mención que para los valores de d considerados, X resultó tener distribución normal o
aproximadamente normal. Ver figura 4.12.
d HISTOGRAMA PATRÓN
0
Fre
qu
en
cia
0.640.560.480.400.32
30
25
20
15
10
5
0
100806040200
0.65
0.60
0.55
0.50
0.45
0.40
0.35
1
C2
Fre
qu
en
cia
2.42.11.81.51.20.90.60.3
8
7
6
5
4
3
2
1
0 302520151050
2.25
2.00
1.75
1.50
1.25
1.00
0.75
0.50
2
4.23.63.02.41.81.20.60.0
8
7
6
5
4
3
2
1
0
302520151050
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
3
6.44.83.21.6-0.0
7
6
5
4
3
2
1
0
302520151050
6
5
4
3
2
1
0
Figura 4.12. Asociación del patrón de tendencia creciente con la distribución de
probabilidad de X (d = 1, 2 y 3)
4.7.6. Patrón de tendencia decreciente.
En este patrón se presentan las mismas características explicadas en el patrón de tendencia
creciente, salvo que aquí, la pendiente es negativa porque se puede demostrar que Xt > Xt+1
para t=1,2,3,…,n. Una figura típica de este patrón se muestra en la figura 4.13.
45
Figura 4.13. Patrón de tendencia decreciente.
46
Capítulo 5
PROCEDIMIENTO EMPLEADO Y RESULTADOS
OBTENIDOS.
El procedimiento empleado en la elaboración de esta investigación se explica a continuación:
a) Determinación del valor de los parámetros de la RNA que maximicen su
eficiencia predictiva.
Especificación de los valores de µ y σ a considerar, para el patrón
natural, y de “d” para los patrones de cambio en la media y
tendencia.
Generación de vectores X por simulación de Monte Carlo, para
cada tipo de patrón considerado, mediante programa elaborado en
MATLAB®
.
Generación del programa de cómputo en MATLAB®
para la
codificación de los vectores X.
Verificación de la permanencia de las características estadísticas
de los datos no codificados en los datos codificados.
Aplicación del diseño de experimentos para determinar los valores
adecuados de los parámetros de la red neuronal en la clasificación
de los patrones.
b) Diseño y validación del algoritmo de reconocimiento de patrones.
47
Obtención del algoritmo que use las mejores combinaciones de los
parámetros de la red neuronal en la clasificación de patrones.
Prueba experimental del algoritmo, mediante vectores generados
por simulación, con patrones no especiales y especiales.
Prueba práctica del algoritmo con vectores de datos obtenidos de
procesos de manufactura.
c) Determinación del impacto del algoritmo contra otras teorías y principios de
control de calidad aplicables al caso.
d) Prueba del algoritmo en el caso de aplicación.
5.1. Especificación de los valores de µ y σ para el patrón natural.
Se consideraron 4 casos de patrones naturales, a partir de los 4 casos de la distribución de X,
mostrados en la sección 4.7.2. donde X ~N(µ,σ) para µ = 0 y 3 y σ = 1 y 3. Las
combinaciones (0,3), (3,1) y (3,3) generan vectores con patrón natural, pero con variación
especial.
5.2. Generación de vectores de datos del patrón natural.
Se empleo el proceso generador de variables aleatorias con distribución normal normrnd(µ,σ)
de MATLAB®
para obtener los vectores de datos de la variable aleatoria X, tanto para el
entrenamiento de la red neuronal como para la prueba en la fase experimental.
5.3. Codificación de los datos del patrón natural.
La gama posible de valores de X en los 4 casos mostrados en la sección 4.7.2 se cubre con el
intervalo [-9.0;+9.0]. Este intervalo fue transformado al intervalo permitido por la operación
48
de la red neuronal en los vectores de entrenamiento y prueba, el cual es [0;1]. A este proceso,
se le llama codificación de X. La codificación se hizo con el programa elaborado en
MATLAB®
para este fin y mostrado en el anexo A.
Un aspecto relevante en la codificación de X es el aseguramiento de que el proceso usado
permita conservar sus características estadísticas, tales como forma y posición. Para saber
esto, se hizo un estudio comparativo que condujo a la validación del método de codificación
usado. En este estudio (ver anexo B) se generaron 100 datos de X con µ = 0 y σ = 1 y
posteriormente fueron codificados con el programa mostrado en el anexo A. Se calcularon las
estadísticas descriptivas para cada conjunto de datos y también se elaboraron diversos gráficos
para observar si prevalece su estructura estadística. El análisis estadístico se realizó con
Minitab®
Statistical Software. La conclusión es que el codificador no modifica las propiedades
estadísticas de la muestra original. Los datos codificados se denominan en esta tesis Xc.
5.4. Entrenamiento de la FuzzyARTMAP para el patrón natural.
Los vectores Xc generados para la experimentación con la red neuronal a partir de los valores
de la media y la desviación estándar considerados en esta tesis, fueron asociados a un vector
binario en la etapa de entrenamiento de la red neuronal. Dicha asociación se muestra en la
tabla 5.1. Tanto para el entrenamiento como para la prueba de la RNA, el orden de los
vectores se colocó aleatoriamente para evitar sesgos posibles de clasificación. Por cada caso
(I, II, III y IV de la tabla 5.1) se obtuvieron 50 vectores de 20 datos. Por tanto, el
entrenamiento de la red neuronal consideró 4 x 50 = 200 vectores.
Tabla 5.1. Asociación binaria para entrenamiento de red neuronal.
CASO µ σ CÓDIGO BINARIO
I 0 1 1 0 0 0
II 3 1 0 1 0 0
III 0 3 0 0 1 0
IV 3 3 0 0 0 1
49
5.5. Prueba de la FuzzyARTMAP para el patrón natural.
La prueba experimental de la red neuronal se llevó a cabo considerando 100 vectores por caso,
con el comportamiento natural propio de las condiciones de µ y σ de cada familia. En total,
hubo 100 x 4 = 400 vectores de prueba de 20 elementos cada uno. El orden de colocación de
estos en la sección de prueba de la red neuronal fue también aleatorio.
5.6. Aplicación del Diseño Experimental para el patrón natural.
5.6.1. Diseño del experimento.
El diseño del experimento, así como el análisis del mismo, fueron hechos con Minitab®
Statistical Software. La tabla 5.2 muestra el resumen del diseño de este experimento. La tabla
5.3 contiene los resultados de la experimentación así como las corridas experimentales.
Tabla 5.2. Resumen del diseño experimental para el patrón natural.
CONCEPTO VALOR
Tipo de experimento 22 con 1 punto al centro
Número de factores 2
Número de réplicas 2
Número de corridas 9
Variables de respuesta Eficiencia de clasificación8
Nivel de significancia 0.05
FACTORES FIJOS NIVEL FIJO
Vigilancia en modulo de entrada 1 (a1) 0.2 Razón de aprendizaje 1 (β1) 1.0
Vigilancia en el modulo de entrada (a,2) 0.2
FACTORES DE VARIACIÓN NIVELES
(-) (+)
Vigilancia en el módulo de salida (b1,2) 0.5 0.9
Razón de aprendizaje 2 (β2) 0.5 1.0
8 Entendida como el número de vectores clasificados correctamente divido entre el número de vectores probados.
Esta tasa se expresa en porcentaje.
50
Como se puede observar en la tabla 5.2, existen factores indicados como 1 y 2 y hay en su
símbolo los subíndices 1 y 2. Se explica que esto se debe a la consideración del factor en los
momentos de entrenamiento y prueba de la red neuronal, indicando con 1 al entrenamiento y
con 2 a la prueba. Los factores del experimento, fijos y de prueba, así como los niveles de este
último, se determinaron después de hacer experimentación preliminar para ubicar al área de
factibilidad experimental. Este estudio se muestra en los anexos C y D.
Tabla 5.3. Listado de corridas experimentales para el patrón natural.
NÚMERO DE
CORRIDA
ORDEN DE
CORRIDA
FACTORES/NIVELES
SIGNOS INTERACCIÓN EFICIENCIA
(%) b1,2 β2 b1,2 x β2
1 6 0.5 (-) 0.5 (-) (+) 65.01
2 1 0.9 (+) 0.5 (-) (-) 95.01
3 3 0.5 (-) 1.0 (+) (-) 57.00
4 4 0.9 (+) 1.0 (+) (+) 95.01
5 2 0.5 (-) 0.5 (-) (+) 56.99
6 8 0.9 (+) 0.5 (-) (-) 96.00
7 9 0.5 (-) 1.0 (+) (-) 65.00
8 7 0.9 (+) 1.0 (+) (+) 96.05
9 5 0.7 (0) 0.75 (0) 95.00
De aquí se obtienen los análisis estadísticos siguientes.
5.6.2. Análisis de varianza para el experimento con el patrón natural.
El análisis de varianza correspondiente al experimento para el patrón natural se muestra en la
tabla 5.4. Para este análisis se plantearon las hipótesis siguientes:
a) Para los efectos principales.
H0: El efecto de los factores de variación en la eficiencia de la red neuronal en la
clasificación correcta de patrones no es significativo.
51
H1: El efecto de al menos un factor de variación en la eficiencia de la red neuronal en
la clasificación correcta de patrones es significativo.
b) Para el efecto de curvatura.
H0: El efecto de curvatura de los factores de variación en la eficiencia de la red
neuronal en la clasificación correcta de patrones no es significativo.
H1: El efecto de curvatura de al menos un factor de variación en la eficiencia de la red
neuronal en la clasificación correcta de patrones es significativo.
Tabla 5.4. Análisis de varianza para el patrón natural.
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADOS
MEDIOS F p
Efectos principales 2382.92 2 1191.46 73.11 0.001
Interacción 0.009 1 0.00 0.00 0.997
Curvatura 249.13 1 249.13 15.29 0.017
Error 65.19 4 16.30
Total 2697.24 8
De acuerdo a los resultados de la tabla 5.4, se deben rechazar las dos hipótesis nulas
planteadas, pues p = 0.001 < 0.05 para la evaluación de los efectos principales y p = 0.017 <
0.05 para el efecto de curvatura de al menos un factor de prueba. Por otro lado, en cuanto a
las interacciones, no se puede afirmar que existan de manera significativa. Con esta
información se sabe entonces:
a) Al menos existe un factor de variación que influye en la eficiencia de la red
neuronal.
b) Al menos existe un factor de variación con efecto de curvatura significativo.
c) No hay interacciones significativas entre los factores de variación.
9 Valor aproximado a 0 por el software empleado.
52
5.6.3. Determinación de efectos principales y de coeficientes.
De los dos factores de variación probados, solamente el factor ρb1,2 tiene influencia
importante en la eficiencia de la red neuronal. Su efecto es de 34.5175 unidades en la variable
de respuesta, al pasar del nivel 0.5 a 0.9. Por tanto, se tiene el siguiente modelo ajustado para
predecir la eficiencia de la red neuronal en la clasificación correcta del patrón natural “Y”,
para vectores de X con distribución aproximadamente normal con µ = 0, 3 y σ = 1, 3. Ver
tabla 5.5.
Tabla 5.5. Tabla de efectos principales y coeficientes del modelo experimental.
TÉRMINOS/
CONSTANTES
EFECTOS
PRINCIPALES COEFICIENTE t p
Constante ------ 17.9000 54.83 0.000
ρb1,2 34.5175 86.2000 12.09 0.000
β2 0.0125 -0.0625 0.00 0.997
Interacción 0.0125 0.1250 0.00 0.997
R2 = 97.58% R
2(ajustada) = 95.17%
De los datos de esta tabla se obtiene la ecuación de regresión de la eficiencia de la red
neuronal respecto al parámetro ρb1,2:
Y = 86.2(ρb1,2) + 17.9
5.6.4. Análisis gráfico del experimento sobre el patrón natural.
Análisis de efectos.
Las figuras 5.1 y 5.2, confirman la información obtenida en las secciones 5.6.2. y 5.6.3. La
figura 5.1 separa los efectos de los factores de variación en significativos y no significativos.
Se observa que el único efecto significativo es el del factor ρb1,2.
53
La figura 5.2, indica el tamaño de los efectos de los factores de prueba. Se observa que el
efecto del factor ρb1,2 tiene una pendiente positiva grande, de tal forma que su influencia en la
eficiencia de la red neuronal es importante, tal como se ha mencionado con la ANOVA y la
figura 5.1. Aunque esta información ya se había obtenido en la ANOVA y sus efectos
visualizados, con la figura 5.2 se aprecian dos aspectos fundamentales:
a) El efecto estadístico de curvatura.
b) La tasa de cambio de la eficiencia de la red neuronal al pasar de los niveles bajos
de los factores a los niveles altos.
La curvatura es significativa, tal cual se concluyó con la ANOVA. En el caso del factor ρb1,2,
se observa que la eficiencia de la red neuronal tiene dos momentos importantes. El primero,
cuando ρb1,2 se ubica en el valor 0.5, la eficiencia es 60%, aproximadamente; después, la
eficiencia es 95% (aproximadamente) cuando el valor del factor ρb1,2 se ubica en 0.9. En un
ajuste lineal, ello genera una pendiente de 17.5. Al pasar el factor mencionado del nivel 0.5 al
nivel 0.9, la pendiente es 0.75. Esto genera la conclusión de que este factor influye mucho en
la red neuronal en el intervalo [0.5;0.7] y poco en el intervalo [0.7;0.9]. Por tanto, para la
clasificación del patrón natural, puede colocarse el factor ρb1,2 a partir de 0.7
Efectos estandarizados
Po
rcie
nto
14121086420-2-4
99
95
90
80
70
60
50
40
30
20
10
5
1
A
Figura 5.1. Efectos significativos del experimento con el patrón natural.
ρb1,2
ρb1,2 x β2
β2
54
Re
sp
ue
sta
me
dia
0.900.700.50
100
90
80
70
60
1.000.750.50
VIGILANCE LEARN RATE 2
Figura 5.2. Magnitud de los efectos de los factores de variación del experimento con el
patrón natural.
Análisis de idoneidad.
La validez de las conclusiones obtenidas en las secciones anteriores está supeditada a que se
cumplan tres supuestos del análisis de varianza: independencia, varianzas constantes y
normalidad. Estos tres conceptos se revisaron. Se muestran a continuación las gráficas y
conclusiones.
a) Independencia.
Al graficar los residuales contra el orden de las corridas del experimento, se obtiene la figura
5.3. En ésta, se puede apreciar cierto patrón de tendencia ascendente, lo que podría indicar
violación al principio de la independencia de los residuales. Se hizo la prueba Durbin-Watson
para determinar si hay cualquier correlación significativa. Esta prueba se hizo con el software
STATGRAPHICS®
. Así, se obtuvo que el estadístico Durbin-Watson = 2.50153 (p=0.1182)
con autocorrelación Lag 1 = -0.305126, lo que indica que no hay indicios de correlación de
serie en los residuos, pues al ser p mayor a 0.05 se acepta la hipótesis de que no existe
correlación significativa a un nivel de significancia de 0.05.
β2 ρb1,2
55
Orden de corrida
Re
sid
ua
l
987654321
4
3
2
1
0
-1
-2
-3
-4
-5
Figura 5.3. Residuales contra orden de corrida experimental para el experimento con el
patrón natural
b) Varianzas constantes.
En este análisis se elaboraron dos gráficos. En la figura 5.4 se aprecia que no existe igualdad
de varianza entre los dos niveles del factor significativo, ρb1,2, debido a la poca dispersión de
los puntos en el nivel alto comparada con la observada en el nivel bajo. No obstante, esto no
representa un problema importante en los resultados obtenidos, pues es en el nivel alto (donde
hay poca dispersión) donde se debe colocar el nivel del factor referido para maximizar la
eficiencia de la red neuronal. Esto último se observa en la figura 5.5, donde se tiene poca
dispersión alrededor del valor 96.0 del valor ajustado de la eficiencia de la red neuronal.
VIGILANCIA EN EL MÓDULO DE SALIDA
Re
sid
ua
l
0.90.80.70.60.5
4
3
2
1
0
-1
-2
-3
-4
-5
Figura 5.4. Residuales contra el factor ρb1,2 del experimento con el patrón natural
56
Valor ajustadoR
esid
ua
l10090807060
4
3
2
1
0
-1
-2
-3
-4
-5
Figura 5.5. Residuales contra valores ajustados de la eficiencia de la red considerando el
factor ρb1,2 del experimento con el patrón natural.
c) Normalidad.
De la figura 5.6, se deduce que los residuales no presentan evidencia importante que haga
asumir anormalidad en su distribución, ya que los puntos tienden a ubicarse siguiendo la línea
recta.
Residual
Po
rcie
nto
7.55.02.50.0-2.5-5.0
99
95
90
80
70
60
50
40
30
20
10
5
1
Figura 5.6. Gráfica de probabilidad normal de los residuales del experimento con el
patrón natural
57
5.6.5. Optimización de la eficiencia de la red neuronal.
Con un análisis de optimización se obtuvo el valor de nivel del factor ρb1,2 que maximiza la
eficiencia de la red neuronal en la clasificación del patrón natural. Este análisis se hizo
considerando que:
a) El tipo de respuesta (eficiencia) es una variable del tipo “mayor es mejor”, ya que son
valores altos los deseables.
b) El valor mínimo deseado para la eficiencia fue colocado en el análisis de optimización
en 90.0 %
c) El valor meta para la eficiencia considerado fue 98.0 %
Con estos parámetros, se obtuvo que la eficiencia predicha máxima alcanzable es 95.53% con
un valor 0.9 del factor ρb1,2. El factor de deseabilidad máximo obtenido fue 0.691. La tabla
5.6 muestra estos resultados.
Tabla 5.6. Optimización de la eficiencia de la red neuronal en la clasificación del patrón
natural
FACTOR VALOR DEL NIVEL EFICIENCIA ESTIMADA
(%) DESEABILIDAD
ρb1,2 0.70 95.00 0.625
β2 0.75
ρb1,2 0.90 95.50 0.688
β2 0.50
ρb1,2 0.00 95.53 0.691
β2 1.00
ρb1,2 0.90 95.53 0.691
β2 1.00
58
5.6.6. Validación experimental.
Se hizo una corrida confirmatoria de resultados, colocando los valores de los parámetros de la
red neuronal como se muestra en la tabla 5.7.
Tabla 5.7. Valores de los parámetros de la red neuronal que maximizan su eficiencia.
FACTOR VALOR DEL NIVEL
a1 0.2
β1 1.0
ρa2 0.2
ρb1,2 0.9
β2 1.0
Para la corrida confirmatoria se generaron 2000 vectores de tamaño 20 cada uno y se
obtuvieron los resultados indicados en la tabla 5.8.
Tabla 5.8. Resultados de la prueba confirmatoria de resultados.
CASO EFICIENCIA
ESPERADA (%)
EFICIENCIA
OBTENIDA (%)
I
95.53
100.0
II 100.0
III 100.0
IV 93.30
De estos resultados se confirma que el experimento es válido y condujo a eficiencias de la red
neuronal superiores a las esperadas en los casos I a III. El caso IV obtuvo menor eficiencia
que la predicha, con un error de 95.53% − 93.3% = 2.23%
5.6.7. Comparación con otros estudios.
Los resultados del experimento realizado con la clasificación del patrón natural, fueron
comparados con el estudio de referencia realizado por Hindi (2004). La tabla 5.9 muestra sus
resultados y los de esta tesis.
59
Tabla 5.9. Comparación de los resultados de esta investigación con un estudio similar.
RESULTADOS (EFICIENCIA, %)
CASO HINDI (2004) ESTA INVESTIGACIÓN
I 98.0 100.0
II 95.6 100.0
III 88.2 100.0
IV 89.8 93.30
PROMEDIO 92.9 98.3
Los resultados de esta investigación mejoran los obtenidos en el estudio previo.
Con esto concluye el experimento y los resultados sobre el patrón natural.
5.7. Especificación de los valores del efecto de variación especial.
Como se ha explicado, el valor del término “d” de la ecuación 2 es determinante en el tamaño
del efecto de la causa especial modelada por simulación de Monte Carlo. A diferencia del
patrón natural en estado de control, donde d → 0, en los patrones no naturales o bien, en el
natural, pero en estado fuera de control, d > 0. Ahora bien, como se ha explicado, todo vector
X con patrón natural tendrá distribución de probabilidad normal, lo que no se espera para los
patrones especiales. Esto es verdadero en ciertas condiciones y en ciertos patrones especiales,
ya que solo a partir del momento en que d > “a”, donde “a” es significativamente mayor que
0, se presenta anormalidad en X. Entonces, para d > a se espera que el patrón sea no natural y
adopte la característica de especial. Ahora bien, dentro del patrón natural, donde d → 0 pero n
crece, al grado de que la distribución de X sea normal pero tenga un patrón asociado a una
causa especial, se tiene un patrón natural en estado fuera de control estadístico. Por esta
razón, la selección adecuada de los valores de d es fundamental para ayudar a la predicción de
la red neuronal a tener menor error de predicción.
60
5.7.1. Cambio superior e inferior en el nivel de la media.
Se seleccionó un conjunto de 5 valores para el factor d de la ecuación 2. Para cada uno de
estos, se obtuvo una serie de 100 datos de X con µ = 0 y σ = 1 mediante simulación de Monte
Carlo de acuerdo a la ecuación 2 y se analizaron para determinar si las series tienen o no una
distribución normal usando la prueba de Anderson-Darling, tomando como referencia el valor
del estadístico “p”10
. Los resultados se muestran en la tabla 5.10.
Tabla 5.10. Tipo de distribución del vector X a distintos valores de “d”
d 1.0 2.0 2.5 3.0 4.0
p >0.05 >0.05 >0.05 <0.05 <0.05
DISTRIBUCIÓN normal normal normal no normal no normal
Estos resultados revelan hallazgos importantes al compararlos con los obtenidos en un estudio
experimental mostrado en el anexo E donde se observa que la red neuronal comienza a ser
eficiente en su predicción de este patrón a partir de d = 2.5. De este modo, para el patrón de
cambio en la media, a = 2.5
5.7.2. Tendencia creciente y decreciente.
A diferencia del patrón de cambio en la media, el patrón de tendencia creciente presenta una
característica específica: La distribución de X será siempre normal, sin importar la magnitud
de d, considerando d < 5 y un tamaño de vector de X menor a 30. Para obtener esta
conclusión, se probaron 50 vectores X, de tamaños 10, 20 y 30, a los valores d = 1, 2, 3, 4 y 5.
En el 100% de los casos, se aceptó la hipótesis de normalidad en X bajo la prueba de
Anderson-Darling.
10
Si p≤ 0.05 se rechaza la hipótesis de que los datos tienen distribución normal.
61
Esto podría confundir a la red neuronal, al clasificar este tipo de patrón como natural ya que
ambos patrones tienen distribución normal. La variable aleatoria X que sigue este patrón
(tendencia) está en función dos elementos, que son, la pendiente (d) y el tamaño del vector (n).
Su relación con la pérdida de control estadístico del proceso es directamente proporcional, de
tal forma que la rapidez con la que un valor X de un vector este fuera de los límites de control
del proceso depende de la magnitud de la pendiente y del número de datos considerados
(asociando cada dato a un periodo t). A valores mayores de pendiente y tamaño del vector,
mayor rapidez para tener valores de X fuera de los límites de control y viceversa. En esta
investigación, se consideró un tamaño de vector igual a 20 datos. Por esta razón, al ser “n”
constante, d es variable única.
Los límites de advertencia y de control aquí considerados son, respectivamente: (i) µ±2σ y
(ii) µ ±3σ. De este modo, como σ = 1 y µ = 0, se tiene que dichos límites son (i) -2 y +2 y
(ii) -3 y +3. Cuando el proceso se encuentra en control estadístico, se espera que µ = 0. A
partir de este valor, hay una amplitud permisible de variación de (i) ±2 y (ii) ± 3. Al dividir
esta amplitud entre el tamaño del vector, se tiene la magnitud asociada de “d”. De este modo,
con n = 20, se tiene que con (i) d = 2/20 = 0.1 y (ii) d = 3/20 = 0.15, con lo que se estarían
considerando casos de patrones con cercanía a los limites de advertencia (i) y control (ii) en
un patrón de tendencia.
5.8. Generación de vectores de datos de patrones especiales.
Se empleó el proceso generador de variables aleatorias por simulación de Monte Carlo,
descrito en secciones anteriores usando MATLAB®
.
5.9. Codificación de los datos de los patrones especiales.
La codificación se hizo con el programa elaborado en MATLAB®
para este fin y mostrado en
el anexo A.
62
5.10. Entrenamiento de la FuzzyARTMAP para los patrones especiales.
Los vectores X generados para la experimentación con la red neuronal para los patrones
especiales de variación, a partir de X~N(0,1), afectándolos por los valores de d de cada tipo de
patrón especial, fueron asociados a un vector binario en la etapa de entrenamiento de la red
neuronal. Esto se muestra en la tabla 5.11. Cabe hacer mención que el orden de colocación de
los vectores fue aleatorio para evitar sesgos posibles de clasificación. Por cada patrón a cada
valor específico de d se obtuvieron 50 vectores de 20 datos. Son 4 patrones especiales
considerados (cambio superior de la media, cambio inferior de la media, tendencia creciente y
tendencia decreciente) y cada uno contempla 2 valores de d. Lo anterior hace un total de
50x4x2 = 400 vectores de entrenamiento.
Tabla 5.11. Asociación del patrón especial con el código binario para el entrenamiento de
la FuzzyARTMAP.
CASO PATRÓN d. CÓDIGO BINARIO
1 Cambio superior de la media +3.00 1 0 0 0
2 Cambio superior de la media +4.00 1 1 0 0
3 Cambio inferior de la media -3.00 0 1 0 0
4 Cambio inferior de la media -4.00 0 1 1 0
5 Tendencia creciente +0.10 0 0 1 0
6 Tendencia creciente +0.15 0 0 1 1
7 Tendencia decreciente -0.1 0 0 0 1
8 Tendencia decreciente -0.15 1 0 0 1
5.11. Prueba de la FuzzyARTMAP para los patrones especiales.
Los vectores empleados para la prueba experimental de la red neuronal, fueron obtenidos por
simulación de Monte Carlo, de acuerdo a lo descrito anteriormente, en MATLAB®
. Se usaron
50 vectores por cada caso indicado en la tabla 5.11, por lo que fueron 8x50 = 400 vectores de
prueba. Su colocación en el archivo de prueba de la red neuronal fue aleatorio.
63
5.12. Aplicación del Diseño Experimental para patrones especiales.
5.12.1. Diseño del experimento.
El diseño del experimento, así como el análisis del mismo, fueron hechos con Minitab®
Statistical Software. La tabla 5.12 muestra el resumen del diseño de este experimento.
5.12.2. Análisis de Varianza.
El análisis de varianza de este experimento se muestra en la tabla 5.13. Los resultados indican
que al menos un efecto principal es significativo, así como también el efecto de curvatura de al
menos uno de los factores.
Tabla 5.12. Resumen del experimento para clasificar patrones especiales.
CONCEPTO VALOR
Tipo de experimento Diseño factorial fraccionado, 2k
Número de factores 7 a dos niveles
Resolución III
Número de réplicas 2
Número de corridas 18
Bloques 1
Puntos centrales 2
Diseño generador de alias D = AB, E = AC, F = BC, G = ABC
Variable de respuesta Eficiencia de predicción
Nivel de significancia 0.05
LETRA FACTORES
BAJO (-)
NIVEL
ALTO (+)
A Vigilancia en el modulo de entrada 1 (ρa1) 0.2 0.8
B Vigilancia en el campo de mapeo 1 (ab1) 0.2 0.8
C Razón de aprendizaje 1 (β1) 0.2 1.0
D Vigilancia en el modulo de salida (ρb1,2) 0.2 0.8
E Vigilancia del campo de mapeo 2 (ab2) 0.2 0.9
F Razón de aprendizaje 2 (β2) 0.2 1.0
G Vigilancia en el modulo de entrada 2 (ρa2) 0.2 0.8
64
Tabla 5.13. ANOVA para el experimento de clasificación de patrones especiales.
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADOS
MEDIOS F p
Efectos principales 7445.56 7 1063.65 804.44 0.000
Curvatura 31.64 1 31.64 23.93 0.001
Error 11.90 9 1.32
Total 7489.10 17
5.12.3. Efectos y coeficientes.
Los efectos principales de los factores significativos de esta experimentación, así como sus
coeficientes en la ecuación de regresión se muestran en la tabla 5.14.
Tabla 5.14. Tabla de efectos principales y coeficientes del modelo experimental para
patrones especiales.
TÉRMINOS/
CONSTANTES
EFECTOS
PRINCIPALES
COEFICIENTE
EN UNIDADES
CODIFICADAS
t p
Constante +10.53 +36.63 <0.05
ρa1 -18.51 -9.26 -32.2 <0.05
ab1 -13.54 -6.77 -23.55 <0.05
β1 -13.54 -6.77 -23.55 <0.05
ρb1,2 +13.54 +6.77 +23.55 <0.05
ab2 +13.54 +6.77 +23.55 <0.05
β2 +18.66 +9.33 +32.46 <0.05
ρa2 -20.91 -10.46 -36.37 <0.05
R2 = 99.84% R
2(ajustada) = 99.7%
De los resultados se puede confirmar que hay efectos significativos y que éstos son los 7
factores considerados en la experimentación, o bien, sus interacciones en efectos confundidos.
5.12.4. Análisis gráfico.
Análisis de efectos.
La figura 5.7 representa la significancia de los efectos de los factores estudiados en este
experimento. Se observan los cambios en la eficiencia de la clasificación de la red neuronal al
65
cambiar el nivel de bajo a alto de cada uno de estos. Se observa que ρa1, ρab1, β1 y ρa,2 tienen
pendiente negativa, lo que indica que tienen mejor desempeño en el nivel bajo, dado que la
variable de respuesta es mayor es mejor. Lo contrario ocurre con los factores ρb1,2, ρab2 y β2.
Los 7 factores presentan efecto de curvatura, pero no hay evidencia de que en su nivel central
mejoren el desempeño de la red neuronal que los niveles alto o bajo.
Efi
cie
ncia
me
dia
0.800.500.20
20
10
0
0.800.500.20 1.000.600.20
0.800.500.20
20
10
0
0.800.500.20 1.000.600.20
0.800.500.20
20
10
0
BV 1 RM1 LR1
V RM2 LR2
BV 2
Figura 5.7. Efectos de los factores significativos de la experimentación con patrones
especiales.
Análisis de idoneidad.
La gráfica de los residuales contra el orden de las corridas experimentales muestra que no hay
evidencia de violación al principio de independencia de los residuales al mostrar un patrón
aleatorio (ver figura 5.8). En la figura 5.9 no se observa que las varianzas puedan ser
significativamente diferentes, no obstante, la menor dispersión se presenta en valores altos de
la eficiencia de la red neuronal, lo cual no genera problema de experimentación. Finalmente,
la figura 5.10 presenta los puntos residuales ajustados a una distribución normal. Aunque el
ajuste no es perfecto, es posible tolerar ciertas desviaciones (Gutierrez y de la Vara, 2004).
ρa1 ρab1 β1
ρb1,2 ρap2 β2
ρa2
66
Orden de corridaR
esid
ua
l18161412108642
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
Figura 5.8. Residuales contra el orden de las corridas experimentales de la
experimentación con patrones especiales.
Valor ajustado
Re
sid
ua
l
706050403020100
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
Figura 5.9. Residuales contra valor ajustado de la experimentación con patrones
especiales.
Residual
Po
rce
nta
je
210-1-2
99
95
90
80
70
60
50
40
30
20
10
5
1
Figura 5.10. Gráfica de probabilidad normal de los residuales del experimento con
patrones especiales.
67
5.12.5. Validación experimental.
Para validar los resultados experimentales obtenidos en el uso de la red neuronal, se corrió una
prueba confirmatoria, operando la red neuronal a los niveles adecuados, que son: ρa1, ρab1, β1 y
ρa2 al nivel bajo, que es 0.2. Los factores ρb1,2, ρab2 y β2 tienen efectos con pendientes positivas,
lo que indica fijar el nivel en el valor alto, que es 0.8, 0.8 y1.0, respectivamente. La prueba de
confirmación consideró 400 vectores de tamaño 20 y se obtuvieron los siguientes resultados
(Tabla 5.15).
Tabla 5.15. Resultados de la prueba confirmatoria del experimento con patrones
especiales.
PATRÓN ESPECIAL EFICIENCIA DE
CLASIFICACIÓN
Cambio superior del nivel de la media d = 3, 4 96%
Cambio inferior del nivel de la media d = -3, -4 80%
Tendencia creciente d = 0.1, 0.15 86%
Tendencia decreciente d = -0.1, -0.15 96%
Promedio 90%11
11
Del 10% faltante al 100%, el 80% de los vectores fueron confundidos por la red neuronal entre ese mismo
grupo de patrones (por ejemplo el patrón de tendencia creciente por el patrón de cambio superior en el nivel de la
media). El 20% fue confundido con patrones no especificados.
68
Capítulo 6
MÉTODO PROPUESTO DE CONTROL ESTADÍSTICO DE
PROCESOS.
6.1. Método propuesto de control de procesos por reconocimiento de patrones.
El método propuesto consta de tres elementos: Proceso de aprendizaje, proceso de control y el
uso de la base de datos mejorada en su valor (BDM), tal como se muestra en la figura 6.1. El
primer elemento contiene tres subelementos, llamados, variable aleatoria (muestra de datos de
tamaño 20), aprendizaje (por la FuzzyARTMAP) de la base de datos inicial (BDI) y el
aprendizaje de la base de datos combinada (BDM + BDI).
Figura 6.1. Método de control de procesos
Inicialmente la FuzzyARTMAP es entrenada con la BDI, la cual está formada por los vectores
de datos con patrones especiales (natural fuera de control, cambio en la media y tendencia) y
no especiales (natural en control) generados por simulación. Posteriormente, esta BDI se
convierte en la BDM cuando la BDI es aumentada con vectores de datos obtenidos del proceso
de manufactura que no hayan sido reconocidos por el algoritmo de la figura 6.2. Tanto la BDI
Reconocimiento
de patrones
Control
Proceso de control
Base de datos mejorada
Variable aleatoria
BDI
BDM+BDI
Proceso de aprendizaje
69
como la BDM contienen a dos bases de datos internas, reservadas para agrupar a los vectores
de datos con distribución normal y no normal. Se asume que los vectores de datos con
distribución normal tienen patrón natural en alguno de dos tipos: (i) patrón natural en estado
de control estadístico (cuando µ y σ se mantienen cercanos o iguales a los valores deseados) y
(ii) patrón natural en estado fuera de control estadístico (cuando µ y/o σ han cambiado
significativamente, pero no al grado de generar anormalidad en la distribución de los datos del
vector). Los valores de µ y σ deseados para mantener al nivel de calidad de la producción
dentro de las especificaciones, están denotados por ε y τ respectivamente. Por otra parte, los
vectores de datos con distribución de probabilidad no normal forman la segunda base de datos
interna de BDI y BDM. Aquí se tienen a los datos cuyo patrón es cualquiera que no tenga
distribución normal y es, por ende, especial.
Figura 6.2. Algoritmo de control del proceso.
Reconocimiento de patrones Control
Vector X
Preparación de datos:
1. Estandarización.
2. Codificación.
3. Prueba de normalidad.
Tiene X
distribución normal?
Sí No
Ajustar los
parámetros de
la ANN a casos
normales
Ajustar los
parámetros de
la ANN a casos
no normales
Clasificación
del patrón
Patrón
conocido?
No
Sí
Patrón de
inestabilidad?
Sí
No
Cambio en µ y/o
σ respecto a ε y τ
Identificar causa
de variación
especial por tipo
de patrón
Restablecimiento
del control del
proceso
BDM
Nuevo vector X
Nuevo vector X
Acción
humana
Análisis
estadístico
Hacia proceso
de aprendizaje
70
La figura 6.2 se explica como sigue:
Vector X.
Se selecciona del proceso de manufactura una muestra de 20 datos consecutivos y ordenados
en el tiempo. No hay precisión sobre la frecuencia de colecta de datos, pudiendo ser de una
muestra cada 30 minutos, o bien, continua, si este algoritmo es procesado por medios
computacionales e incorporado al proceso de manufactura. Los datos pueden ser continuos o
discretos. Si son discretos, entonces se deberá considerar la fracción de disconformes.
Estandarización.
El vector X debe ser estandarizado con la ecuación 5, considerando los valores ε y τ.
𝑋𝐸 =𝑋 − 𝜀
𝜏 (5)
donde:
XE : Vector de datos estandarizados en función de ε y τ.
X: Vector de datos tomados del proceso de manufactura.
ε : Valor medio objetivo de la característica de calidad.
τ : Valor de la desviación estándar objetivo de la característica de calidad.
Codificación.
El vector XE se debe transformar en el vector Xc, donde Xc contiene 20 datos Xci, para
i = 1,2,3,…20 distribuidos dentro del intervalo [0;1]. La transformación se hace mediante el
programa elaborado para este propósito y que se muestra en el anexo A.
71
Prueba de normalidad.
Existen muchas pruebas de verificación de la normalidad de los datos. Se señalan: Anderson-
Darling, Kolmogorov y Shapiro-Wilks. Se debe seleccionar cualquiera de éstas para probar la
hipótesis de la normalidad de los datos contra la alterna de que no lo son.
Aplicación de la red neuronal.
Hay dos estados de aplicación de la red neuronal, que son, (i) cuando X se distribuye de forma
normal y (ii) cuando X no se distribuye de forma normal, ver tabla 6.1.
Tabla 6.1. Estados de uso de la red neuronal.
PARÁMETRO DE LA RED
NEURONAL
AJUSTADOS A DATOS
NORMALES
AJUSTADOS A DATOS
NO NORMALES
ρa1 0.2 0.2
ab1 cualquiera 0.2
β1 1.0 0.2
ρb1,2 0.9 >0.7
ab2 Cualquiera 0.8
β2 1.0 1.0
ρa2 0.2 0.2
Clasificación del patrón.
Después de aplicar la red neuronal en cualquiera de los dos estados indicados en la tabla 6.1 se
pueden obtener los patrones mostrados en la tabla 6.2.
72
Tabla 6.2. Clasificación del patrón por algoritmo.
TIPO DE PATRÓN INDICATIVO DEL ESTADO DEL PROCESO
Natural en control En control estadístico
Natural fuera de control Fuera de control estadístico
Cambio superior de la media Fuera de control estadístico
Cambio inferior de la media Fuera de control estadístico
Tendencia creciente Fuera de control estadístico
Tendencia decreciente Fuera de control estadístico
Patrón conocido y patrón de inestabilidad.
Después de haber procesado el vector X por la red neuronal, puede ocurrir que esta detecte un
patrón conocido o bien, este sea clasificado como desconocido. Si el patrón es conocido
entonces éste puede ser cualquiera de los indicados en la tabla 6.2 y el estado de control del
proceso habrá quedado definido. En caso de ser el estado de control como de estabilidad,
entonces el siguiente vector de datos deberá ser procesado por el algoritmo; si el patrón es de
inestabilidad, una causa especial de variación tiene que ser detectada (ver tabla 6.3.) y
suprimida para restablecer el control estadístico del proceso. En el caso de que el patrón sea no
conocido, la intervención humana es necesaria para aplicar las técnicas estadísticas
descriptivas y determinar el tipo de patrón que corresponda a la variación de estos datos. Si
esto ocurre, dicho patrón es adicionado a la BDI para obtener la BDM.
6.2. Determinación de causas especiales de variación.
Gutiérrez y de la Vara (2004) explican la asociación existente entre los patrones especiales y
las causas de variación que los originan. Esto, se resume en la tabla 6.3. No obstante, la
información indicada es de uso y aplicación general a cualquier proceso de manufactura, pero
no particular, por lo que deberán generase más causas especiales asociadas a los patrones, en
base al aprendizaje continuo del proceso de manufactura.
73
Tabla 6.3. Identificación de patrones especiales y su relación con causas de variación.
PATRÓN ESPECIAL CAUSAS PROBABLES
Natural en estado fuera de control
Cambios (superior o inferior) del
nivel de la media.
Introducción de nuevos trabajadores, máquinas,
materiales o métodos.
Cambios en los métodos de inspección.
Cambio en el nivel de atención de los trabajadores.
Mejoramiento o empeoramiento del proceso.
Tendencias (creciente o decreciente).
Deterioro o desajuste gradual del equipo de producción.
Desgaste de herramientas.
Calentamiento de maquinaria.
Cambios graduales en las condiciones ambientales.
6.3. Validación del algoritmo de identificación de la estabilidad del proceso.
La validación del algoritmo se llevó a cabo en dos etapas: experimental y de aplicación. La
primera consistió en la prueba con 12,500 vectores X generados por simulación de Monte
Carlo, tal cual se ha explicado en secciones anteriores. De estos vectores, 500 corresponden a
cada patrón enlistado en la tabla 6.4. La validación por aplicación está referida a la prueba del
algoritmo en dos casos de empresas de industrias distintas y de tipo de variable aleatoria
diferente.
Validación experimental.
La tabla 6.4 indica 25 divisiones de los patrones natural, cambio superior de la media, cambio
inferior de la media, tendencia creciente y tendencia decreciente. Se observan los valores de
los parámetros a los que fueron generados, así como también si el tipo de distribución es
normal o no.
La tabla 6.5 fue generada a partir de probar 25x500=12,500 vectores X. Se clasifica a cada
tipo de patrón como estable o inestable en función de su definición. El grupo de los 500
vectores de cada uno de los 25 patrones fue procesado de acuerdo al método de la figura 6.1 y
al algoritmo de la figura 6.2 Se aprecian los patrones donde el algoritmo tiene eficiencia
elevada de clasificación.
74
Tabla 6.4. Tipos de patrones para validación experimental.
PATRÓN PARÁMETROS TIPO DE DISTRIBUCIÓN12
NUM TIPO µ σ d
1 Natural 0.0 1.0 0.0 Normal
2 Natural 0.5 1.0 0.0 Normal
3 Natural 1.0 1.0 0.0 Normal
4 Natural 1.5 1.0 0.0 Normal
5 Natural 0.0 1.5 0.0 Normal
6 Natural 0.0 2.0 0.0 Normal
7 Natural 0.0 2.5 0.0 Normal
8 Natural 0.0 3.0 0.0 Normal
9 Natural 0.5 3.0 0.0 Normal
10 Natural 1.0 3.0 0.0 Normal
11 Natural 1.5 3.0 0.0 Normal
12 Cambio superior de la media 0.0 1.0 1.0 Normal
13 Cambio superior de la media 0.0 1.0 2.0 normal13
14 Cambio superior de la media 0.0 1.0 3.0 normal14
15 Cambio superior de la media 0.0 1.0 4.0 no normal
16 Cambio inferior de la media 0.0 1.0 1.0 Normal
17 Cambio inferior de la media 0.0 1.0 2.0 normal15
18 Cambio inferior de la media 0.0 1.0 3.0 normal16
19 Cambio inferior de la media 0.0 1.0 4.0 no normal
20 Tendencia creciente 0.0 1.0 0.05 Normal
21 Tendencia creciente 0.0 1.0 0.1 Normal
22 Tendencia creciente 0.0 1.0 0.15 Normal
23 Tendencia decreciente 0.0 1.0 -0.05 Normal
24 Tendencia decreciente 0.0 1.0 -0.1 Normal
25 Tendencia decreciente 0.0 1.0 -0.15 Normal
12
Prueba de normalidad hecha con la prueba de Anderson-Darling, con α=0.05 y aplicada a una muestra de 30
vectores de tamaño 20 para cada caso. 13
El 90% de los vectores tuvo distribución normal. 14
El 80% de los vectores tuvo distribución normal. 15
El 90% de los vectores tuvo distribución normal. 16
El 70% de los vectores tuvo distribución normal.
75
Tabla 6.5. Resultados de la validación experimental.
MUESTRAS TIPO DE PATRÓN TIPO DE
PROCESO
% DE CASOS DE
CLASIFICACIÓN
CORRECTA DEL PROCESO
(EN CONTROL/FUERA DE
CONTROL)
1 Natural no especial
Estable 99.8%
2 a 4
Natural especial por cambio
solo en µ, menor a 1.5σ
Inestable Menor a 50%
5 a 8 Natural especial por cambio
solo en σ, menor a 3σ Inestable 88.2% promedio
9 a 11
Natural especial por cambio
solo en µ, cuando σ=3
Inestable 99.8% promedio
12
Cambio pequeño superior en
la media con distribución
normal
Inestable 12%
13 y 14
Cambio superior en la media
con distribución normal
Inestable 92.5% promedio
15
Cambio superior en la media
con distribución NO normal
Inestable 91%
16
Cambio pequeño inferior en la
media con distribución normal
Inestable 20.0%
17 y 18
Cambio inferior en la media
con distribución normal
Inestable 95% promedio
19
Cambio inferior en la media
con distribución NO normal
Inestable 77.8%
20 a 22
Tendencia creciente (de
pequeña a no pequeña)
Inestable 87.2% promedio
23 a 25
Tendencia decreciente (de
pequeña a no pequeña)
Inestable 91%
De la tabla 6.5 se puede observar que los mejores resultados se encuentran en las muestras 1, 5
a 11, 13 a 15, 17, 18 y 20 a 25. En todas las muestras restantes se obtuvieron eficiencias bajas.
Al verificar estas muestras en la tabla 6.4 se obtiene la información de que comparten la
76
característica de lo que en control estadístico de procesos se denomina “cambios pequeños”, lo
que conduce a generar la conclusión de que el algoritmo propuesto no es eficiente para este
tipo de casos.
Validación por aplicación.
Se valido el algoritmo en dos casos de aplicación distintos entre si al tratarse de dos empresas
y dos tipos de variables aleatorias diferentes. A continuación se muestran los resultados y el
análisis estadístico correspondiente.
Caso 1. Variable aleatoria discreta.
En este caso se analizó a una empresa dedicada a la fabricación y distribución de productos
cosméticos. Esta empresa divide sus periodos de producción en campañas, teniendo 15 en el
año. Los datos tomados corresponden a una campaña. Estudios previos a los mostrados en
esta tesis, sugieren que no hay diferencia significativa en el nivel y comportamiento de la
calidad de producción entre los 15 periodos laborales, por lo que tomar uno de estos es
seleccionar una muestra representativa de la conducta anual de trabajo de la empresa.
La variable aleatoria estudiada es discreta y se traslada a la fracción de disconformes. Las
muestras de datos, llamadas vectores X, fueron tomadas del proceso de manufactura como se
indica en la tabla 6.6 bajo el concepto de vector móvil.
De este modo se recabaron los datos de los 21 vectores mostrados en la tabla 6.7, que son las
unidades defectuosas en las muestras tomadas. Los datos de la tabla 6.7 se trasladaron a
valores fraccionales, para obtener la fracción defectuosa, p, de cada dato. Estos datos se
muestran más adelante. Las gráficas y el tipo de patrón observado de estos 21 vectores se
muestran en la figura 6.3.
77
Tabla 6.6. Vectores móviles.
NÚMERO DE DATO
t.
1 2 3 …
VECTOR X1 VECTOR X2 VECTOR X3 …
1 X1
2 X2 X1
3 X3 X2 X1 4 X4 X3 X2
…
5 X5 X4 X3
6 X6 X5 X4
7 X7 X6 X5
8 X8 X7 X6
9 X9 X8 X7
10 X10 X9 X8
11 X11 X10 X9
12 X12 X11 X10
13 X13 X12 X11
14 X14 X13 X12
15 X15 X14 X13
16 X16 X15 X14
17 X17 X16 X15
18 X18 X17 X16
19 X19 X18 X17
20 X20 X19 X18
21
X20 X19
22
X20
23
…
78
Tabla 6.7. Número de unidades defectuosas en una muestra de tamaño n, en el tiempo t.
t
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 8 5 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4
2 5 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2
3 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3
4 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7
5 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1
6 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7
7 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2
8 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1
9 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5
10 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5
11 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2
12 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4
13 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2
14 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2
15 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2
16 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4
17 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4
18 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2
19 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2
20 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2 0
21 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2 0 4
79
X GRÁFICA PATRÓN
OBSERVABLE X GRÁFICA
PATRÓN
OBSERVABLE
1
Tendencia
decreciente 12
Tendencia
creciente con
pendiente 0.16
2
Pendiente 0 con
patrón especial 13
Tendencia
creciente con
pendiente 0.11
3
Pendiente 0 con
patrón especial 14
Tendencia
creciente con
pendiente 0.06
4
Patrón natural 15
Tendencia
creciente con
pendiente 0.04
5
Patrón natural 16
Patrón natural
6
Patrón natural 17
Patrón natural
7
Patrón natural 18
Tendencia
decreciente con
pendiente -0.02
8
Pendiente 0 con
patrón especial 19
Tendencia
decreciente con
pendiente -0.09
9
Tendencia
creciente con
pendiente 0.04
20
Tendencia
decreciente con
pendiente -0.1
10
Patrón natural 21
Tendencia
decreciente con
pendiente -0.08
11
Pendiente 0 con
patrón especial
Figura 6.3. Gráficas de los 21 vectores X de la empresa del caso 1.
80
La fracción de unidades defectuosas, o fracción disconforme, se define por
𝑝 = 𝑦
𝑛 (6)
donde:
p: fracción de disconformes.
y: número de piezas encontradas defectuosas en la muestra.
n: tamaño de la muestra.
Como y es una variable aleatoria discreta tipo Bernoulli, que sigue una distribución de
probabilidad Binomial, entonces sus parámetros son µ = n(p) y σ2 = µ(1 – p). Por otra parte,
la distribución de probabilidad de y será aproximadamente normal si µ > 517
.
Con esta información, tomando el horizonte de datos de un año completo de la empresa se
tiene que p = 0.0095. Este valor dista del deseado, el cual es de 0.005, para mantener al nivel
de calidad en 99.5%.
En los muestreos que se llevan a cabo en la empresa, 138n , por lo que los parámetros de y
son µ = 138(0.0095) = 1.311 unidades defectuosas en una muestra de tamaño 138 con σ2 =
1.311(1-0.0095) = 1.29. A valores tan pequeños de p y/o n, no se puede asegurar que la
distribución de probabilidad normal pueda ser usada para aproximar a la binomial, que estará
sesgada, y por tanto, no habrá posibilidad de calcular los límites de control por ausencia de
simetría. La figura 6.4 muestra la distribución de probabilidad asociada a este caso, junto con
los datos numéricos.
17
Este valor es empírico, pero es comúnmente aceptado. La referencia no empírica es cuando el tamaño de la
muestra crece.
81
y f(y)
0 0.5
1 0.3472
2 0.1195
3 0.0272
4 0.0046
Figura 6.4. Forma sesgada de la distribución de probabilidad para el caso de validación 1
Para el nivel de muestreo de 138 unidades inspeccionadas y para el valor meta de la fracción
de disconformes, que es de 0.005, se tiene que εp = 0.005. Si se desea tener esta información
no en términos de la fracción de defectuosos sino a través de las unidades no conformes,
entonces εy = 0.69 y τy = 0.832. Dicho de otra forma, para que el nivel de calidad de la
empresa se encuentre en 99.5% es necesario que la fracción de disconformes se ubique en
0.005, o bien, que el número medio de piezas defectuosas en un tamaño muestral medio de
138 piezas sea de 0.69 con una desviación estándar de 0.832. Ambas expresiones son
equivalentes.
Sabiendo que la teoría de los gráficos de control tradicionales indica que es necesario eliminar
las causas de variación especial antes de instalar un gráfico de control, pues de otro modo, éste
no hará más que indicar estados fuera de control continuamente, por inspección de los datos,
se concluye que este proceso de producción no está libre de causas de variación especial. De
este modo, se asume que los 21 vectores arrojan la información de un proceso sin control
estadístico, por lo que no es necesario elaborar gráficos de control para conocer esto.
La tabla 6.8 contiene los datos de la empresa puestos como la fracción no conforme.,
considerando su tamaño de muestra específico.
0
0.1
0.2
0.3
0.4
0.5
0.6
0 1 2 3 4
82
Tabla 6.8. Fracción no conforme de unidades revisadas en la empresa caso 1.
t.
Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 0.0734 0.0625 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248
2 0.0625 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222
3 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186
4 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438
5 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111
6 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429
7 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123
8 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111
9 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249
10 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200
11 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160
12 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247
13 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118
14 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247
15 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124
16 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235
17 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444
18 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124
19 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117
20 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117 0.0000
21 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117 0.0000 0.0500
Para los datos de la tabla 6.7, como se mencionó, εy = 0.69 y τy = 0.832; los datos de la tabla
6.8 se asocian con εp = 0.005. En esta tesis, se usaron los primeros valores meta, es decir, εy =
0.69 y τy = 0.832. Continuando con el algoritmo, los datos deben ser estandarizados y
codificados. La estandarización se hizo con la ecuación 6 y la codificación de acuerdo con el
programa codificador mostrado en esta tesis. Los resultados estandarizados se indican en la
tabla 6.9. La tabla 6.10 contiene los datos codificados.
Tabla 6.9. Datos estandarizados de la empresa del caso 1
t.
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 8.786 5.180 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978
2 5.180 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575
3 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776
4 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584
5 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373
6 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584
7 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575
8 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373
9 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180
10 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180
11 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575
12 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978
13 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575
14 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575
15 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575
16 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978
17 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978
18 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575
19 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575
20 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575 -0.829
21 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575 -0.829 3.978
83
Tabla 6.10. Datos codificados de la empresa del caso 1
t.
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 0.988 0.788 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721
2 0.788 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587
3 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654
4 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921
5 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521
6 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921
7 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587
8 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521
9 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788
10 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788
11 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587
12 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721
13 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587
14 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587
15 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587
16 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721
17 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721
18 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587
19 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587
20 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587 0.454
21 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587 0.454 0.721
Se aplicó la prueba de normalidad Anderson Darling para conocer como se distribuye cada
vector y se obtuvo la información mostrada en la tabla 6.11.
Tabla 6.11. Clasificación de los vectores de acuerdo al tipo de su distribución de
probabilidad.
X ESTADÍSTICO
p DISTRIBUCIÓN X
ESTADÍSTICO
p DISTRIBUCIÓN
1 0.071 normal 12 0.071 normal
2 0.034 no normal 13 0.038 no normal
3 0.029 no normal 14 0.039 no normal
4 0.077 normal 15 0.039 no normal
5 0.050 normal 16 0.099 normal
6 0.057 normal 17 0.089 normal
7 0.094 normal 18 0.054 normal
8 0.024 no normal 19 0.007 no normal
9 0.024 no normal 20 0.016 no normal
10 0.055 normal 21 0.016 no normal
11 0.019 no normal
Finalmente, los patrones fueron identificados y el proceso de producción diagnosticado. La
tabla 6.12 contiene esta información.
84
Tabla 6.12. Resultados obtenidos por el algoritmo identificador de estados de control
para la empresa del caso 1
Xi TIPO DE
DISTRIBUCIÓN
ESTADO DEL
PROCESO
RESULTADO POR ALGORITMO CON
BDI
RESULTADO POR ALGORITMO CON
BDM18
1 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
2 No normal Fuera de
control Tendencia creciente Pendiente 0 con patrón especial
3 No normal Fuera de
control Tendencia creciente Pendiente 0 con patrón especial
4 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
5 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
6 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
7 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
8 No normal Fuera de
control Tendencia creciente Pendiente 0 con patrón especial
9 No normal Fuera de
control Tendencia creciente Tendencia creciente
10 Normal Fuera de
control
Cambio solo en µ respecto a ε
(caso II tabla 3) No aplica
11 No normal Fuera de
control Tendencia creciente Pendiente 0 con patrón especial
12 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
13 No normal Fuera de
control Cambio superior No aplica
14 No normal Fuera de
control Tendencia creciente No aplica
15 No normal Fuera de
control Tendencia creciente No aplica
16 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
17 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
18 Normal Fuera de
control
Cambio en µ y en σ, respecto a ε y
τ respectivamente (caso IV tabla 3) No aplica
19 No normal Fuera de
control Tendencia creciente Tendencia creciente
20 No normal Fuera de
control Tendencia creciente Pendiente 0 con patrón especial
21 No normal Fuera de
control Tendencia creciente Tendencia creciente
18
Después de agregar a la BDI tres vectores no reconocidos, uno a la vez.
85
Al usar el algoritmo identificador de estados de control del proceso, se obtuvieron eficiencias
diferentes de acuerdo al uso de las bases de datos de entrenamiento, partiendo de la BDI. Al
usar este algoritmo con la BDI, se tuvo una eficiencia de reconocimiento de patrones del 62%
de los 21 mostrados en la tabla 6.9. Al agregar el vector 2 a la BDI se generó la BDM y con
esta se tuvo una eficiencia de 76%. Se agregaron dos vectores más y la eficiencia fue de 90%.
Caso 2. Variable aleatoria continua.
El segundo caso para la validación práctica del algoritmo identificador de estados de control
de manufactura corresponde a una empresa dedicada a la elaboración de productos lácteos. El
producto en cuestión es un tipo de queso en presentación individual de 400 grs de peso. Los
vectores formados a partir de los datos recabados se muestran en la tabla 6.13. Se omiten las
tablas de datos con la estandarización y codificación ya que el proceso fue mostrado con el
caso 1 de validación práctica.
A diferencia del caso 1, en este si fue posible elaborar un gráfico de control, pues los datos
tienden a distribuirse de forma normal. El gráfico de control usado fue el de mediciones
individuales, el cual fue aplicado en los vectores X donde los datos se distribuyen de forma
normal; para los vectores con distribución no simétrica, se usó el gráfico de control de la
media tomando un tamaño 3 de subgrupo. Los resultados de la validación se colocaron en la
tabla 6.14.
86
Tabla 6.13. Mediciones del peso en gramos de un producto alimenticio.
t.
Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 420 385 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418
2 385 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409
3 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399
4 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401
5 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403
6 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421
7 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402
8 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397
9 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397
10 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400
11 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355
12 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355
13 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433
14 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419
15 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425
16 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427
17 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430
18 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429
19 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432
20 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425
21 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427
22 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450
23 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407
24 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363
25 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396
26 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426
27 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415
28 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411
29 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396
30 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402
31 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399
32 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424
33 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406
34 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397
35 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394
36 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397
37 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375
38 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407
39 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405
40 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405 438
41 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405 438 427
87
Tabla 6.14. Resultados obtenidos por gráfico de control y algoritmo propuesto para los
datos de la empresa del caso 2 de la validación práctica.
Xi TIPO DE
DISTRIBUCIÓN
RESULTADO
GRÁFICO DE
CONTROL
RESULTADO POR ALGORITMO
PROPUESTO
1 y 2 Normal Inestable En control, patrón natural
3 a 32 No normal Inestable Fuera de control, patrón de tendencia creciente
33 a 37 Normal Inestable En control, patrón natural
38 a 41 Normal Estable En control, patrón natural
De acuerdo a los resultados obtenidos se observa que el algoritmo clasificó como patrones
naturales a la muestras 1, 2, 33, 34, 35, 36, 37, 38, 39, 40 y 41. Esto significa que todas estas
muestras tienen igualdad en µ y σ de cada vector al vector X generado con µ=0 y σ=1. Esto
es comprobado a continuación para verificar la veracidad de los resultados obtenidos con el
algoritmo.
Dado que se asume normalidad en esos vectores, es posible realizar un análisis de varianza
para comparar los valores de sus medias. La ANOVA se muestra en la tabla 6.15. La figura
6.5 es el análisis gráfico de idoneidad, de la cual se asume que no se viola ningún principio de
este análisis.
Tabla 6.15. ANOVA de las comparaciones de las medias de las muestras
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADOS
MEDIOS F p
Muestras 0.001640 10 0.000164 0.72 0.701
Error 0.047326 209 0.000226
Total 0.048966 219
88
Residual
Po
rce
nta
je
0.0500.0250.000-0.025-0.050
99.9
99
90
50
10
1
0.1
Valor ajustado
Re
sid
ua
l
0.5220.5200.5180.5160.514
0.04
0.02
0.00
-0.02
-0.04
Residual
Fre
cu
en
cia
0.030.020.010.00-0.01-0.02-0.03-0.04
40
30
20
10
0
Orden de corrida
Re
sid
ua
l
220200180160140120100806040201
0.04
0.02
0.00
-0.02
-0.04
Gráfica de probabilidad normal Residualesvs. valor ajustado
Histograma de residuales Residuales vs. orden de corrida
Figura 6.5. Análisis de idoneidad de las comparaciones de las medias de las muestras
Del ANOVA realizado se concluye que no existe diferencia significativa entre las muestras.
Sin embargo, esto no prueba si son iguales a cero. La verificación de que µ=0 así como la de
σ=1, se hicieron mediante dos pruebas de hipótesis, una para la media y la otra para la
varianza, bajo las siguientes condiciones: Se comparó el vector 1 con un vector X con patrón
natural generado por simulación de Monte Carlo con µ=0 y σ=1.
a) Prueba de hipótesis para la media igual a 0.
Ho: las medias de los datos del vector 1y el vector X son iguales.
H1: las medias de los datos del vector 1 y el vector X no son iguales.
A un nivel de significancia de 0.05, la prueba con el estadístico t genera to = 0.78 y p = 0.446,
por lo que se acepta la hipótesis nula.
b) Prueba de hipótesis para la varianza igual a 1.
Ho: las varianzas de los datos del vector 1 y del vector X son iguales.
H1: las varianzas de los datos del vector 1 y del vector X no son iguales.
89
A un nivel de significancia de 0.05, la prueba con el estadístico t genera p = 0.0, por lo que se
rechaza la hipótesis nula, aceptando que la varianza de los datos del vector 1 no es igual a 1.
Sin embargo, esto no es problema, ya que se puede demostrar que la varianza del vector 1
estandarizado y codificado es menor a la del vector X.
La importancia de las conclusiones anteriores es que se determinó que el algoritmo fue
acertado en la clasificación de estos vectores en patrones naturales y en que el proceso está
bajo control estadístico, lo que no ocurrió con el gráfico de control.
Por otra parte, las muestras 3 a 32 fueron clasificadas como patrones no naturales por el
algoritmo, conduciendo a afirmar que el proceso se encuentra en estado inestable. Esta misma
conclusión se obtuvo por el gráfico de control, por lo que no es necesario probar nada al
respecto. No obstante, se aprecia que todas estas muestras denotaron patrón de tendencia
creciente, de acuerdo al algoritmo, situación que fue analizada para verificar su validez.
Si se hace una gráfica de puntos de los datos de las muestras 3 a 32, se observarán claramente
dos cosas:
a) Las muestras 3 a 9 y 19 a 30 tienen patrón de tendencia creciente.
b) La muestras 10 a 18, 31 y 32, no tienen dicho patrón.
La efectividad del algoritmo fue entonces de 19 aciertos en 30 casos (19 patrones
correctamente clasificados como de tendencia creciente y 30 muestras en total que así fueron
clasificadas).
Las muestras 10 a 18, 31 y 32, tienen patrón decreciente (por inspección). Este es un estado
de confusión de la red neuronal y puede ser debido a que las pendientes de las rectas de ajuste
de estas muestras son menores a la pendiente que tiene la recta de ajuste del vector X cuando
d=0.15, por lo que se puede suponer que como no se proporcionó patrón de entrenamiento en
estos casos, la red neuronal se confundió. Cabe mencionar que este es solo una suposición que
90
no fue estudiada en esta tesis, salvo lo correspondiente a la observación de las pendientes y de
los coeficientes de regresión de las rectas, que en todos los casos es muy bajo (menor a 20%).
También cabe mencionar que en esta tesis se ha señalado que el patrón en referencia presenta
siempre distribución normal, lo cual es correcto para vectores de X generados por simulación
y puede no serlo para conjuntos de datos provenientes de procesos de manufactura que son
afectados por puntos extraños que hacen que la distribución no sea simétrica, aun conservando
una cierta tendencia creciente.
Considerando el concepto BDM se incluyó en la BDI al vector de la muestra 11 para obtener
la base de datos mejorada, asociando esta muestra al patrón de tendencia decreciente. Los
resultados cambiaron a:
a) Las muestras 10 a 15, 31 y 32 fueron clasificadas correctamente, como patrón
decreciente.
b) Las muestras 16 a 18, permanecieron con error de clasificación.
De este modo, de los 41 conjuntos de datos, 39 fueron correctamente clasificados por el
algoritmo y en cuanto a la determinación del estado del proceso, éste condujo a una eficiencia
del 100% en la identificación correcta.
91
Capítulo 7
CONCLUSIONES
a) Es posible monitorear el proceso de manufactura mediante un algoritmo identificador
de estados de control que no requiera de límites de control, del cumplimiento del
supuesto de normalidad y de la intervención del juicio humano para diagnosticar al
proceso.
b) El algoritmo propuesto es eficiente en la identificación de estados de control del
proceso y en la identificación de patrones de estabilidad e inestabilidad.
c) Existe una relación demostrable entre los tipos de patrones natural y de cambio en el
nivel de la media y el tipo y forma de distribución de probabilidad de la variable
aleatoria que los genera.
d) En el patrón de cambio en el nivel de la media, se demostró que a medida que la
magnitud del cambio es grande, la distribución de probabilidad de los datos será la
mezcla de dos poblaciones normales, separadas entre sí por una magnitud proporcional
a la magnitud del cambio. Ver sección 4.7.3.
e) Los datos de un patrón natural tendrán siempre una distribución de probabilidad
normal.
f) La clasificación del patrón natural por la FuzzyARTMAP no requiere más que el
parámetro de vigilancia del módulo de salida para tener elevada eficiencia en su
predicción.
g) Es común encontrar efectos de curvatura de los parámetros de la FuzzyARTMAP, es
decir, su desempeño no es lineal.
92
h) Dado que el tipo de distribución de probabilidad de un conjunto de datos está
relacionado con el tipo de patrón que tiene, es posible explicar los casos de confusión
en la clasificación de la FuzzyARTMAP cuando los datos se distribuyen con
características similares.
i) En la clasificación del patrón natural, el parámetro vigilancia en el módulo de salida
(ρb1,2) de la FuzzyARTMAP influye fuertemente en el rango de 0.2 a 0.7 y en menor
grado en el rango 0.7 a 0.9
j) Si se considera a D como una variable aleatoria que se expresa como la diferencia
entre la variación especial y la variación natural de un conjunto de datos, mientras D
tienda a cero, la red neuronal confundirá patrones especiales con el natural.
k) Siempre se puede localizar un valor “a” tal que a partir de este, D>a, la
FuzzyARTMAP tendrá eficiencia elevada de predicción de patrón.
93
REFERENCIAS
Carpenter, G.A. & Grossberg, S. (1987). A Massively Parallel architecture for a Self-
Organizing Neural Pattern Recognition Machine. In Computer Vision, Graphics and Image
Processing, chapter. Academic Press. Inc.,54-115.
Carpenter, G.A., Grossberg, S., Markuzon, N., Reynolds, J.H., & Rosen, D.B. (1992). Fuzzy
ARTMAP: A Neural Network Architecture for Incremental Supervised Learning of Analog
Multidimensional Maps. IEEE Transactions on Neural Networks , 3 (5), 698-713.
Chang, S.I., & Aw, C.A. (1996). A Neural Fuzzy Control Chart for Detecting and Classifying
Process Mean Shifts. International Journal of Production Research , 34 (8), 2265-2278.
Chang, S.I., & Ho, E.S. (1999). A Two-Stage Neural Network Approach for Process Variance
Change Detection and Classification. International Journal of Production Research , 37 (7),
1581-1599.
Cheng, C.S. (1997). A Neural Network Approach for the Analysis of Control Chart Patterns.
International Journal of Production Research , 35 (3), 667-697.
Cheng, C.S. (1995). A Multi-Layer Neural Network Model for Detecting Changes in the
Process Mean. Computers and Industrial Engineering , 28 (1), 51-61.
Cook, D.F., Zobel, C.W., & Wolfe, M.L. (2006). Environmental Statistical Process Control
Using and Augmented Neural Network Classification Approach. European Journal of
Operational Research , 174 (3), 1631-1642.
Cook, D.F., & Chiu, C.C. (1998). Using Radial Basis Function Neural Networks to Recognize
Shifts in Correlated Manufacturing Process Parameters. IIE Transactions , 30 (3), 227-234.
De Veaux, R.D., Schumi, J., Schweinsberg, J., & Ungar, L.H. (1998). Prediction Intervals for
Neural Networks Via Nonlinear Regression. Technometrics , 40 (4), 273-282.
Evans, J.R., & M. Lindsay, W. (1993). The Management and Control of Quality. St. Paul,
MN, USA: West Publishing Company.
Guh, R.S. (2002). Robustness of the Neural Network Based Control Chart Pattern Recognition
System to Non-Normality. International Journal of Quality Realibility Management , 19 (1),
97-112.
Guh, R.S. (2005). Real-Time Pattern Recognition in Statistical Process Control: A Hybrid
Neural Network/Decision Tree-Based Approach. IMechE Part B: J. Engineering Manufacture
, 219.
94
Guh, R.S., & Hsieh, Y.C. (1999). A Neural Network Based Model for Abnormal Pattern
Recognition of Control. Computers and Industrial Engineering , 36, 97-108.
Guh, R.S., & Tannock, J.D.T. (1999). Recognition of Control chart concurrent Patterns Using
a Neural Network Approach. International Journal of Production Research , 37 (8), 1743-
1765.
Guo, Y., & Dooley, K.J. (1992). Identification of Change Structure in Statistical Process
Control. International Journal of Production Research , 30, 1655-1669.
Gutierrez- Pulido, H., y De la Vara-Salazar, R. (2004). Análisis y Diseño de Experimentos (1a.
ed.). México: Mc Graw Hill.
Hagan, M.T., Demuth, H.B., & Beale, M. (1996). Neural Network Design. Boston, MA, USA:
PWS.
Hindi, A.Al-Hindi. (2004). Control Chart Interpretation Using FuzzyARTMAP. Journal of
King Saud University. Engineering Sciences. , 16 (1), 1424.
Ho, E.S, & Chang, S.I. (1999). An Integrated Neural Network approach for Simultaneous
Monitoring of Process Mean and Variance Shifts a Comparative Study. International Journal
Production Research , 37 (8), 1881-1901.
Hwang, J.T.G., & Ding, A.A. (1997). Prediction Intervals For Artificial Neural Networks.
Journal Of The American Statistical Association , 92 (438), 748-757.
Hwarng, H.B., & Hubele, N.F. (1993). Back-Propagation Pattern Recognizers For X-Bar
Control Charts: Methodology And Performance. Computers And Industrial Engineering , 24
(2), 219-235.
Hwarng, H.B, & Chong, C.W. (1995). Detecting Process Nonrandomness Through A Fast
And Cumulative Learning ART-Based Pattern Recognizer. International Journal of
Production Research , 33 (7), 1817-1833.
Lucy-Bouler. (1993). T. L. Application To Forecasting Of Neural Network Recognition Of
Shifts And Trends In Quality Control Data. Proceedings Of The World Congress On Neural
Networks (WCNN’93) , 1, 631-633.
Montgomery, D. C. (1991). Control Estadístico de la Calidad. Iberoamérica. p.96.
Pacela, M., & Semeraro, Q. (2005). Understanding ART-Based Neural Algorithms As
Statistical Tools For Manufacturing Process Quality Control. Engineering Applications Of
Artificial Intelligence , 18, 645-662.
Pacela, M., Semeraro, Q., & Anglania, A. (2004). Manufacturing Quality Control By Means
Of A Fuzzy ART Network Trained On Natural Process Data. Engineering Applications Of
Artificial Intelligence , 17, 83-96.
95
Perry, M. B., Spoerre, J. K., & Velasco, T. (2001). Control Chart Pattern Recognition Using
Back Propagation Artificial Neural Networks. International Journal Of Production Research ,
39 (15), 3399-3418.
Ripley, B. D. (1994). Neural Networks And Related Methods For Classification. Journal Of
The Royal Statistical SocietySeries B (Methodological) , 56 (3), 409-456.
Smith, A. E. (1994). X-Bar And R Control Chart Interpretation Using Neural Computing.
International Journal Of Production Research , 32, 309-320.
Stützle, T. (1995). A Neural Network Approach To Quality Control Charts. Proceedings Of
The International Workshop On Artificial Neural Networks (IWANN'95). In: Mira, J. And
Sandoval, F. (Eds.), Lecture Notes In Computer Science. , 930, 1135-1141.
Swift, J. A. (1987). Development Of A Knowledge-Based Expert System For Control Chart
Pattem Recognition And Analysis. In Doctoral Thesis, Oklahoma State University.
Wani, M.A., & Pham, D.T. (1999). Efficient Control Chart Pattern Recognition Through
Synergistic And Distributed Artificial Neural Networks,. Proceedings of the Institution of
Mechanical Engineers, Part B: Journal of Engineering Manufacture , 213 (B2), 157-169.
Wardell, D.G., Moskowitz, H., & Plante, R.D. (1992). Control Charts in the Presence of Data
Correlation. Management Science , 38 (8), 1084-1105.
Zobel, C.W., & Cook, D.F.Q. (2004). Nottingham, An Augmented Neural Network
Classification Approach To Detecting Mean Shifts In Correlated Manufacturing Process
Parameters. International Journal Of Production Research , 42 (4), 741-758.
Zorriassantine, F., & Tannock, J.D.T. (1998). A review of neural networks for statistical
process control. Journal of Intelligent Manufacturing , 9, 209-224.
96
ANEXOS
97
ANEXO A. PROGRAMA CODIFICADOR DE DATOS HECHO EN MATLAB.
Propósito del programa: Este programa transforma un dato estandarizado dentro del intervalo
A [-9.0, +9.0] a su valor equivalente dentro del rango B [0,1].
Desarrollo matemático:
Debido a que los intervalos A y B deben ser equivalentes, y los valores extremos para A son
± 9.0 y 0.0 y +1.0 para B, entonces -9.0 debe ser transformado linealmente en 0.0 y
+9.0 en 1.0. Los rangos de A y B son, respectivamente, +9.0 -(-9.0) = 18.0 y
+1.0 - 0.0 = 1.0. Por inspección, se deduce la fórmula de transformación de un dato X del
intervalo A en su valor equivalente Y en el intervalo B, ya que, si el máximo valor de A es
X = + 9.0, para que este sea convertido a Y = +1.0, entonces será necesario:
𝑌 =𝑋 + (+9.0)
18=
𝑋 + 9.0
18
Ahora bien, generalizando los términos se tiene la fórmula de transformación de datos.
𝑌 =𝑋 + 𝐿
𝑅
donde, dados A[-9.0, +9.0] y B[0.0,1.0],
Y: Dato del intervalo A transformado a su equivalente dentro del intervalo B
X: Dato de A a ser transformado al intervalo B.
L: Valor extremo derecho del intervalo A.
R: Rango del intervalo A.
Programa: clc, clear
L=+9.0;
R=18.0;
X=[matriz de datos X];
for i=1:m
for j=1:n
Y(i,j)=(X(i,j)+L)/R;
end
end
Y
98
ANEXO B. COMPARACIÓN DE LAS PROPIEDADES ESTADÍSTICAS ENTRE
DATOS NO CODIFICADOS Y CODIFICADOS.
Descripción: Se probaron 100 datos con µ = 0 y σ = 1 y distribución normal (datos X), los
cuales fueron codificados (la codificación fue hecha sobre la estandarización) para
compararlos y observar similitudes de propiedades estadísticas. No se apreció diferencia
gráfica (ver figura B.1) ni estadística (ver tabla B.1.).
DATOS NO CODIFICADOS DATOS CODIFICADOS
X
2
1
0
-1
-2
X
0.65
0.60
0.55
0.50
0.45
0.40
0.35
X
210-1-2
X
0.650.600.550.500.450.400.35
X
Fre
cu
en
cia
1.60.80.0-0.8-1.6-2.4
20
15
10
5
0
X
Fre
cu
en
cia
0.600.550.500.450.400.35
20
15
10
5
0
Figura B.1. Comparación gráfica de los datos codificados y no codificados
99
Tabla B.1. Comparación estadística entre datos codificados y no codificados.
ESTADÍSTICAS DATOS NO CODIFICADOS DATOS CODIFICADOS
Media 0.0572 0.50357
Desviación estándar 0.8690 0.0543
Valor mínimo -2.2476 0.35950
Valor máximo 2.1764 0.63600
Sesgo 0.0000 0.0000
Kurtosis -0.1700 -0.1700
100
ANEXO C. EXPLORACIÓN PRELIMINAR PARA UBICAR AL ÁREA DE
FACTIBILIDAD EXPERIMENTAL CON VECTORES DE TAMAÑO PEQUEÑO.
Descripción: Se replicó la investigación hecha por Hindi (2004), con la diferencia de que aquí
se usó la técnica de diseño de experimentos.
Desarrollo de la experimentación: Los valores considerados en este experimento para µ y σ
fueron, respectivamente, 0 y 3 y 1 y 3, por lo que se obtienen 4 familias de patrones naturales:
a. Familia 1, µ = 0 y σ = 1, que denota un proceso en estado de control.
b. Familia 2, µ = 3 y σ = 1, que denota un proceso en estado fuera de control por cambio
en la media de los datos.
c. Familia 3, µ = 0 y σ = 3, que denota un proceso en estado fuera de control por cambio
en la variación de los datos.
d. Familia 4, µ = 3 y σ = 3, que denota un proceso en estado fuera de control por cambio
en la media y en la variación de los datos.
La generación de los datos por cada familia, tanto para los vectores de entrenamiento como
para los de prueba de la red neuronal, así como su codificación se hicieron conforme a lo
indicado en las secciones 5.2 a 5.5 de esta tesis. Las diferencias son el tamaño del vector de
datos y el número de vectores empleados para el entrenamiento y la prueba. Aquí se
emplearon, por familia, 50 vectores para entrenamiento y 25 para la prueba, todos con 8
datos.
El diseño del experimento empleado fue el mismo que se muestra en la tesis (ver tabla 5.12),
con excepción del punto central. Los datos experimentales se muestran en la tabla C.1., el
análisis de idoneidad en la figura C.1. y la gráfica de efectos significativos en la figura C.2.
101
Tabla C.1. Datos experimentales de exploración inicial con la red neuronal.
Número
de
corrida
ρa1 ρab1 β1 ρb1,2 ρab2 β2 ρa2
RÉPLICA
EFICIENCIA
(%)
1 2
1 0.2 0.2 0.2 0.8 0.8 1.0 0.2 30.0 27.0
2 0.8 0.2 0.2 0.2 0.2 1.0 0.8 0.0 0.0
3 0.2 0.8 0.2 0.2 0.8 0.2 0.8 0.0 0.0
4 0.8 0.8 0.2 0.8 0.2 0.2 0.2 10.0 5.0
5 0.2 0.2 1.0 0.8 0.2 0.2 0.8 0.0 0.0
6 0.8 0.2 1.0 0.2 0.8 0.2 0.2 10.0 8.0
7 0.2 0.8 1.0 0.2 0.2 1.0 0.2 39.0 32.0
8 0.8 0.8 1.0 0.8 0.8 1.0 0.8 0.0 0.0
Residual
Po
rce
nta
je
420-2-4
99
90
50
10
1
Valor ajustado
Re
sid
ua
l
403020100
4
2
0
-2
-4
Residual
Fre
cu
en
cia
43210-1-2-3
10.0
7.5
5.0
2.5
0.0
Orden de observación
Re
sid
ua
l
16151413121110987654321
4
2
0
-2
-4
Gráfica de probabilidad normal de los residuales Residuales vs valor ajustado
Histograma de residuales Residuales vs orden de corrida
Figura C.1. Análisis de idoneidad.
102
Efectos estandarizados
Po
rce
nta
je
1050-5-10-15-20
99
95
90
80
70
60
50
40
30
20
10
5
1
G
F
D
C
A
Gráfica de probabilidad normal de efectos estandarizados(Alpha = .10)
Figura C.2. Efectos significativos.
De todo lo anterior se observa:
a. Hay evidencia para asumir que el modelo no es idóneo, pues se violan los principios de
normalidad y de varianzas constantes.
b. No obstante, se pueden ver resultados indicativos importantes, como que hay factores
que pueden no ser significativos en la respuesta, como son ab1 y ab2.
Por lo anterior se analiza la gráfica de efectos principales (ver figura C.3.)
Efi
cie
ncia
me
dia
0.80.2
20
10
0
0.80.2 1.00.2
0.80.2
20
10
0
0.80.2 1.00.2
0.80.2
20
10
0
BV 1 RM 1 B 1
V RM 2 B2
BV 2
Efectos medios principales
Figura C.3. Efectos principales.
A: ρa1
B: ρab1
C: β1
D: ρb1,2
E: ρab2
F: β2
G: ρa2
Tipo de efecto
No significativo
Significativo
ρa1 ρab1 β1
ρb1,2 ρab2 β2
ρa2
103
Donde se confirma el bajo efecto de dichos factores. Además, en esta gráfica es posible
observar que:
a. a1, a2 y b1,2 actúan mejor en su nivel bajo.
b. β1 y β2 tienen mejor desempeño en el nivel alto.
Con lo que se obtiene como conclusión la necesidad de probar un campo de operación de los
factores y niveles mostrados en la tabla C.2.
Tabla C.2. Factores y niveles que determinan el campo de operación de la RAN
FACTOR NIVEL BAJO NIVEL ALTO
a1 0.2 0.5
a2 0.2 0.5
b1,2 0.2 0.5
β1 0.5 1.0
β2 0.5 1.0
Con estos factores y niveles se corre un experimento con las siguientes características:
Número de Factores: 5
Número de corridas: 16
Número de réplicas: 2
Resolución: III
Tipo de diseño: 25 fracción ¼
Diseño generador de alias: D=AB, E=AC
Estructura de alias:
A + BD + CE + ABCDE
B + AD + CDE + ABCE
C + AE + BDE + ABCD
D + AB + BCE + ACDE
E + AC + BCD + ABDE
BC + DE + ABE + ACD
BE + CD + ABC + ADE
104
Corridas experimentales (tabla C.3.)
Tabla C.3. Corridas experimentales.
a1 a2 b1,2 β1 β2
0.5 0.2 0.2 0.5 0.5
0.5 0.5 0.5 1 1
0.2 0.5 0.5 0.5 0.5
0.2 0.2 0.5 1 0.5
0.5 0.2 0.5 0.5 1
0.2 0.5 0.2 0.5 1
0.5 0.5 0.2 1 0.5
0.5 0.2 0.2 0.5 0.5
0.5 0.5 0.2 1 0.5
0.2 0.5 0.2 0.5 1
0.2 0.2 0.2 1 1
0.2 0.2 0.2 1 1
0.5 0.5 0.5 1 1
0.5 0.2 0.5 0.5 1
0.2 0.2 0.5 1 0.5
0.2 0.5 0.5 0.5 0.5
Así, se obtienen los resultados experimentales indicados en la tabla C.4.
Tabla C.4. Datos experimentales.
CORRIDA
NÚMERO a1 a2 b1,2 β1 β2
RÉPLICA
EFICIENCIA (%)
1 2
1 0.2 0.2 0.2 1 1 39.0 32.0
2 0.5 0.2 0.2 0.5 0.5 13.0 11.0
3 0.2 0.5 0.2 0.5 1 11.0 10.0
4 0.5 0.5 0.2 1 0.5 9.0 10.0
5 0.2 0.2 0.5 1 0.5 14.0 13.0
6 0.5 0.2 0.5 0.5 1 7.0 5.0
7 0.2 0.5 0.5 0.5 0.5 13.0 12.0
8 0.5 0.5 0.5 1 1 7.0 3.0
Cuyo análisis genera las gráficas de idoneidad (figura C.4.) y de efectos significativos (figura
C.5.) mostrados a continuación.
105
Residual
Po
rce
nta
je
420-2-4
99
90
50
10
1
Valor ajustado
Re
sid
ua
l
40302010
4
2
0
-2
-4
Residual
Fre
cu
en
cia
43210-1-2-3
6.0
4.5
3.0
1.5
0.0
Orden de corridas
Re
sid
ua
l
16151413121110987654321
4
2
0
-2
-4
Gráfica de probabilidad normal Residuales vs valores ajustados
Histograma Residuales vs orden de corridas
Análisis de residuales
Figura C.4. Análisis de idoneidad.
Efectos estandarizados
Po
rce
nta
je
5.02.50.0-2.5-5.0-7.5-10.0
99
95
90
80
70
60
50
40
30
20
10
5
1
BE
BC
D
C
B
A
Efectos estandarizados(Alpha = .05)
Figura C.5. Efectos significativos estandarizados.
A: ρa1
B: ρab1
C: β1
D: ρb1,2
E: ρab2
F: β2
G: ρa2
Tipo de efecto
No significativo
Significativo
106
Con la ANOVA (tabla C.5) y efectos principales (figura C.6):
Tabla C.5. Análisis de varianza.
FUENTE DE
VARIACIÓN GRADOS DE
LIBERTAD SUMA DE
CUADRADOS CUADRADOS
MEDIOS F p
Efectos principales 5 989.31 197.862 41.11 0.000 Interacciones 2 289.13 144.563 30.04 0.000 Error 8 38.50 4.813 Total 15 1316.94
Efi
cie
ncia
me
dia
0.50.2
17.5
15.0
12.5
10.0
0.50.2
0.50.2
17.5
15.0
12.5
10.0
1.00.5
BV1 BV2
V LR 1
Efectos principales
Figura C.6. Efectos principales.
Con lo anterior se aprecia idoneidad del modelo por lo que los resultados son confiables. Se
asume ahora que los factores significativos son a1, a2, b1,2 y β1, a los niveles 0.2, 0.2, 0.2 y
1.0, respectivamente, aunque sus efectos están confundidos. Sin embargo, a estos niveles es
muy baja la eficiencia de la red neuronal. Se experimenta ahora tomando un tamaño 15 de
vector, a diferencia de los 8 considerados, teniendo así los resultados experimentales
mostrados en el anexo D.
β1 ρb1,2
ρa1 ρa2
107
ANEXO D. EXPLORACIÓN PRELIMINAR PARA UBICAR AL ÁREA DE
FACTIBILIDAD EXPERIMENTAL CON VECTORES DE TAMANO GRANDE.
Se corrió el experimento mostrado en la tabla D.1. Este experimento se corrió como un diseño
fraccionado a 5 factores con dos niveles. Los efectos estandarizados se pueden observar en la
figura D.1, el análisis de idoneidad en la figura D.2. y la ANOVA en la tabla D.2.
Tabla D.1. Datos experimentales.
CORRIDA
NÚMERO a1 a2 b1,2 β1 β2
RÉPLICA
1 2
1 0.2 0.2 0.2 1 1 27 26
2 0.5 0.2 0.2 0.5 0.5 23 25
3 0.2 0.5 0.2 0.5 1 16.5 15
4 0.5 0.5 0.2 1 0.5 21 21.5
5 0.2 0.2 0.5 1 0.5 45 43.5
6 0.5 0.2 0.5 0.5 1 39 37
7 0.2 0.5 0.5 0.5 0.5 24.5 25
8 0.5 0.5 0.5 1 1 19 21.5
Efectos estandarizados
Po
rce
nta
je
20100-10-20
99
95
90
80
70
60
50
40
30
20
10
5
1
BE
BC
E
D
C
B
A
Gráfica de probabilidad normal de efectos estandarizados( Alpha = .05)
Figura D.1. Efectos estandarizados.
A: ρa1
B: ρab1
C: β1
D: ρb1,2
E: ρab2
F: β2
G: ρa2
Tipo de efecto
No significativo
Significativo
108
Residual
Po
rcie
nto
210-1-2
99
90
50
10
1
Valor ajustado
Re
sid
ua
l
403020
1.0
0.5
0.0
-0.5
-1.0
Residual
Fre
cu
en
cia
1.51.00.50.0-0.5-1.0
4
3
2
1
0
Orden de corrida
Re
sid
ua
l
16151413121110987654321
1.0
0.5
0.0
-0.5
-1.0
Gráfica de probabilidad normal Residuales vs valor ajustado
Histograma Residuales vs orden de corrida
Análisis de residuales
Figura D.2. Análisis de idoneidad.
Tabla D.2. Análisis de varianza.
FUENTE
GRADOS
DE
LIBERTAD
SUMA DE
CUADRADOS CUADRADOS
MEDIOS F p
Efectos principales 5 1124.95 224.91 177.77 0.000 Interacciones dobles 2 150.78 75.391 59.57 0.000 Residual Error 8 10.13 1.266 Total 15 1285.86
Finalmente, los efectos son:
Constante 12.1806
a1 -6.45833
a2 19.5139
b1,2 79.3056
β1 4.87500
β2 0.41667
a2 *b1,2 -131.944
a2 * β2 -20.8333
109
De todo lo anterior, se concluye que el experimento es válido e indica que hay efectos e
interacciones significativas.
Por lo que se puede deducir:
a) Es mejor un tamaño grande del vector.
b) La red es más eficiente para detectar cambios grandes.
c) Casi todos los factores influyen, además de sus interacciones.
d) a1 aplica a nivel bajo para detectar cambios pequeños y en nivel alto para cambios
grandes.
e) β1 no cambia, por lo que se queda fijo en nivel alto.
f) b1,2 es cambiante.
g) β2 es cambiante.
h) a2 no cambia, por lo que se queda fijo en nivel bajo.
110
ANEXO E. EVOLUCIÓN DE LA EFICIENCIA DE LA RED NEURONAL EN LA
CLASIFICACIÓN DE PATRONES
En el artículo denominado “On the use of the FuzzyARTMAP Neural Network for Pattern
Recognition in Statistical Process Control using a Factorial Design” de los autores J. A.
Vázquez López, I. López Juárez y M. Peña Cabrera, aceptado para publicación en The
International Journal of Computers, Communications & Control al volúmen V-2010, se
muestra la experimentación realizada para observar cómo evoluciona la eficiencia de la red
neuronal en la clasificación de patrones especiales, en función del tamaño del efecto de la
causa especial de variación. Aquí se muestran las condiciones de operación de la
FuzzyARTMAP adecuadas para maximizar la eficiencia (tabla E.1.) y algunos de los
resultados obtenidos (figura E.1 a y b).
Tabla E.1. Operación de la FuzzyARTMAP
FACTOR NIVEL
ÓPTIMO
a1 0.8
ab1 0.2
β1 1.0
b1,2 0.8
ab2 0.2
β2 0.2
a2 0.6
(a) Patrón Cambio en el nivel de la media.
111
(b) Patrón Tendencia
Figura E.1. Evolución de la eficiencia para vectores de tamaño pequeño.
La eficiencia en la predicción del patrón natural quedó en 30%, debido al tamaño pequeño del
vector y a la combinación de los patrones especiales.
112
ANEXO F. ARTÍCULOS
Durante el desarrollo de la investigación, los siguientes artículos han sido publicados o
aceptados para su difusión científica:
J. A. Vázquez-López, I. López-Juárez, M. Peña-Cabrera
On the use of the FuzzyARTMAP Neural Network for Pattern Recognition in Statistical
Process Control using a Factorial Design. International Journal of Computers,
Communications & Control. (En prensa).
J. A. Vázquez-López, I. López-Juárez, M. Peña-Cabrera
Aplicación del diseño experimental en la red neuronal FuzzyARTMAP para el reconocimiento
de patrones estadísticos especiales. XVIII Congreso de la Asociación Chilena de Control
Automático (ACCA). IFAC-IEEE-Chile, Santiago de Chile, 10-12 Diciembre 2008.
J. A. Vázquez-López, I. López-Juárez
SPC without control limits and normality assumption: A new method.
14th Iberoamerican congress on pattern recognition. Noviembre 15-18, 2009. (Aceptado).
J. A. Vázquez-López, I. López-Juárez
Estimación de estados de control empleando diseño experimental y redes neuronales.
Congreso Nacional 2009 de la Asociación de México de Control Automático. Septiembre 30 a
Octubre 2, 2009. (Aceptado).
113
ANEXO G. ALGORITMOS EMPLEADOS PARA LA IMPLEMENTACIÓN DE LA
RED FUZZYARTMAP
ART-1
En la Figura G.1 se puede observar la arquitectura ART-1, la cual consiste en dos capas, F1 y
F2. F1, con el vector de salida X ≡ (x1, . . . , xm), registra el vector de entradas F0 → F1
en I ≡ (I1, . . . , Im). Cada neurona en la capa F1 está conectada a una neurona de la capa F2 a
través de los pesos adaptables Zij. El índice i indica que la conexión va desde la i-ésima
neurona en F1 a la j-ésima neurona de la capa F2.
Figura G.1. Arquitectura de la ART-1
Elección de F2
Sí se denota a Tj como el total de las entradas de F1 al j-ésimo nodo en F2, entonces, se puede
decir que:
𝑇𝑗 = 𝑥𝑖
𝑀
𝑖=1
𝑍𝑖𝑗 (𝐺. 1)
donde j = 1, . . . , N.
Sí algún Tj > 0, entonces el índice j de la elección de F2 está dado por Tj = max Tj : j = 1 . . .N,
donde j se define de manera que la salida de la capa F2 sea cero, excepto para el nodo con la
máxima activación. Entonces, y = (y1, . . . , yN) tiene como salida
114
𝒚𝒋 = 𝟏 𝒔𝒊 𝒋 = 𝑱𝟎 𝒔𝒊 𝒋 ≠ 𝑱
(𝐺. 2)
Resonancia o restablecimiento
Cada nodo de F2 está conectado a todos los nodos de F1 a través de las conexiones zji, las
cuales contienen valores binarios. Así, el i-ésimo nodo de entrada que viene de F1 es la capa
de F2 siguiente.
N
j
ijjii yZV1
(G.3)
donde i = 1, . . . ,M.
Este sistema de vigilancia está compuesto por el comparador que se muestra en la Figura 2, el
cual controla la disparidad tolerada entre las señales de subida (actividad) y bajada
(aprendizaje esperado). En otras palabras, compara la norma del Vector X respecto a la norma
del vector ρI, donde ρ ε [0, 1] el cual es el parámetro de vigilancia.
La norma ℓ1 del vector a = (a1, . . . , aM) se puede obtener por:
M
i
iaa1
(G.4)
El Vector X está definido por:
xi = ViIiX = V ∩ I = zj ∩ I (G.5)
Dependiendo del resultado de esta comparación, el sistema de vigilancia puede restablecer la
neurona actual activa y buscar otra neurona o modificar los pesos.
115
Aprendizaje
El aprendizaje se produce sí el parámetro de vigilancia se cumple para la neurona elegida J, es
decir:
I
Iz j (G.6)
Los pesos de las conexiones son modificadas por:
nueva
j
nueva
jnueva
j
anterior
j
neeva
jzL
LzZzIz
1 (G.7)
Las ecuaciones anteriores son para aprendizaje rápido, las cuales usan la forma algebraica de
las ecuaciones diferenciales no-lineales para LTM (Long Term Memory) Carpenter y
Grossberg (1992). Para la implementación del ART-1, solo son necesarios dos parámetros: ρ y
L.
Fuzzy ART (FA)
El sistema FAM (FuzzyARTMAP) incorpora dos módulos tipo FA, ARTa y ARTb, por lo cual
se hace la descripción de los sistemas tipo FA antes de mencionar el FAM. Cada sistema
Fuzzy ART incluye (i) una capa F0 de nodos, los cuales representan al vector de entradas
actuales y (ii) una capa F1, la cual recibe las entradas de subida F0 y las de bajada F2, que
representan la neurona activa o categoría. El vector F0 se puede escribir como I = (I1, . . . , IM),
con cada componente Ii en el intervalo [0, 1], donde i = 1, . . . ,M. El vector F1 se puede
escribir como x = (x1, . . . , xM) y el vector F2 como y = (y1, . . . , yM).
116
Parámetros
La dinámica de la red tipo Fuzzy ART está determinada por (i) el parámetro de
elección α, (donde α > 0), (ii) un parámetro de aprendizaje β, (donde β ε [0, 1]) y (iii)
un parámetro de vigilancia ρ, (donde ρ ε [0, 1]).
Elección de categoría
Para cada entrada I y cada nodo de F2, la función de elección Tj está definida por:
j
j
jW
WIIT
)( (G.8)
donde el operador está definido por (p q)i = min(pi,q1) y la norma ∙ esta dado por
M
i
ipp1
(G.9)
La selección de una categoría, se realiza cuando al menos un nodo de F2 puede llegar a ser
activo, la categoría seleccionada está dada por J donde Tj = max(Tj : j = 1, . . . ,N).
Sí más de un Tj es máxima, se selecciona la categoría con el índice j menor. En el sistema de
selección, el vector de activación F1 está definido por la ecuación:
𝑋 = 𝐼 𝑠𝑖 𝐹2 𝑒𝑠𝑡𝑎 𝑖𝑛𝑎𝑐𝑡𝑖𝑣𝑎𝐼∇𝑤𝑗 𝑠𝑖 𝑒𝑙 𝑗 − 𝑒𝑠𝑖𝑚𝑜 𝑛𝑜𝑑𝑜 𝑑𝑒 𝐹2 𝑒𝑠𝑡𝑎 𝑎𝑐𝑡𝑖𝑣𝑜
(𝐺. 10)
Resonancia
La resonancia ocurre sí la función |I ∇ wJ |/|I| de la categoría seleccionada J cumple con el
criterio de vigilancia.
117
jI w
I (G.11)
Esto es, cuando la J-ésima categoría es seleccionada, la resonancia ocurre sí:
jx I w I (G.12)
El aprendizaje se produce como se muestra en la ecuación
jI w
I (G.13)
Aprendizaje
Una vez que la búsqueda finaliza, los pesos del vector wJ se establecen de acuerdo a la
ecuación:
( ) (1 )nueva nueva anterior
j j jw I w w (G.14)
Un aprendizaje rápido corresponde a β = 1.0
FuzzyARTMAP (FAM)
En el sistema (FAM), los módulos ARTa y ARTb están unidos por medio de un modulo
inter − ART Fab
, llamado map-field, como se muestra en la Figura 7.2. La red neuronal tipo
FuzzyARTMAP tiene dos módulos Fuzzy ART, uno que maneja las entradas y el segundo para
las salidas, ARTa y ARTb. También tiene un campo de correspondencia Fab el cual vincula las
entradas con las salidas.
Para el entrenamiento, un patrón en forma de vector se presenta en ARTa y en el vector
correspondiente de entrada en ARTb. En pocas palabras, la red neuronal recibe un vector a el
118
cual deduce a que categoría corresponde y con el segundo vector confirma o refuta la
hipótesis.
Figura G.2. Arquitectura de la red tipo FuzzyARTMAP
Algoritmo de FAM
Como el FuzzyARTMAP utiliza dos módulos tipo Fuzzy ART entonces se tiene que:
a: vector de entradas
ρ: parámetro de vigilancia
M: número de elementos en a
β: parámetro de aprendizaje.
Donde el algoritmo esta dado por los siguientes pasos:
1) Inicializar todos los pesos a 1.0 y poner los nodos de F2 en valor neutro (no empleados).
119
2) Aplicar código complementario al vector a M − dimensional para obtener
I (a, ac) = (a1, . . . , aM, ac1, . . . , acM), donde aci = 1 − ai, para i = 1, . . . ,M
3) Para todos los nodos de F2, calcular la función de elección, para el vector I y el j-ésimo
nodo de F2. La función de selección es:
( )j
j
j
I wT I
w
(G.15)
Donde wj es el vector de pesos para el nodo j y α es el parámetro de selección. El operador
fuzzy ∇ está definido por (p ∇ q)i = min(pi, qi) y la norma | ・ | está definida por
1
M
i
i
P p
(G.16)
4) Encontrar el nodo J de F2 con la función de selección máximo TJ = maxTj : j = 1, . . . ,N.
La salida del vector Y de F2 está dada por yJ = 1 y yj = 0 para j ≠ J.
5) Verificar sí existe resonancia, sí el nodo seleccionado J satisface
jI w
I
(G.17)
Sí existe resonancia, entonces se deben modificar los pesos de wj, como
( ) (1 )nueva anterior anterior
J j Jw I w w . De otra manera poner la función de selección TJ a 0
(cero).
6) Repetir los pasos (4) y (5) hasta que la ecuación de vigilancia sea alcanzada.
7) Para un nuevo patrón realizar los pasos del (2) al (6)
120
Durante el proceso de entrenamiento, el proceso de aprendizaje se desactiva en ARTa
(β = 0). El parámetro de vigilancia ρa del ARTa varia durante el aprendizaje. Inicialmente ρa es
conocido como base de vigilancia y ρb es puesto a 1.0 para distinguir sin problemas las salidas
deseadas.
Cuando los vectores a (entrada) y b (salida) están presentes en ARTa y ARTb, respectivamente,
un criterio de vigilancia es evaluado para verificar sí la neurona ganadora de ARTa
corresponde al vector de salida usado.
b ab
j
abb
y w
y
(G.18)
Donde yb
es el vector de salida del ARTb (patrón actual activo en F2b), J es el índice de la
neurona ganadora en F2a, ab
Jw son los pesos de las conexiones a la j-ésima neurona de F2a y ρa
es el parámetro de vigilancia del campo correspondiente.
Cuando se conoce un criterio de vigilancia, la nueva asociación es aprendida entre los vectores
a y b modificando los pesos utilizando la ecuación siguiente
(1 )ab ab ab
J ab Jw x w (G.19)
Y los pesos del ARTa también son modificados utilizando la ecuación
( ) (1 )nueva anterior anterior
J j Jw I w w (G.20)