DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA VARIABLES … · 2017-09-14 · 0 desarrollo...

0

DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA

VARIABLES ALEATORIAS CON DISTRIBUCIÓN SIMÉTRICA O

ASIMÉTRICA, BASADO EN EL RECONOCIMIENTO DE PATRONES

POR REDES NEURONALES ARTIFICIALES.

Tesis

QUE PARA OBTENER EL GRADO ACADÉMICO DE

Doctor en Ciencia y Tecnología

en la especialidad de

Ingeniería Industrial y de

Manufactura

PRESENTA

José Antonio Vázquez López

León, Guanajuato, México, Agosto del 2009

1

RESUMEN

Los gráficos de control de medias y rangos y de la fracción de disconformes usados en el

control estadístico de procesos son herramientas importantes para el mejoramiento de la

calidad de la producción. Los principios de dichas herramientas fueron desarrollados en los

años 1920’s y han sido implementados en las empresas manufactureras desde entonces. No

obstante su trascendental aplicación, se reconoce que tienen limitaciones prácticas ya que

dependen de la apreciación y juicio humano además de considerar a la variable aleatoria con

distribución de probabilidad normal (simétrica), para el establecimiento de sus límites de

control. Los procesos de manufactura modernos, han generado cambios en la forma de la

distribución de probabilidad de las variables aleatorias, pasando de aproximadamente

normales con dispersión moderada a sesgadas con baja dispersión; lo que genera problemas

importantes para la implementación y uso de éstos gráficos de control.

En recientes investigaciones, soluciones alternas se han observado mediante el empleo de

herramientas de inteligencia artificial como son las Redes Neuronales Artificiales. Aunque las

investigaciones mencionadas son amplias y demostrativas de esto, se debe reconocer que estos

estudios aun se encuentran en fase de experimentación con datos simulados en el

reconocimiento de patrones de variación de los datos.

En esta investigación se propone un método novedoso de control estadístico de procesos que

es alterno a los gráficos de control de medias y rangos y de la fracción disconforme. Este

método se basa en el reconocimiento de patrones del proceso de manufactura, en los estados

de control y fuera de control del proceso. Se propone el uso de la red neuronal

FuzzyARTMAP, cuyos parámetros han sido determinados a través de diseño de experimentos

para identificar niveles significativos de eficiencia. El método de control estadístico aquí

propuesto ha sido validado experimentalmente con datos simulados por el método de Monte

Carlo y por su aplicación a dos casos de empresas diferentes entre sí, lo que demuestra que el

método desarrollado no recurre a supuestos de normalidad ni a juicios humanos para

determinar si el proceso de manufactura se encuentra o no en control estadístico.

2

ABSTRACT

3

DEDICATORIA

4

AGRADECIMIENTOS

5

ÍNDICE GENERAL

RESUMEN………………………………………………………………………………… 1

ABSTRACT……………………………………………………………………………….. 2

DEDICATORIA…………………………………………………………………………… 3

AGRADECIMIENTOS……………………………………………………………………. 4

1. INTRODUCCIÓN………………………………………………………………………

10

1.1. Gráficos de control……………………………………………………………….. 13

1.2. Control estadístico de procesos y RNA………………………………………… 16

1.3.Contribución original……….…………………………………………………… 18

1.4.Organización de la tesis…….…………………………………………………… 19

2. DEFINICIÓN DEL TEMA………………………………………………………………. 21

2.1. Hipótesis de investigación….…………..…………………………………………. 21

2.2. Alcance de la investigación……………………………………………………… 21

3. JUSTIFICACIÓN Y OBJETIVOS………………………………………………………. 22

3.1. Justificación……………………………..………………………………….…….. 22

3.2. Objetivos………………………………….……..………………………………… 23

4. FUNDAMENTACIÓN…………………………………………………………………... 24

4.1. Redes neuronales artificiales…………………………………………….………… 24

4.2. Breve historia………….………………………………………..…………………. 26

4.3. Retropropagación……………………….…………………………………………. 28

4.4. FuzzyARTMAP………….……………………………………………………….. 29

4.4.1. Parámetros de la FuzzyARTMAP y nomenclatura.……………………….. 31

4.5. Investigaciones recientes…………………………………………………………. 31

4.5.1. Reconocimiento del patrón natural mediante redes neuronales…………… 31

4.5.2.Reconocimeinto de patrones natural y especiales mediante redes

neuronales………………………………………………………………….. 32

4.6. Bases estadísticas de la redes neuronales…………………………………………. 35

4.7. Tipos de patrones especiales……………………………………………………… 36

4.7.1. Simulación de X por Monte Carlo…………………………………………. 37

4.7.2. Patrón natural en estados de control y fuera de control estadístico………... 38

4.7.3. Patrón de cambio superior en la media…………………………………….. 40

4.7.4. Patrón de cambio inferior en la media…………………………………….. 43

4.7.5. Patrón de tendencia creciente……………………………………………... 43

4.7.6. Patrón de tendencia decreciente…………………………………………… 44

5. PROCEDIMIENTO EMPLEADO Y RESULTADOS OBTENIDOS………………….. 46

5.1. Especificación de los valores de µ y σ para el patrón natural……………………. 47

5.2. Generación de vectores de datos del patrón natural………………………………. 47

5.3. Codificación de los datos del patrón natural……………………………………… 47

5.4. Entrenamiento de la FuzzyARTMAP para el patrón natural…………………… 48

5.5. Prueba de la FuzzyARTMAP para el patrón natural……………………………… 49

6

5.6. Aplicación del Diseño Experimental para el patrón natural……………………… 49

5.6.1. Diseño del experimento…………………………………………….……… 49

5.6.2. Análisis de varianza para el experimento con el patrón natural……………. 50

5.6.3. Determinación de efectos principales y de coeficientes…………………… 52

5.6.4. Análisis gráfico del experimento sobre el patrón natural………………… 52

5.6.5. Optimización de la eficiencia de la red neuronal………………………… 57

5.6.6. Validación experimental…………………………………………………… 58

5.6.7. Comparación con otros estudios…………………………………………… 58

5.7. Especificación de los valores del efecto de variación especial…………………… 59

5.7.1. Cambio superior e inferior en el nivel de la media………………………… 60

5.7.2. Tendencia creciente y decreciente…………………………………………. 60

5.8. Generación de vectores de datos de patrones especiales………………………….. 61

5.9. Codificación de los datos de los patrones especiales…………………………… 61

5.10. Entrenamiento de la FuzzyARTMAP para los patrones especiales…………… 62

5.11. Prueba de la FuzzyARTMAP para los patrones especiales……………………… 62

5.12. Aplicación del Diseño Experimental para patrones especiales………………… 63

5.12.1. Diseño del experimento………………………………………………… 63

5.12.2. Análisis de Varianza……………………………………………………… 63

5.12.3. Efectos y coeficientes…………………………………………………… 64

5.12.4. Análisis grafico…………………………………………………………… 64

5.12.5. Validación experimental………………………………………………… 67

6. MÉTODO PROPUESTO DE CONTROL ESTADÍSTICO DE PROCESOS………… 68

6.1. Método propuesto de control de procesos por reconocimiento de patrones………. 68

6.2. Determinación de causas especiales de variación………………………………… 72

6.3. Validación del algoritmo de identificación de la estabilidad del proceso………… 73

7. CONCLUSIONES……………………………………………………………………… 91

REFERENCIAS……………………………………………………………………………..

93

ANEXO A. Programa codificador de datos hecho en MATLAB………………….……… 97

ANEXO B. Comparación de las propiedades estadísticas entre datos no codificados y

codificados……………………………………………………………………. 98

ANEXO C. Exploración preliminar para ubicar al área de factibilidad experimental con

vectores de tamaño pequeño………………………………………………… 100

ANEXO D. Exploración preliminar para ubicar al área de factibilidad experimental con

vectores de tamaño grande…………………………………………………… 107

ANEXO E. Evolución de la eficiencia de la red neuronal en la clasificación de patrones….. 110

ANEXO F. Artículos………………………………………………………………………… 112

ANEXO G. Algoritmos empleados para la implementación de la red FuzzyARTMAP……. 113

7

LISTA DE FIGURAS

Figura 1.1. Importancia de la simetría de X para el establecimiento de los límites de

control……………………………………………………………………… 15

Figura 4.1. Red neuronal biológica…………………………………………………….. 25

Figura 4.2. Representación de una red neuronal……………………………………… 28

Figura 4.3 Arquitectura FuzzyARTMAP. ………………………….…………..…… 29

Figura 4.4 Arquitectura básica ART………………………………………………… 30

Figura 4.5 Arquitectura del sistema híbrido para el reconocimiento de patrones…….. 33

Figura 4.6 Forma típica del patrón natural…………………………………………….. 38

Figura 4.7 Forma típica de la distribución normal…………………………………… 39

Figura 4.8 Elementos del patrón cambio superior de la media……………………… 41

Figura 4.9 Mezcla de poblaciones normales del patrón cambio superior del nivel de la

media……………………………………………………………………….. 42

Figura 4.10 Patrón de cambio inferior en la media……………………………………... 43

Figura 4.11 Patrón de tendencia creciente………………………………………………. 43

Figura 4.12 Asociación del patrón de tendencia creciente con la distribución de

probabilidad de X (d = 1,2 y 3)……………………………………………. 44

Figura 4.13 Patrón de tendencia decreciente……………………………………………. 45

Figura 5.1 Efectos significativos del experimento con el patrón natural……………… 53

Figura 5.2 Magnitud de los efectos de los factores de variación del experimento con el

patrón natural………………………………………………… 54

Figura 5.3 Residuales contra orden de corrida experimental para el experimento con

el patrón natural………………………………………………… 55

Figura 5.4 Residuales contra el factor ρab del experimento con el patrón natural…….. 55

Figura 5.5 Residuales contra valores ajustados del factor ρab del experimento con el

patrón natural………………………………………………………………. 56

Figura 5.6 Gráfica de probabilidad normal de los residuales del experimento con el

patrón natural……………………………………………………………….. 56

Figura 5.7 Efectos de los factores significativos de la experimentación con patrones

especiales…………………………………………………………………… 65

Figura 5.8 Residuales contra el orden de las corridas experimentales de la

experimentación con patrones especiales…………………………………... 66

Figura 5.9 Residuales contra valor ajustado de la experimentación con patrones

especiales…………………………………………………………………… 66

Figura 5.10 Gráfica de probabilidad normal de los residuales del experimento con

patrones especiales………………………………………………………… 66

Figura 6.1 Método de control de procesos…………………………………………….. 68

Figura 6.2 Algoritmo de control del proceso………………………………………….. 69

Figura 6.3 Gráficas de los 21 vectores X de la empresa del caso 1…………………… 79

Figura 6.4 Forma sesgada de la distribución de probabilidad para el caso de

validación 1………………………………………………………………… 81

Figura 6.5 Análisis de idoneidad de las comparaciones de las medias de las muestras.. 88

8

LISTA DE TABLAS

Tabla 4.1 Resumen de resultados de investigaciones previas en la clasificación del

patrón natural a valores diferentes de µ y σ Hindi (2004)……………… 32

Tabla 4.2 Resumen de resultados de investigaciones previas en la clasificación del

patrón natural a valores diferentes de µ y σ Guh R.S. (2005)………..… 34

Tabla 4.3 Combinaciones de los parámetros de la distribución normal…………… 40

Tabla 5.1 Asociación binaria para entrenamiento de red neuronal………………… 48

Tabla 5.2 Resumen del diseño experimental para el patrón natural……………… 49

Tabla 5.3 Listado de corridas experimentales para el patrón natural……………… 50

Tabla 5.4 Análisis de varianza para el patrón natural……………………………… 51

Tabla 5.5 Tabla de efectos principales y coeficientes del modelo experimental…… 52

Tabla 5.6 Optimización de la eficiencia de la red neuronal en la clasificación del

patrón natural……………………………………………………………. 57

Tabla 5.7 Valores de los parámetros de la red neuronal que maximizan su eficiencia 58

Tabla 5.8 Resultados de la prueba confirmatoria de resultados…………………… 58

Tabla 5.9 Comparación de los resultados de esta investigación con un estudio

similar……………………………………………………………………... 59

Tabla 5.10 Tipo de distribución del vector X a distintos valores de “d”……………… 60

Tabla 5.11 Asociación del patrón especial con el código binario para el

entrenamiento de la FuzzyARTMAP…………………………………… 62

Tabla 5.12 Resumen del experimento para clasificar patrones especiales………… 63

Tabla 5.13 ANOVA para el experimento de clasificación de patrones especiales…… 64

Tabla 5.14 Tabla de efectos principales y coeficientes del modelo experimental para

patrones especiales……………………………………………………… 64

Tabla 5.15 Resultados de la prueba confirmatoria del experimento con patrones

especiales………………………………………………………………… 67

Tabla 6.1 Estados de uso de la red neuronal………………………………………… 71

Tabla 6.2 Clasificación del patrón por algoritmo…………………………………… 72

Tabla 6.3 Identificación de patrones especiales y su relación con causas de

variación 73

Tabla 6.4 Tipos de patrones para validación experimental………………………… 74

Tabla 6.5 Resultados de la validación experimental………………………………… 75

Tabla 6.6 Vectores móviles………………………………………………………… 77

Tabla 6.7 Número de unidades defectuosas en una muestra de tamaño n, en el

tiempo t…………………………………………………………………… 78

Tabla 6.8 Fracción no conforme de unidades revisadas en la empresa caso 1……… 82

Tabla 6.9 Datos estandarizados de la empresa del caso 1…………………………… 82

Tabla 6.10 Datos codificados de la empresa del caso 1……………………………… 8.3

Tabla 6.11 Clasificación de los vectores de acuerdo al tipo de su distribución de

probabilidad……………………………………………………………… 83

Tabla 6.12 Resultados obtenidos por el algoritmo identificador de estados de control

para la empresa del caso 1……………………………………………….. 84

Tabla 6.13 Mediciones del peso en gramos de un producto alimenticio……………… 86

Tabla 6.14 Resultados obtenidos por gráfico de control y algoritmo para los datos de

la empresa del caso 2 de la validación práctica…………………………

87

Tabla 6.15 ANOVA de las comparaciones de las medias de las muestras…………… 87

9

LISTA DE ABREVIATURAS

PARÁMETRO DE LA RED

NEURONAL

DESCRIPCIÓN

ABRE-

VIATURA

Vigilancia en el módulo de entrada 1 Vigilancia en el modulo de entrada en entrenamiento de

la red neuronal ρa1

Vigilancia en el campo de mapeo 1

Vigilancia en el campo de mapeo en entrenamiento de la

red neuronal ab1

Razón de aprendizaje 1

Razón de aprendizaje en entrenamiento de la red

neuronal

β1

Vigilancia en el módulo de salida

Vigilancia en el modulo de salida ρb1,2

Vigilancia del campo de mapeo 2

Vigilancia del campo de mapeo en prueba de la red

neuronal ab2

Razón de aprendizaje 2

Razón de aprendizaje en prueba de la red neuronal β2

Vigilancia en el módulo de entrada 2

Vigilancia en el modulo de entrada en prueba de la red

neuronal

ρa2

10

Capítulo 1

INTRODUCCIÓN

La calidad de los productos manufacturados es evaluada por los clientes, cuando ellos los

adquieren y usan; sin entrar en definiciones, por calidad se puede entender que algo es

adecuado para el uso que se le da. Esta explicación corta de lo que significa calidad, conlleva

a la necesidad de emplear la métrica en diversas características físicas de los productos, para

poder expresar objetivamente el nivel de calidad que éstos tienen en función del grado en que

sus mediciones generan valores numéricos dentro de las especificaciones o estándares de

calidad.

La serie de datos numéricos obtenida por el proceso de medición de la calidad de un producto,

genera, lo estadísticamente denominado, variables aleatorias. Toda variable aleatoria tiene un

comportamiento estadístico que es estudiado para poder generar esquemas de comprensión de

la forma en que el sistema de manufactura opera. Actualmente, los sistemas de manufactura

han evolucionado al grado tal que la producción masiva es ya un hecho natural, debido a que

las empresas han automatizado gran parte de sus procesos. El requerimiento de fuerza de

trabajo proveniente del hombre, es actualmente menor que en el pasado, pero del humano se

necesita ahora otro tipo de trabajo, que es, el intelectual.

Derivado de esto, resalta el hecho de que los sistemas de control estadístico de la calidad

creados en el pasado, ya no pueden funcionar con la misma eficiencia que tenían, pues la

interacción entre dos sistemas (manufactura automatizada y gente) no tiene las mismas

condiciones que antes, donde el grado de automatización era menor. Esto genera la necesidad

de revolucionar a los sistemas de control de calidad.

Entre las metodologías más difundidas para el aseguramiento y control de la calidad, sobresale

el Control Estadístico de Procesos (CEP), que en esencia consiste en monitorear la

11

manufactura de los productos para mantener sus mediciones dentro de lo esperado al eliminar

o reducir los efectos de variación nocivos a la calidad. Las herramientas más importantes en

el CEP, son los gráficos de control (GC). En la época actual, las principales desventajas de los

GC son (i) su incapacidad para identificar en tiempo-real el tipo de patrón de variación

presente en el proceso de manufactura y (ii) el requerimiento de normalidad en la distribución

de la variable estudiada. Los GC no necesariamente funcionan en tiempo-real y suelen, por

otro lado, estar asociados a una necesidad de elevados muestreos cuando no hay simetría en la

distribución de la variable observada.

Los GC están diseñados para identificar momentos de variación especial, más no patrones de

variación especial. Actualmente, se prefiere lo segundo basado en muestreos rápidos y

eficientes en tiempo-real que no dependan de la aplicación de criterios apoyados en la

apreciación humana.

Son dos los estados generales que un proceso de manufactura puede tener. Estos son,

estabilidad (proceso en control estadístico) e inestabilidad (proceso fuera de control

estadístico). El primero se presenta cuando los valores de los parámetros esenciales de la

característica de calidad se mantienen cercanos o iguales a los deseados. El estado de

inestabilidad ocurre por la presencia de una causa de variación especial y esto hace que los

valores de los parámetros cambien considerablemente.

Como alternativa al uso de los GC destaca el control estadístico por reconocimiento de

patrones, sin embargo, esto es una de las tareas complejas en la aplicación del CEP porque

ello no está considerado en la metodología ofrecida por el CEP tradicional. No obstante,

recientemente, se ha investigado con éxito el uso de inteligencia artificial y específicamente, el

de las Redes Neuronales Artificiales (RNA) para este propósito. Éstas son útiles cuando un

sistema numérico tiene complejidad para ser modelado debido a diversas “incertidumbres” o

causas de variación que actúan en dicho sistema.

Asociado al CEP tradicional se ubica el supuesto de que la característica de calidad en

supervisión debe distribuirse aproximadamente normal para que el establecimiento de los

12

límites de control sea correcto. Esta característica no es una condición para el uso de una

RNA, por lo que el enfoque del control de calidad tradicional cambia, de la identificación de

los momentos de inestabilidad del proceso a través de la observación gráfica del

comportamiento de la característica de calidad, que se asume normal, a la identificación de

patrones de estabilidad e inestabilidad sin importar el tipo de distribución. Por estas razones,

es útil el uso de inteligencia artificial. En esta tesis se usa la RNA denominada

FuzzyARTMAP, por sus características en la predicción de patrones de variación.

La FuzzyARTMAP tiene parámetros de operación y uno de los más importantes es el de la

“vigilancia” de la red, el cual afecta a la selectividad o granularidad de la eficiencia de su

predicción. Existen otros parámetros de funcionamiento, que en conjunto deben ser colocados

en los valores ideales para maximizar la eficiencia de su predicción. La selección de los

parámetros adecuados y su ubicación en el valor correcto es un punto importante de esta tesis.

En esta investigación se propone la combinación de los parámetros de la RNA que

demostraron ser significativamente influyentes en su selectividad o eficiencia para cada caso

de comportamiento de la variable aleatoria estudiada. Se muestra la forma de su detección,

prueba y selección de mejores niveles de rendimiento. Para ello, se aplicó un proceso de

experimentos diseñados y se presentan los resultados obtenidos tanto en la experimentación

como en su aplicación a dos procesos de manufactura. En la experimentación se recurrió al

uso del proceso generador de variables aleatorias por simulación de Monte Carlo.

Finalmente, los resultados obtenidos condujeron a la prueba y propuesta de un método que

tiene por objetivos la identificación de estados de control del proceso, entre estable e inestable,

y la correcta clasificación del patrón con el que una muestra de datos se comporta. Este

método tiene importancia en el control de calidad de procesos de manufactura automatizados,

donde es complejo la aplicación de las técnicas tradicionales para el monitoreo y control de las

características de calidad.

13

1.1 Gráficos de control

Los GC fueron introducidos por el Dr. Walter A. Shewhart en 1924 con el propósito de

observar el comportamiento del proceso de manufactura para mantenerlo en un estado de

control estadístico que asegure una elevada calidad en la producción. Se pueden señalar los

propósitos generales de estas gráficas (Montgomery, 1991):

a) Rastreo y vigilancia del proceso.

b) Reducción de la variabilidad del proceso.

c) Estimación de los parámetros del producto o del proceso.

El poder de un gráfico de control estriba en su capacidad para separar la variación total (VT),

ocurrida en un proceso de manufactura y reflejada en la variable aleatoria X, en dos grupos o

tipos: variación natural (VN) y variación especial (VE). De este modo, la VT se puede

expresar en función de estos dos tipos de variación, de acuerdo a la ecuación 1.

𝑉𝑇 = 𝑓 𝑉𝑁, 𝑉𝐸 = 𝑉𝑁 + 𝑉𝐸 (1)

En términos de (1), se debe hacer notar que los objetivos del control estadístico de procesos

son:

𝑎. 𝑉𝑇 → 𝑉𝑁

𝑏. 𝑉𝐸 → 0

Nótese que no se expresa VT → 0 como objetivo del CEP, pues esto forma parte de técnicas

avanzadas de control de calidad, como el diseño de experimentos. Así entonces, si VE→0

hasta que VE << VN, el proceso de manufactura operará de manera estable; por el contrario, si

VE crece, de tal modo que VE >> VN, habrá inestabilidad.

De forma general, un sistema de manufactura presenta VT debido a los efectos variables de

sus componentes, tales como maquinaria, equipo, mano de obra, medio ambiente, materiales,

14

materia prima y método de trabajo. La VN es normal en todo proceso y ésta se mantiene

relativamente baja de tal forma que no afecta a la calidad del producto en el sentido de que

solo pequeñas cantidades de unidades producidas estarán fuera de las especificaciones del

mismo. La VE también es ocasionada por los mismos elementos del proceso de manufactura

mencionados, solo que la suma total es magnificada debido a la presencia de una causa

específica en éstos.

La esencia de funcionamiento de los GC es la detección de los dos componentes de la VT

(ecuación 1), lo cual se consigue mediante el monitoreo constante y continuo de una o más

características de calidad del producto manufacturado en una gráfica bidimensional de la

medición de su calidad en función del tiempo. En este sentido, a cierto momento en el tiempo,

cuando en la gráfica se observan señales de VE, se debe tomar la decisión de si estas señales

son verdaderas indicadoras de inestabilidad y no falsas alarmas, posiblemente derivadas de la

subjetividad de la apreciación visual. Aquí, se prueban las hipótesis de afirmar que el proceso

no es estable cuando verdaderamente lo sea, o bien de aceptar que lo es cuando en realidad

está fuera de control. Aceptar o rechazar ambas hipótesis conduce a los errores estadísticos

tipo I y II. Gutiérrez y de la Vara (2004), los explican así: Error tipo I, reaccionar ante un

cambio o variación como si proviniera de una causa especial, cuando en realidad no lo es.

Error tipo II, tratar un efecto o cambio como si procediera de causas comunes de variación,

cuando en realidad se debe a una causa especial. Se puede reducir o evitar un tipo de error,

pero no ambos.

La forma de detectar a la VN y a la VE en un GC, asociada a la presencia de causas naturales

y especiales de variación, respectivamente, es como sigue: Si se observa un punto fuera de los

límites de control, o bien, si todos los puntos están dentro de dichos límites pero presentan un

patrón no aleatorio (detectado de forma visual), entonces se tiene una clara señal de que una

causa especial está actuando y se tendrá variación especial mayor a la natural (Gutiérrez y De

la Vara, 2004). En este caso se puede asumir la inestabilidad del proceso de manufactura.

El sustento probabilístico del funcionamiento de los GC es la distribución normal, la cual es

simétrica respecto a la media. La simetría en la distribución de la característica de calidad

15

estudiada posibilita el cálculo de los límites de control del proceso, que son, el superior (LSC)

y el inferior (LIC). Éstos se obtienen a partir de un valor central (la media del proceso, µ) y de

una distancia deseada de separación, expresada en desviaciones estándar (σ), entre µ y los

límites de control. De este modo:

LSC = media + k desviaciones estándar.

LÍNEA CENTRAL = media general.

LIC = media - k desviaciones estándar.

Así es como el establecimiento de los límites de control presupone una simetría en la forma de

la distribución de la variable aleatoria X. Ver figura 1.1.

Figura 1.1. Importancia de la simetría de X para el establecimiento de los límites de

control.

El funcionamiento del GC es sencillo y práctico, pero tiene desventajas importantes, como ya

se mencionó. Entonces, con los GC sólo se puede saber con precisión “el cuándo y el dónde”

hay variación especial mas no “el qué” se presentó, de forma eficiente, generando entonces

diagnósticos apresurados y a veces erróneos (Guh, 2005).

Para intentar saber “el cuándo y el dónde” de la ocurrencia de variación especial, se recurre al

uso de reglas establecidas para ese fin. Éstas requieren del juicio humano, lo cual, como se

dijo, es una desventaja de los GC. Aunque su uso es adecuado para saber “el cuándo y el

dónde” de una variación especial, esto no lo es, cuando se busca la identificación de patrones

estadísticos especiales de la variable aleatoria X, lo cual daría la respuesta correcta a la

pregunta del ¿qué ocurrió? (Guh, 2002; Lucy, 1993).

LSC

Línea central

LIC

+k desviaciones estándar

-k desviaciones estándar

16

La implementación de los GC suele conducir a casos donde sea necesario controlar

estadísticamente características de calidad tomadas como variables aleatorias X que pueden

tener distribución de probabilidad no simétrica, o bien, no normal. Con esto presente en X,

suele incrementarse la complejidad para obtener de forma eficiente resultados satisfactorios en

el uso de los GC, pues se debe incrementar el nivel de muestreo o su frecuencia, o ambas

cosas, para obtener muestras grandes que aseguren normalidad1; no obstante, esta medida

correctiva incrementa el costo de los GC al requerir más recursos, tales como cantidad de

pruebas, personal especializado, etc.

También es posible recurrir al uso de transformación de datos2 cuando X es asimétrica, lo cual

constituye en sí un paso adicional que agrega trabajo al proceso de control de la calidad.

Además de lo anterior, las transformaciones de datos implican un grado de complejidad

matemática y no funcionan para todos los rangos de variación de X.

En resumen, se señalan cuatro desventajas de los GC: (i) no detectan eficientemente el tipo de

patrón presentado en X cuando hay evidencias de variación especial, (ii) El establecimiento de

los límites de control precisa de distribución normal de X, (iii) siempre es necesario calcular y

revisar los límites de control y (iv) requieren de la apreciación y juicio de personal experto.

Estas desventajas no se presentan en el uso de redes neuronales para el control estadístico de

procesos.

1.2 Control estadístico de procesos y RNA

En la revisión de la literatura se ha encontrado que diversos investigadores sugieren el uso de

redes neuronales como una manera de trabajar el CEP conociendo las desventajas en el uso de

las técnicas de control tradicionales (Zobel y Cook, 2004; Guh, 2002; Ho y Chang, 1999; Guh

y Tannock, 1999; Wani y Pham, 1999; Zorriassantine y Tannock, 1998; Cheng, 1997; Cheng,

1995; Hwarng y Chong, 1995). Una red neuronal consiste en un número de elementos (nodos)

1 Teorema del Límite Central.

2 Transformaciones estadísticas conocidas como Box Cox y Johnson.

17

fuertemente interconectados que tienen la habilidad de procesar información como resultado

de un proceso de trabajo dinámico de esos nodos y de conexiones a puntos externos a la red.

La importancia señalada en el uso de las redes neuronales se describe mediante sus principales

ventajas sobre las técnicas de control estadístico basadas en gráficos de control (Guh, 2005;

Zobel y Cook, 2004; Pacela, Semeraro y Anglania, 2004; Swift, 1987). Las ventajas

principales son:

a) Las redes neuronales empleadas con el fin del reconocimiento de patrones estadísticos

de los datos permiten fácilmente reconocer, en tiempo-real, distribuciones no

normales con rapidez y eficiencia elevadas, especialmente cuando la distribución

presenta sesgos (Guh, 2005).

b) El uso de las redes neuronales no requiere del supuesto de normalidad en los datos o

de la independencia de los mismos (Pacela, Semeraro y Anglania, 2004).

c) Las RNA han tenido aplicación diversa en el campo de la estadística, especialmente

cuando se requiere manejar una gran cantidad de datos en tiempo-real que presentan

cierta complejidad (Pacela y Semeraro, 2005).

Los GC no están diseñados para la detección de patrones, a diferencia de las RNA que hacen

esto de forma sistemática. La importancia de detectar patrones en X es que estos se relacionan

directamente con la VE y la VN y no requieren el uso de reglas ni del juicio humano.

Las RNA se pueden entrenar para identificar y clasificar a un grupo de datos muestrales

tomados de la línea de producción, en patrones típicos de VE y VN, con lo que se puede en

consecuencia, diagnosticar si un proceso de manufactura opera dentro o fuera de control

estadístico. Algunos antecedentes de uso estadístico de las RNA:

a) Ripley (1994), propone una comparación entre los métodos estadísticos y las RNA

para la clasificación de patrones.

18

b) Hwang y Ding (1997) y De Veaux (1998), consideraron el problema de la

construcción de intervalos de confianza mediante RNA.

c) La aplicación de las RNA puede clasificarse en dos categorías (Pacela y Semeraro,

2005): (i) Reconocimiento de patrones y (ii) Detección de patrones no naturales. La

primera categoría provee mecanismos para identificar diferentes tipos de patrones

comunes en tiempo-real y la segunda categoría proporciona información básica

para identificar las causas de generación de patrones no naturales en los procesos

de manufactura. Estudios de este tipo fueron hechos por Hwarng y Hubele (1993),

Hwarng y Chong (1995), Cheng (1995, 1997), Chang y Aw (1996), Cook y Chiu

(1998), Guh y Hsieh (1999), Guh y Tannock (1999), Chang y Ho (1999) y Perry

(2001).

1.3 Contribución original

Esta tesis trata sobre la propuesta de un método novedoso de control estadístico de procesos

automatizados de manufactura. Dicho método es alterno a los gráficos de control de

mediciones individuales, de medias y rangos y de la fracción disconforme, mejorando sus

condiciones de aplicación.

Durante el desarrollo del modelo, se recurrió al diseño de experimentos aplicado a la red

neuronal FuzzyARTMAP, lo cual, en el mejor entendimiento del autor, no se tiene

precedentes en estudios previos. Con esto, se contribuye también a la generación de

conocimiento sobre la forma estadística en que funcionan los parámetros de la red neuronal

referida; lo cual, también es poco conocido.

En resumen, con el método propuesto se tienen las siguientes ventajas:

1. Los parámetros de la RNA se determinaron a través de Diseño

Experimental para maximizar la eficiencia.

19

2. Los parámetros de la RNA son seleccionados de acuerdo a la forma de la

distribución de probabilidad.

3. El método no requiere de normalidad en la distribución de los datos.

4. No se requiere tamaño grande de la muestra para garantizar que exista una

distribución normal como en el caso de los GC.

5. El modelo desarrollado refina su conocimiento a través de datos del

proceso de manufactura.

Finalmente, el método propuesto se probó con datos simulados y con datos reales de

producción, identificando los tipos de patrones de variación y estados de control del proceso,

cuyos resultados se compararon favorablemente en relación a los gráficos de control lo que

valida la metodología propuesta.

1.4 Organización de la tesis

Este trabajo se organizó en siete capítulos seguidos del resumen. La descripción general de

esta tesis se explica a continuación: En el resumen se expresa un panorama general de la tesis,

con algunos antecedentes del control estadístico de procesos importantes para el seguimiento

de este trabajo. En el capítulo 1, introducción, se informa al lector sobre los tipos de variación

existentes en los datos tomados de un proceso de manufactura y la importancia de la simetría

en su distribución de probabilidad para establecer el control estadístico de procesos

tradicional; finalmente, se introduce el tema de las redes neuronales y su relevancia en el

enfoque de control estadístico de procesos establecido en esta tesis. El capítulo 2, define el

tema de investigación estableciendo la hipótesis de trabajo. En el capítulo 3, la justificación y

los objetivos son mostrados, como consecuencia del establecimiento del tema de

investigación. El capítulo 4 trata sobre la fundamentación de esta investigación en los temas

20

de la red neuronal FuzzyARTMAP, en investigaciones recientes relacionadas con el

reconocimiento de patrones y se termina con el establecimiento de los patrones de variación

estudiados. En el capítulo 5 se muestra el procedimiento de investigación empleado y los

resultados experimentales obtenidos, para abordar el capítulo 6, donde se colocó el método y

algoritmo resultantes de esta investigación. Se termina con el capítulo 7 donde se escriben las

conclusiones. Finalmente, los anexos del trabajo contienen las bases del desarrollo

experimental, el análisis estadístico y las publicaciones desarrolladas.

21

Capítulo 2

DEFINICIÓN DEL TEMA

La definición del tema se expresa como la hipótesis de la investigación y delimitación de la

misma, mostradas a continuación.

2.1. Hipótesis de investigación.

Mediante la identificación oportuna del patrón de variación que sigue una variable aleatoria

de un proceso de manufactura, se puede elaborar un diagnóstico objetivo sobre el estado de

control del proceso de fabricación, teniendo así, facilidad en la identificación de causas de

variación naturales y especiales que afecten al proceso de fabricación, sin recurrir al uso de

medios gráficos que asumen normalidad.

2.2. Alcance de la investigación.

El alcance de la investigación comprende la clasificación de patrones presentados en los

gráficos de control, mediante redes neuronales. Básicamente, este trabajo separa a los

patrones en cuestión en dos grupos: los que denotan control estadístico del proceso y los que

indican estados fuera de control. Se señala entonces que la finalidad es identificar estados de

control mediante la identificación del tipo de patrón que se esté presentando en los datos

monitoreados en el proceso de manufactura, sin gráficos ni límites de control.

La investigación incluye el análisis de una variable aleatoria de calidad aplicable a los gráficos

de control de mediciones individuales, de medias y rangos y de la fracción de disconformes.

22

Capítulo 3

JUSTIFICACIÓN Y OBJETIVOS

3.1. Justificación.

De forma general, la justificación de la presente tesis se explica por las limitaciones de los GC

tradicionales para responder a las condiciones tecnológicas actuales de los sistemas de

manufactura, las que han cambiado en el tiempo debido a la evolución de la interacción entre

el sistema de manufactura automatizado y el tipo de requerimiento de trabajo de la gente, que

es ahora más intelectual que antes y menos físico. Por tanto, la presente investigación está

justificada desde los enfoques científico y tecnológico, al ofrecer un proceso sistemático para

el aseguramiento de la calidad de procesos de manufactura automatizados, alterno a los GC

tradicionales.

De forma puntual, esta tesis se justifica por lo siguientes motivos:

a) Los GC asumen normalidad en la variable aleatoria y existen casos donde dicha

variable no se comporta simétricamente. Asegurar una distribución normal, cuando no

se tiene, requiere de incrementos en costo por inspección y muestreo.

b) Los GC no están diseñados para detectar patrones de variación, debiendo recurrir al

criterio humano para tal fin.

c) Cambio de enfoque: es más eficiente determinar patrones de variación que señales de

variación especial.

23

3.2. Objetivos.

El objetivo general es:

Diseñar un proceso sistemático para el control estadístico de procesos de manufactura

automatizados, a través del reconocimiento de patrones de variación naturales y especiales,

que no esté basado en el establecimiento de límites de control y que de forma objetiva

diagnostique el estado de control del proceso.

Y los específicos son:

a) Mejorar las condiciones de los trabajos similares en cuanto a la eficiencia de

funcionamiento en la predicción de patrones o en la facilidad de aplicación en procesos en

línea.

b) Evitar el requerimiento de la apreciación humana en el establecimiento de estados de

control de procesos.

c) Obtener un algoritmo robusto probado de forma experimental y aplicada.

24

Capítulo 4

FUNDAMENTACIÓN

En el presente capítulo se introduce el concepto de Red Neuronal Biológica, así como su

modelo conocido como Red Neuronal Artificial (RNA). Se explica de forma cualitativa el

funcionamiento de las mismas y se presentan dos de las arquitecturas empleadas en el trabajo

relacionado a esta tesis como son la red de Retropropagación empleada por Guh (2005) y la

Red FuzzyARTMAP empleada por Hindi (2004) y se definen ampliamente los patrones a

utilizar y el método de simulación empleado para la generación de los mismos.

4.1. Redes Neuronales Artificiales (RNA’s).

Las Redes Neuronales Artificiales (RNA’s) son métodos computacionales para la

representación del conocimiento y el procesamiento de información. Como su nombre

implica, las redes neuronales artificiales están inspiradas por la arquitectura neuronal biológica

y la operación del cerebro humano. Debido a su estructura, las redes neuronales tienen

algunas capacidades únicas en el procesamiento de información. Tales capacidades están

demostrando que las redes neuronales son muy útiles en una amplia gama de aplicaciones de

ingeniería.

Las neuronas biológicas están conectadas con otras neuronas vía redes neuronales, grupos de

enlaces organizados de comunicación entre células. Las conexiones entre neuronas permiten

el flujo de información a través de grandes distancias por todo el cuerpo gracias a las dendritas

y axones como se muestra en la figura 4.1. Las conexiones axónicas están determinadas

genéticamente, mientras que las conexiones dendríticas son generadas mediante el

aprendizaje. Pero las redes neuronales hacen algo más: permiten al sistema nervioso

modificar, filtrar y cernir información que viaja hacia y desde el cerebro.

25

Figura 4.1. Red Neuronal Biológica

Un grupo de unidades de procesamiento que replican las operaciones básicas de las neuronas

reales es el encargado de procesar tales funciones. A medida que las redes neuronales

aprenden o son entrenadas, un conjunto de pesos de las conexiones entre las unidades de

procesamiento es modificado basado en las relaciones percibidas entre los datos.

Los problemas que las redes neuronales pueden resolver están categorizados en cuatro tipos:

Clasificación.

Son aquéllos cuya meta es etiquetar cada patrón de entrada como miembro de cierta clase. Un

ejemplo simple de un problema de clasificación es cuando una red neuronal tiene como

propósito etiquetar a una persona como hombre o mujer (las dos clases) basado en su estatura

y peso. La entrada para la red neuronal sería los datos de altura y peso, mientras que la salida

deseada sería el sexo.

Aproximación de funciones.

Son aquéllos cuyo objetivo es determinar un valor numérico dado un conjunto de entradas.

Éste es similar al problema de clasificación, excepto porque la salida es numérica. Un

ejemplo sería determinar el factor viento (la salida deseada) dadas la temperatura, la humedad

y la velocidad del viento (las entradas). En estos problemas, la red neuronal intentará

aproximar la relación funcional entre la entrada y la salida deseada.

26

Predicción.

Son aquéllos cuya meta es determinar una salida futura dado un conjunto de entradas y la

historia pasada de las entradas. La principal diferencia entre los problemas de predicción y los

anteriores es que los problemas de predicción usan la entrada actual y las entradas previas (la

historia temporal de la entrada) para determinar un valor de salida futuro. Un caso típico es

emplear el historial del precio de cierre de unas acciones como entrada (por ejemplo los

precios de hoy y de los tres días anteriores) para tratar de predecir el precio de cierre de

mañana.

Agrupamiento.

Son aquéllos en los cuales es deseado que la red neuronal extraiga información sólo de los

datos de entrada para conocer el número de grupos significativamente distintos que existan.

4.2 Breve historia

Propiamente, fue a partir de los años 40 que dio inicio la investigación científica de las redes

neuronales artificiales. No obstante, hasta mediados de los años 80, el progreso realizado en

este dominio era frenado por el costo elevado de las computadoras capaces de ejecutar los

algoritmos correspondientes. En efecto, tales algoritmos necesitan una gran capacidad de

cálculo; por consecuencia, demandan recursos de hardware importantes, tanto en la fase de

concepción como de utilización de la red. Desde entonces, gracias a la construcción de

computadoras poderosas ha sido posible remediar los problemas de velocidad y de recursos

anteriormente impuestos. Esto produjo un mayor interés en la investigación y aplicación de

las redes neuronales, debido probablemente a que conjugan múltiples disciplinas y hacen uso

de ideas y técnicas novedosas entre distintos dominios de la ciencia: física estadística, análisis

funcional, estadística, teoría de sistemas dinámicos, entre otros. Sobre todo, los esfuerzos

conjugados de la biología y las ciencias cognitivas.

Existen en la actualidad una innumerable cantidad de arquitecturas de RNA clasificadas por

tres criterios principales:

27

Forma de aprendizaje

Supervisado (requiere entrenamiento previo)

No supervisado (empleado en problemas de clasificación)

Aprendizaje reforzado (aprendizaje basado en una función objetivo)

Arquitectura

Una capa

Múltiples capas

Recurrente (con/sin retroalimentación en la salida/capa escondida)

Tipo de aprendizaje

Se refiere a la forma en que se actualizan los pesos de la RNA y pueden ser:

Corrección de error

Basado en memoria

Hebbiano

Competitivo

Boltzman

De los tipos de aprendizaje, quizás el más conocido es el tipo por corrección de error que

consiste en actualizar los pesos en cada iteración hasta que la diferencia de la salida de la red

neuronal y la salida deseada sean menores a un valor predeterminado. Este tipo de aprendizaje

es empleado por la red de retropropagación.

28

4.3 Retropropagación (perceptrón multicapa)

Esta red es conocida también como perceptrón multicapa. De acuerdo a la figura 4.2, los

círculos representan las neuronas de procesamiento y las flechas los canales de flujo de

información entre las neuronas, denominadas interconexiones. Los rectángulos representan

únicamente el almacenamiento de los datos de entrada a la red. Cada neurona de

procesamiento posee una cantidad limitada de memoria y realiza un cálculo local que

transforma las entradas en salidas. El cálculo se denomina función de activación o función de

transferencia de la neurona. Estas funciones pueden ser lineales o no, y pueden ser ecuaciones

algebraicas o diferenciales. El concepto de retropropagación se refiere al tipo de aprendizaje

empleado, lo que origina el nombre de esta red.

Figura 4.2. Representación de una red neuronal (perceptrón)

Este tipo de aprendizaje tiene algunas particularidades que lo distinguen de un problema

convencional de optimización. Si se dispone de una muestra de M pares de valores X y Y, de

entrada y salida, respectivamente, estos datos deben ser presentados de forma secuencial a la

Entradas

Capa de Entrada

Salidas

Capa de Salida

Capa Escondida

X

Y

V kl

W ij

29

red, calculándose una actualización de los coeficientes de peso de las interconexiones (Wij,

Vkl) para cada par de datos, hasta agotarlos. Es muy frecuente que un solo ciclo o época no

sea suficiente para lograr un valor aceptablemente pequeño del error para todos los pares de

datos, entonces es necesario reciclarlos (iniciar una nueva época). Dependiendo del tamaño de

la muestra de entrenamiento, serán las épocas requeridas, pudiendo ser éstas desde unas

decenas, hasta cientos o miles.

El método de retropropagación, basado en el algoritmo del descenso más rápido tiene la virtud

de ser simple, sin embargo, en algunos casos puede resultar demasiado lento. Además, no

siempre se garantiza la convergencia a un mínimo absoluto, es decir, puede quedar atrapado en

un mínimo local.

4.4 FuzzyARTMAP

La arquitectura FuzzyARTMAP (Carpenter et al, 1992) es una red neuronal artificial

perteneciente a la familia de ART (Adaptive Resonance Theory). Esta teoría fue desarrollada

por Grossberg y Carpenter en la Universidad de Boston. FuzzyARTMAP puede efectuar

aprendizaje supervisado. Esta red neuronal crea varias neuronas de acuerdo al número de

patrones presentados en su entrenamiento y a las diferencias entre ellos. Está basada en las

siguientes características. Ver figura 4.3. Esta red tiene dos módulos Fuzzy ART, uno para

manejar las entradas y el segundo para las salidas (ARTa y ARTb). También tiene un campo de

correspondencia (Map Field) Fab que liga las clases de entrada con las de salida.

Figura. 4.3. Arquitectura FuzzyARTMAP

A = (a,ac)

a

xa

ya

F1a

F2a

i wa

ARTa

reset

b

xb

yb

i

ARTb

reset

Xab

j

wab

match tracking

ab

a b

wb

F2b

F1b

F0a F0

b B = (b,bc)

map field

Fab

30

La forma de operación de un módulo básico (ARTa ó ARTb) es como un módulo básico ART

como se ilustra en la figura 4.4. Dicho módulo consta de 2 subsistemas, atención y

orientación. El primer subsistema tiene dos capas de nodos hacia arriba, F1 y F2. Así, la

información de salida del elemento de procesamiento reverbera hacia atrás y hacia delante

entre las dos capas. Si una resonancia estable toma lugar entonces puede ocurrir aprendizaje o

adaptación. El subsistema de orientación reinicia el subsistema de atención cuando ocurre un

evento no común. Si el patrón de entrada no es reconocido inmediatamente entonces la red

entrará a un estado de resonancia, después de lo cual un nuevo patrón es almacenado por

primera vez. De este modo la red responde rápidamente a datos aprendidos previamente.

Atención Orientación

Figura 4.4. Arquitectura básica ART

El parámetro de vigilancia de la red () mide la diferencia permitida entre los datos de entrada

y los patrones almacenados. Por tanto, este parámetro es el determinante para afectar a la

selectividad o granularidad de la predicción de la red. El parámetro referido tiene 3 factores:

vigilancia en el módulo de entrada (a), vigilancia en el módulo de salida (b1,2) y vigilancia

del campo de mapeo (ab).

Para una mejor comprensión del escrito, los detalles del algoritmo empleado para la

implementación de la arquitectura FuzzyARTMAP se presentan en el Anexo G.

Patrón de entrada

Control de ganancia

STM F1

STM F2

LTM +

+ + -

+ STM reset wave

A

31

4.4.1 Parámetros de la FuzzyARTMAP y nomenclatura.

En esta tesis se usarán los parámetros de la red neuronal FuzzyARTMAP y nomenclatura

siguientes: Vigilancia en el módulo de entrada (ρa), Vigilancia del campo de mapeo (ρab),

Razón de aprendizaje (β), y Vigilancia en el módulo de salida (ρb1,2). Cuando se empleen los

subíndices 1 y 2 en cada parámetro, significan las etapas de entrenamiento (1) y prueba (2).

4.5. Investigaciones recientes.

En esta sección se describen las investigaciones más recientes localizadas en la revisión de la

literatura, que están cercanamente relacionadas con el tema de estas tesis, mismas que a su

vez, son la base de la formulación de este estudio.

4.5.1. Reconocimiento del patrón natural mediante redes neuronales.

Se han hecho diversas investigaciones sobre el establecimiento de los estados de control del

proceso, a partir del patrón natural cuando los datos X muestran cambios en sus parámetros

importantes, concluyendo que las redes neuronales pueden imitar a los GC. Guo y Dooley

(1992) usaron la red neuronal backpropagation en combinación con los gráficos de la suma

acumulativa. Smith (1994) usó arquitecturas diferentes de redes neuronales para igualar el

desempeño de los GC. Stützle (1995) también usó la red neuronal backpropagation para

probarla en la identificación de cambios en los patrones naturales observados.

Hindi (2004), usó la red neuronal FuzzyARTMAP para el propósito descrito. En su

investigación probó dicha red neuronal para determinar el tipo de cambio presentado en los

parámetros del proceso, la media (µ) y la desviación estándar (σ), por separado y de forma

simultánea. Compara estos resultados con los obtenidos por la aplicación de los gráficos de

control para la media y rangos, esto es, Rx . Utilizó 8,000 vectores con 10 valores de X, para

cuatro casos de valores de μ y σ, dejando 6,000 para entrenamiento y 2,000 para prueba. Usó

los valores 0 y 3 para μ y 1 y 3 para σ, considerando la combinación μ = 0 y σ = 1 para

representar un estado de control estadístico del proceso. Hizo esta experimentación a valores

32

fijos de la red neuronal, basado en resultados de investigaciones previas de otros autores. Los

parámetros y valores empleados fueron: Razón de aprendizaje (β) y vigilancia en el módulo de

entrada (ρa), a los valores 1 y 0.8, respectivamente. No especifica valores para los parámetros

de ρab y ρb1,2, basado en la afirmación de Carpenter y Grossberg (1992) de que a un

aprendizaje rápido de la red neuronal, éstos dos parámetros pueden tomar cualquier valor entre

0 y 1 sin afectar a los resultados. Sus resultados se muestran en la tabla 4.1.

Tabla 4.1. Resumen de resultados de investigaciones previas en la clasificación del patrón

natural a valores diferentes de µ y σ Hindi (2004)

µ σ TIPO DE

DISTRIBUCIÓN

RED

NEURO-

NAL

PARÁMETROS

CONSIDERADOS

CLASIFICACIÓN

CORRECTA

DE LAS

MUESTRAS

EFICIENCIA

0 1

Normal Fuzzy

ARTMAP

β = 1.0

ρa = 0.8

490 98.0%

3 1 478 95.6%

0 3 441 88.2%

3 3 449 89.8%

4.5.2. Reconocimiento de patrones natural y especiales mediante redes neuronales.

En la investigación realizada por Guh (2005) se propone el uso de la red neuronal denominada

Backpropagation (BPN) en combinación con un árbol de decisión que en conjunto, se

incluyen en un proceso para el reconocimiento de patrones estadísticos de los datos en tiempo-

real. Guh estudió los patrones de variación denominados: natural, cambio superior de la

media, cambio inferior de la media, tendencia creciente, tendencia decreciente, mezcla, ciclos

y sistemático. Desarrolló un sistema híbrido para el reconocimiento de estos patrones, el cual

se muestra en el esquema de bloques de la figura 4.5.

33

Figura 4.5. Arquitectura del sistema híbrido para el reconocimiento de patrones3.

La figura 4.5 hace referencia a tres módulos, llamados A, B y C. El módulo A consiste en

preparar los datos X para que puedan ser procesados por la RNA4. El módulo B funciona de

forma general como los GC y detecta casos anormales de variación. Este módulo clasifica a la

serie de datos en uno de cuatro grupos de patrones: (i) Natural, (ii) Cambio de la media

(Superior o Inferior) y Tendencia (Creciente o Decreciente), (iii). Cíclico y (iv). Sistemático y

Mezcla. Después, si el conjunto de datos X se clasifica como patrón especial (casos ii, iii y iv),

entonces éste es procesado por el módulo C.

3 Tomado de Guh (2005).

4 Estandarizado y codificado de X. Estandarizado para convertir la serie de datos a valores con µ = 0 y σ = 1.

Codificado para transformar a los datos estandarizados a una serie comprendida entre 0 y 1.

Proceso de manufactura

Introducción de los datos

de la muestra en la ventana

de reconocimiento

Módulo A

(pre procesado de los datos

para la extracción de

rasgos)

Módulo B

(Clasificación gruesa:

RNA )

¿Cómo es

el patron?

Natural

Especial

Módulo C

(Clasificación fina:

Árbol de decisión)

Fin

34

Esta investigación consideró, para cada patrón especial de 24 datos cada uno, una familia de

patrones formados a partir de pequeñas variaciones en estos. Todas las series de datos usadas

fueron generadas con el proceso de simulación de Monte Carlo, a partir de una variable

aleatoria con distribución normal y µ = 0 y σ = 1, pero, con variaciones en el tamaño del

efecto de patrón especial, lo que permitió tener subpatrones de cada patrón especial.

Finalmente, el módulo C, el árbol de decisión, es un algoritmo heurístico que describe la

forma en que se decide el tipo de patrón que tiene una serie de datos. Los resultados obtenidos

(sobre los patrones de variación considerados en esta tesis) se muestran en la tabla 4.2.

Tabla 4.2. Resumen de resultados de investigaciones previas en la clasificación del patrón

natural a valores diferentes de µ y σ Guh (2005)

PATRÓN RED NEURONAL EFICIENCIA

Sin módulo C Con módulo C

Cambio superior en µ

Backpropagation

95% 95%

Cambio inferior en µ 87% 95%

Tendencia creciente 0% 93%

Tendencia decreciente 1% 92%

Esta investigación demuestra que el uso combinado de la red neuronal con el árbol de

decisión, crea un sistema híbrido con altos niveles de eficiencia de la predicción de patrones

especiales. Este sistema de clasificación de patrones puede ser empleado como mapa para la

toma de decisiones en la identificación de estados de control del proceso. Tiene la

particularidad de simplificar y agilizar la aplicación computacional de las redes neuronales al

ofrecer rutas claras de acción y resalta el hecho de que este sistema puede ser computarizado y

adicionado al sistema de control del proceso industrial, para no hacer necesaria la intervención

del factor humano en la interpretación de gráficos ni en la toma de decisiones respecto al

patrón de comportamiento de la variable. Finalmente, este sistema híbrido tiene las siguientes

características:

a) Fue desarrollado para una gráfica de control del tipo Rx .

35

b) Los patrones típicos que pueden presentarse en una gráfica Rx son de 6 a 8.

c) Sólo se puede tratar una característica de calidad.

d) Las causas comunes de variación permanecen constantes.

e) No elimina el uso del gráfico de control Rx .

f) No considera variaciones del patrón natural, solo de los especiales.

g) Pone de manifiesto la necesidad de combinar la red neuronal con un algoritmo de

decisión.

4.6. Bases estadísticas de las redes neuronales.

En esta sección se presentan algunas afirmaciones hechas por investigadores que han

estudiado la clasificación de patrones naturales y especiales mediante el uso de redes

neuronales. Se presenta la información en forma de lista.

a) Un proceso de manufactura adopta un estado de “fuera de control estadístico” a partir

del momento en que uno o más de sus parámetros han cambiado de valor (Evans y

Lindsay, 1993).

b) El tamaño del vector de los datos de prueba afecta a la operación de la RNA. Un

mayor tamaño del vector reduce los valores de los errores tipo I y tipo II (Pacela y

Semeraro, 2005).

c) El valor del parámetro de vigilancia ρ afecta al error tipo II; un valor alto en ρ genera

un valor bajo en éste (Pacela y Semeraro, 2005).

d) El tamaño del vector de los datos influye significativamente en el desempeño de la red

neuronal. Un tamaño pequeño detecta patrones especiales más rápidamente que un

tamaño grande y puede producir un nivel bajo del error tipo I (Guh, 2005).

e) El tamaño del vector de los datos influye en la eficiencia de la RNA. Un tamaño

grande puede reducir la eficiencia porque incrementa el tiempo requerido para la

36

clasificación de los patrones. El tamaño apropiado genera un balance adecuado entre

los errores tipo I y II (Guh, 2005).

4.7. Tipos de patrones especiales.

Gutiérrez y de la Vara (2004) señalan 5 patrones especiales de variación de los datos, que son

comúnmente observados en los GC. Estos son:

a) Desplazamientos o cambios en el nivel del proceso. Tiene dos formas: desplazamiento

superior del nivel del proceso y desplazamiento inferior del nivel del proceso. Los

criterios de su detección son:

i. Un punto fuera de los límites de control.

ii. Tendencia clara y larga de los puntos5, a que caigan de un solo lado

(superior o inferior) de la línea central.

b) Tendencias en el nivel del proceso. Tiene dos formas: tendencia creciente y tendencia

decreciente. Los criterios de su detección son:

i. Seis o más puntos consecutivos ascendentes o descendentes.

ii. Un movimiento muy largo en tendencia, aunque no de puntos

consecutivos.

c) Ciclos recurrentes (periodicidad). La forma de su detección es por observación de

series de puntos consecutivos con tendencia creciente seguidos de otra serie con

tendencia decreciente.

d) Mucha variabilidad. La forma de su detección es como sigue:

5 Al menos 8 puntos.

37

i. Ocho puntos consecutivos en ambos lados de la línea central, pero

ninguno cercano a la línea central.

ii. Por apreciación de ciclos.

e) Falta de variabilidad (estratificación). La forma de su detección es como sigue:

i. Quince puntos consecutivos concentrados en la línea central.

ii. Por apreciación.

De estos patrones especiales se consideraron los dos primeros en esta tesis. La razón de esto,

es que en la población de datos bajo estudio, tomados de los procesos de producción de las

empresas estudiadas, solo se presentaron dichos casos de patrones de variación. Además de lo

anterior, bien se podría demostrar que los patrones no considerados pueden ser determinados

por lo que si lo fueron, por ejemplo, un patrón cíclico podría detectarse mediante una

combinación alternada de los patrones de tendencia creciente y decreciente.

Ahora, se mostrará la composición y comportamiento de cada uno de estos 3 patrones, pero

antes, es necesario explicar el proceso de generación de datos por Simulación de Monte Carlo.

4.7.1. Simulación de X por Monte Carlo.

Todos los datos de la variable aleatoria X que describen los patrones indicados, son series de

tiempo, o series de datos ordenadas en el tiempo. A un conjunto de “n” datos Xt, para

t=1,2,3,…n, se le denomina en esta tesis vector X, o simplemente X. Como se explicó

anteriormente, la variación total de X depende de dos tipos de variación, la natural y la

especial. En el proceso de simulación de datos por Monte Carlo empleado en esta tesis, la

primera variación se le representa por “nt” donde t=1,2,3,…n y para la segunda variación se

emplea el término “dt”, para t=1,2,3,…n. Ahora bien, cada valor Xt está compuesto por estas

dos variaciones y por un efecto global, que es µ.

38

Entonces, cada valor de X tiene tres efectos: global, variación natural y variación especial, que

de acuerdo a la nomenclatura indicada y a la generación de datos por simulación de Monte

Carlo se tiene la ecuación 26.

t t tX n d (2)

donde:

Xt : valor de la variable aleatoria en el momento t.

µ : efecto de la media global del proceso de manufactura.

nt : efecto de la variación natural del proceso de manufactura, en el momento t.

dt : efecto de la variación especial del proceso de manufactura en el momento t.

Cuando una serie de datos sugiere la presencia de un patrón de los considerados en esta tesis,

se debe entender que, para que el patrón sea natural, entonces dt → 0, y para los patrones

especiales, 0 < nt < dt. .

4.7.2. Patrón natural en estados de control y fuera de control estadístico.

Un patrón natural se presenta cuando el vector X tiene un comportamiento gráfico libre de

cualquiera de los otros patrones mencionados en la sección 4.7. Tipos de patrones especiales.

Esto implica que la gráfica de los n puntos de X tenga una forma “aleatoria”, tal como se

muestra en la figura 4.6.

Figura 4.6. Forma típica del patrón natural.

6 Tomado de Guh (2005)

39

Estadísticamente, el vector X que se comporte como este patrón, tendrá una distribución

normal con media µ y desviación estándar σ, lo que se representa como X~N(µ,σ), ver figura

4.7. Esta afirmación está basada en el análisis realizado a un grupo de 100 conjuntos de 20

datos cada uno con distribución normal con µ = 0 y σ = 1. Se tomaron vectores de tamaño 20,

ya que esto fue lo considerado en la presente investigación. Este tamaño de vector ofrece

mejores posibilidades de mantener bajos los errores tipo I y II de las pruebas de hipótesis

sobre el control del proceso de manufactura.

C15

Fre

qu

en

cy

3.01.50.0-1.5-3.0

20

15

10

5

0

Mean -0.1034

StDev 0.9391

N 30

Histogram of C15Normal

Figura 4.7. Forma típica de la distribución normal.

Debido a que X se define en función de los dos parámetros indicados, su posición (µ) y forma

(σ) pueden cambiar cuando dichos parámetros cambian de valor.

En un proceso de manufactura, mientras los valores de µ y σ se mantengan semejantes o

iguales a los valores deseados, entonces el proceso se mantendrá en control estadístico.

Cuando ocurre un cambio en cualquiera de los dos parámetros, o bien, en ambos, entonces se

suscita el estado fuera de control del proceso, el cual podría ser visto en los gráficos de

control7 o detectado mediante los criterios vistos en la sección 4.7. Tipos de patrones

especiales.

De manera general, se pueden exponer casos de combinaciones de µ y σ que sean distintos a

su valor original, como 0 y 1, respectivamente, que advierten sobre estados fuera de control

del proceso. Esto queda representado en la tabla 4.3. Los 4 casos indicados en esta tabla,

7 Se requiere habilidad y entrenamiento para observar esto.

40

representan estados tanto de estabilidad estadística del proceso (caso I) como de inestabilidad

(casos II, III y IV).

Tabla 4.3. Combinaciones de los parámetros de la distribución normal.

σ 3 Caso III Caso IV

1 Caso I Caso II

0 3

µ

Los valores referidos en la tabla 4.3 fueron seleccionados a partir del estudio de Hindi (2004)

Por último, para generar al vector X con este tipo de patrón, la ecuación 2 se modifica a:

Xt=+nt (3)

4.7.3. Patrón de cambio superior en la media.

Este patrón de X se explica como un cambio repentino y abrupto del valor de µ hacia otro

valor, superior, debido a la presencia de una causa de variación especial en el proceso de

manufactura. En este caso, se hace referencia a dos medias poblacionales, µ1 y µ2, a un punto

t donde ocurre dicho cambio y a la magnitud “d” del cambio de µ1 a µ2. El término dt de la

ecuación 2 se compone de dos factores, según se muestra en la ecuación 4.

dt = p(d) …………….(4)

donde:

p: parámetro que determina la posición t del cambio en X.

para i=1,…, n, asumiendo que el cambio se da en el tiempo t

𝑝 = 0, 𝑖 ≤ 𝑡1, 𝑖 > 0

d: magnitud del cambio de la media en unidades de desviación estándar.

41

Entonces, el vector X es una variable aleatoria que contiene dos poblaciones de datos, X1 y X2.

Así, X1~N(µ1,σ) cuando en un valor “t = p”, donde 0 < p < n, ocurre un cambio de magnitud

“d” en los valores sucesivos de X1 haciendo que se genere la población de datos de X2, donde

X2~N(µ2,σ) porque µ1 < µ2 , ver figura 4.8.

El patrón de cambio en la media es una unión de dos de los 4 casos mostrados en la tabla 4.3.

Se genera este patrón al relacionar a los casos I y II o bien, III y IV.

Figura 4.8. Elementos del patrón cambio superior de la media.

Al elaborar el histograma de X se observará la mezcla de dos poblaciones, a medida que d

crece. Considerando X~N(0,1) y d=0,1,3,4 y 7 se puede observar este fenómeno. Ver figura

4.9. A medida que d es más grande que 0, se puede demostrar que X:

a) Tiene distribución normal para los datos X1.

b) Tiene distribución normal para los datos X2.

c) No tiene distribución normal.

p p + 1

X2~N(µ2,σ)

X1~N(µ1,σ)

n

X

d

42

d HISTOGRAMA PATRÓN DISTRIBUCIÓN

0

Fre

qu

en

cia

0.640.560.480.400.32

20

15

10

5

0

100806040200

0.7

0.6

0.5

0.4

0.3

Normal

1

Fre

qu

en

cia

0.70.60.50.40.3

30

25

20

15

10

5

0

100806040200

0.8

0.7

0.6

0.5

0.4

0.3

Normal

3

Fre

qu

en

cia

0.90.80.70.60.50.4

20

15

10

5

0

100806040200

0.9

0.8

0.7

0.6

0.5

0.4

0.3

Normal

4

Fre

qu

en

cia

1.050.900.750.600.450.30

18

16

14

12

10

8

6

4

2

0

100806040200

1.0

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

No normal

7

Fre

qu

en

cia

1.21.00.80.60.40.2

18

16

14

12

10

8

6

4

2

0

100806040200

1.2

1.1

1.0

0.9

0.8

0.7

0.6

0.5

0.4

0.3

No normal

Figura 4.9. Mezcla de poblaciones normales del patrón cambio superior del nivel de la

media.

43

4.7.4. Patrón de cambio inferior en la media.

La explicación de este patrón es semejante a la del patrón de cambio superior, salvo que:

a. µ1 < µ2.

b. El término dt de la ecuación 2, que se compone de los factores indicados en la ecuación

4, es negativo.

La figura 4.10 muestra el patrón típico de cambio inferior en la media.

Figura 4.10. Patrón de cambio inferior en la media

4.7.5. Patrón de tendencia creciente.

Una representación general de este patrón se observa en la figura 4.11.

Figura 4.11. Patrón de tendencia creciente

Es evidente que los puntos de la figura 4.11 se pueden ajustar a una recta con pendiente

positiva. Así, se puede demostrar que para toda t, Xt < Xt+1. La magnitud de la diferencia

X1

X2

44

aritmética Xt+1- Xt está relacionada con la pendiente de la recta de ajuste. La pendiente de esta

recta es modelada por d en el proceso simulador de Monte Carlo en la ecuación 2. Cabe hacer

mención que para los valores de d considerados, X resultó tener distribución normal o

aproximadamente normal. Ver figura 4.12.

d HISTOGRAMA PATRÓN

0

Fre

qu

en

cia

0.640.560.480.400.32

30

25

20

15

10

5

0

100806040200

0.65

0.60

0.55

0.50

0.45

0.40

0.35

1

C2

Fre

qu

en

cia

2.42.11.81.51.20.90.60.3

8

7

6

5

4

3

2

1

0 302520151050

2.25

2.00

1.75

1.50

1.25

1.00

0.75

0.50

2

4.23.63.02.41.81.20.60.0

8

7

6

5

4

3

2

1

0

302520151050

4.0

3.5

3.0

2.5

2.0

1.5

1.0

0.5

3

6.44.83.21.6-0.0

7

6

5

4

3

2

1

0

302520151050

6

5

4

3

2

1

0

Figura 4.12. Asociación del patrón de tendencia creciente con la distribución de

probabilidad de X (d = 1, 2 y 3)

4.7.6. Patrón de tendencia decreciente.

En este patrón se presentan las mismas características explicadas en el patrón de tendencia

creciente, salvo que aquí, la pendiente es negativa porque se puede demostrar que Xt > Xt+1

para t=1,2,3,…,n. Una figura típica de este patrón se muestra en la figura 4.13.

45

Figura 4.13. Patrón de tendencia decreciente.

46

Capítulo 5

PROCEDIMIENTO EMPLEADO Y RESULTADOS

OBTENIDOS.

El procedimiento empleado en la elaboración de esta investigación se explica a continuación:

a) Determinación del valor de los parámetros de la RNA que maximicen su

eficiencia predictiva.

Especificación de los valores de µ y σ a considerar, para el patrón

natural, y de “d” para los patrones de cambio en la media y

tendencia.

Generación de vectores X por simulación de Monte Carlo, para

cada tipo de patrón considerado, mediante programa elaborado en

MATLAB®

.

Generación del programa de cómputo en MATLAB®

para la

codificación de los vectores X.

Verificación de la permanencia de las características estadísticas

de los datos no codificados en los datos codificados.

Aplicación del diseño de experimentos para determinar los valores

adecuados de los parámetros de la red neuronal en la clasificación

de los patrones.

b) Diseño y validación del algoritmo de reconocimiento de patrones.

47

Obtención del algoritmo que use las mejores combinaciones de los

parámetros de la red neuronal en la clasificación de patrones.

Prueba experimental del algoritmo, mediante vectores generados

por simulación, con patrones no especiales y especiales.

Prueba práctica del algoritmo con vectores de datos obtenidos de

procesos de manufactura.

c) Determinación del impacto del algoritmo contra otras teorías y principios de

control de calidad aplicables al caso.

d) Prueba del algoritmo en el caso de aplicación.

5.1. Especificación de los valores de µ y σ para el patrón natural.

Se consideraron 4 casos de patrones naturales, a partir de los 4 casos de la distribución de X,

mostrados en la sección 4.7.2. donde X ~N(µ,σ) para µ = 0 y 3 y σ = 1 y 3. Las

combinaciones (0,3), (3,1) y (3,3) generan vectores con patrón natural, pero con variación

especial.

5.2. Generación de vectores de datos del patrón natural.

Se empleo el proceso generador de variables aleatorias con distribución normal normrnd(µ,σ)

de MATLAB®

para obtener los vectores de datos de la variable aleatoria X, tanto para el

entrenamiento de la red neuronal como para la prueba en la fase experimental.

5.3. Codificación de los datos del patrón natural.

La gama posible de valores de X en los 4 casos mostrados en la sección 4.7.2 se cubre con el

intervalo [-9.0;+9.0]. Este intervalo fue transformado al intervalo permitido por la operación

48

de la red neuronal en los vectores de entrenamiento y prueba, el cual es [0;1]. A este proceso,

se le llama codificación de X. La codificación se hizo con el programa elaborado en

MATLAB®

para este fin y mostrado en el anexo A.

Un aspecto relevante en la codificación de X es el aseguramiento de que el proceso usado

permita conservar sus características estadísticas, tales como forma y posición. Para saber

esto, se hizo un estudio comparativo que condujo a la validación del método de codificación

usado. En este estudio (ver anexo B) se generaron 100 datos de X con µ = 0 y σ = 1 y

posteriormente fueron codificados con el programa mostrado en el anexo A. Se calcularon las

estadísticas descriptivas para cada conjunto de datos y también se elaboraron diversos gráficos

para observar si prevalece su estructura estadística. El análisis estadístico se realizó con

Minitab®

Statistical Software. La conclusión es que el codificador no modifica las propiedades

estadísticas de la muestra original. Los datos codificados se denominan en esta tesis Xc.

5.4. Entrenamiento de la FuzzyARTMAP para el patrón natural.

Los vectores Xc generados para la experimentación con la red neuronal a partir de los valores

de la media y la desviación estándar considerados en esta tesis, fueron asociados a un vector

binario en la etapa de entrenamiento de la red neuronal. Dicha asociación se muestra en la

tabla 5.1. Tanto para el entrenamiento como para la prueba de la RNA, el orden de los

vectores se colocó aleatoriamente para evitar sesgos posibles de clasificación. Por cada caso

(I, II, III y IV de la tabla 5.1) se obtuvieron 50 vectores de 20 datos. Por tanto, el

entrenamiento de la red neuronal consideró 4 x 50 = 200 vectores.

Tabla 5.1. Asociación binaria para entrenamiento de red neuronal.

CASO µ σ CÓDIGO BINARIO

I 0 1 1 0 0 0

II 3 1 0 1 0 0

III 0 3 0 0 1 0

IV 3 3 0 0 0 1

49

5.5. Prueba de la FuzzyARTMAP para el patrón natural.

La prueba experimental de la red neuronal se llevó a cabo considerando 100 vectores por caso,

con el comportamiento natural propio de las condiciones de µ y σ de cada familia. En total,

hubo 100 x 4 = 400 vectores de prueba de 20 elementos cada uno. El orden de colocación de

estos en la sección de prueba de la red neuronal fue también aleatorio.

5.6. Aplicación del Diseño Experimental para el patrón natural.

5.6.1. Diseño del experimento.

El diseño del experimento, así como el análisis del mismo, fueron hechos con Minitab®

Statistical Software. La tabla 5.2 muestra el resumen del diseño de este experimento. La tabla

5.3 contiene los resultados de la experimentación así como las corridas experimentales.

Tabla 5.2. Resumen del diseño experimental para el patrón natural.

CONCEPTO VALOR

Tipo de experimento 22 con 1 punto al centro

Número de factores 2

Número de réplicas 2

Número de corridas 9

Variables de respuesta Eficiencia de clasificación8

Nivel de significancia 0.05

FACTORES FIJOS NIVEL FIJO

Vigilancia en modulo de entrada 1 (a1) 0.2 Razón de aprendizaje 1 (β1) 1.0

Vigilancia en el modulo de entrada (a,2) 0.2

FACTORES DE VARIACIÓN NIVELES

(-) (+)

Vigilancia en el módulo de salida (b1,2) 0.5 0.9

Razón de aprendizaje 2 (β2) 0.5 1.0

8 Entendida como el número de vectores clasificados correctamente divido entre el número de vectores probados.

Esta tasa se expresa en porcentaje.

50

Como se puede observar en la tabla 5.2, existen factores indicados como 1 y 2 y hay en su

símbolo los subíndices 1 y 2. Se explica que esto se debe a la consideración del factor en los

momentos de entrenamiento y prueba de la red neuronal, indicando con 1 al entrenamiento y

con 2 a la prueba. Los factores del experimento, fijos y de prueba, así como los niveles de este

último, se determinaron después de hacer experimentación preliminar para ubicar al área de

factibilidad experimental. Este estudio se muestra en los anexos C y D.

Tabla 5.3. Listado de corridas experimentales para el patrón natural.

NÚMERO DE

CORRIDA

ORDEN DE

CORRIDA

FACTORES/NIVELES

SIGNOS INTERACCIÓN EFICIENCIA

(%) b1,2 β2 b1,2 x β2

1 6 0.5 (-) 0.5 (-) (+) 65.01

2 1 0.9 (+) 0.5 (-) (-) 95.01

3 3 0.5 (-) 1.0 (+) (-) 57.00

4 4 0.9 (+) 1.0 (+) (+) 95.01

5 2 0.5 (-) 0.5 (-) (+) 56.99

6 8 0.9 (+) 0.5 (-) (-) 96.00

7 9 0.5 (-) 1.0 (+) (-) 65.00

8 7 0.9 (+) 1.0 (+) (+) 96.05

9 5 0.7 (0) 0.75 (0) 95.00

De aquí se obtienen los análisis estadísticos siguientes.

5.6.2. Análisis de varianza para el experimento con el patrón natural.

El análisis de varianza correspondiente al experimento para el patrón natural se muestra en la

tabla 5.4. Para este análisis se plantearon las hipótesis siguientes:

a) Para los efectos principales.

H0: El efecto de los factores de variación en la eficiencia de la red neuronal en la

clasificación correcta de patrones no es significativo.

51

H1: El efecto de al menos un factor de variación en la eficiencia de la red neuronal en

la clasificación correcta de patrones es significativo.

b) Para el efecto de curvatura.

H0: El efecto de curvatura de los factores de variación en la eficiencia de la red

neuronal en la clasificación correcta de patrones no es significativo.

H1: El efecto de curvatura de al menos un factor de variación en la eficiencia de la red

neuronal en la clasificación correcta de patrones es significativo.

Tabla 5.4. Análisis de varianza para el patrón natural.

FUENTE DE

VARIACIÓN

SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADOS

MEDIOS F p

Efectos principales 2382.92 2 1191.46 73.11 0.001

Interacción 0.009 1 0.00 0.00 0.997

Curvatura 249.13 1 249.13 15.29 0.017

Error 65.19 4 16.30

Total 2697.24 8

De acuerdo a los resultados de la tabla 5.4, se deben rechazar las dos hipótesis nulas

planteadas, pues p = 0.001 < 0.05 para la evaluación de los efectos principales y p = 0.017 <

0.05 para el efecto de curvatura de al menos un factor de prueba. Por otro lado, en cuanto a

las interacciones, no se puede afirmar que existan de manera significativa. Con esta

información se sabe entonces:

a) Al menos existe un factor de variación que influye en la eficiencia de la red

neuronal.

b) Al menos existe un factor de variación con efecto de curvatura significativo.

c) No hay interacciones significativas entre los factores de variación.

9 Valor aproximado a 0 por el software empleado.

52

5.6.3. Determinación de efectos principales y de coeficientes.

De los dos factores de variación probados, solamente el factor ρb1,2 tiene influencia

importante en la eficiencia de la red neuronal. Su efecto es de 34.5175 unidades en la variable

de respuesta, al pasar del nivel 0.5 a 0.9. Por tanto, se tiene el siguiente modelo ajustado para

predecir la eficiencia de la red neuronal en la clasificación correcta del patrón natural “Y”,

para vectores de X con distribución aproximadamente normal con µ = 0, 3 y σ = 1, 3. Ver

tabla 5.5.

Tabla 5.5. Tabla de efectos principales y coeficientes del modelo experimental.

TÉRMINOS/

CONSTANTES

EFECTOS

PRINCIPALES COEFICIENTE t p

Constante ------ 17.9000 54.83 0.000

ρb1,2 34.5175 86.2000 12.09 0.000

β2 0.0125 -0.0625 0.00 0.997

Interacción 0.0125 0.1250 0.00 0.997

R2 = 97.58% R

2(ajustada) = 95.17%

De los datos de esta tabla se obtiene la ecuación de regresión de la eficiencia de la red

neuronal respecto al parámetro ρb1,2:

Y = 86.2(ρb1,2) + 17.9

5.6.4. Análisis gráfico del experimento sobre el patrón natural.

Análisis de efectos.

Las figuras 5.1 y 5.2, confirman la información obtenida en las secciones 5.6.2. y 5.6.3. La

figura 5.1 separa los efectos de los factores de variación en significativos y no significativos.

Se observa que el único efecto significativo es el del factor ρb1,2.

53

La figura 5.2, indica el tamaño de los efectos de los factores de prueba. Se observa que el

efecto del factor ρb1,2 tiene una pendiente positiva grande, de tal forma que su influencia en la

eficiencia de la red neuronal es importante, tal como se ha mencionado con la ANOVA y la

figura 5.1. Aunque esta información ya se había obtenido en la ANOVA y sus efectos

visualizados, con la figura 5.2 se aprecian dos aspectos fundamentales:

a) El efecto estadístico de curvatura.

b) La tasa de cambio de la eficiencia de la red neuronal al pasar de los niveles bajos

de los factores a los niveles altos.

La curvatura es significativa, tal cual se concluyó con la ANOVA. En el caso del factor ρb1,2,

se observa que la eficiencia de la red neuronal tiene dos momentos importantes. El primero,

cuando ρb1,2 se ubica en el valor 0.5, la eficiencia es 60%, aproximadamente; después, la

eficiencia es 95% (aproximadamente) cuando el valor del factor ρb1,2 se ubica en 0.9. En un

ajuste lineal, ello genera una pendiente de 17.5. Al pasar el factor mencionado del nivel 0.5 al

nivel 0.9, la pendiente es 0.75. Esto genera la conclusión de que este factor influye mucho en

la red neuronal en el intervalo [0.5;0.7] y poco en el intervalo [0.7;0.9]. Por tanto, para la

clasificación del patrón natural, puede colocarse el factor ρb1,2 a partir de 0.7

Efectos estandarizados

Po

rcie

nto

14121086420-2-4

99

95

90

80

70

60

50

40

30

20

10

5

1

A

Figura 5.1. Efectos significativos del experimento con el patrón natural.

ρb1,2

ρb1,2 x β2

β2

54

Re

sp

ue

sta

me

dia

0.900.700.50

100

90

80

70

60

1.000.750.50

VIGILANCE LEARN RATE 2

Figura 5.2. Magnitud de los efectos de los factores de variación del experimento con el

patrón natural.

Análisis de idoneidad.

La validez de las conclusiones obtenidas en las secciones anteriores está supeditada a que se

cumplan tres supuestos del análisis de varianza: independencia, varianzas constantes y

normalidad. Estos tres conceptos se revisaron. Se muestran a continuación las gráficas y

conclusiones.

a) Independencia.

Al graficar los residuales contra el orden de las corridas del experimento, se obtiene la figura

5.3. En ésta, se puede apreciar cierto patrón de tendencia ascendente, lo que podría indicar

violación al principio de la independencia de los residuales. Se hizo la prueba Durbin-Watson

para determinar si hay cualquier correlación significativa. Esta prueba se hizo con el software

STATGRAPHICS®

. Así, se obtuvo que el estadístico Durbin-Watson = 2.50153 (p=0.1182)

con autocorrelación Lag 1 = -0.305126, lo que indica que no hay indicios de correlación de

serie en los residuos, pues al ser p mayor a 0.05 se acepta la hipótesis de que no existe

correlación significativa a un nivel de significancia de 0.05.

β2 ρb1,2

55

Orden de corrida

Re

sid

ua

l

987654321

4

3

2

1

0

-1

-2

-3

-4

-5

Figura 5.3. Residuales contra orden de corrida experimental para el experimento con el

patrón natural

b) Varianzas constantes.

En este análisis se elaboraron dos gráficos. En la figura 5.4 se aprecia que no existe igualdad

de varianza entre los dos niveles del factor significativo, ρb1,2, debido a la poca dispersión de

los puntos en el nivel alto comparada con la observada en el nivel bajo. No obstante, esto no

representa un problema importante en los resultados obtenidos, pues es en el nivel alto (donde

hay poca dispersión) donde se debe colocar el nivel del factor referido para maximizar la

eficiencia de la red neuronal. Esto último se observa en la figura 5.5, donde se tiene poca

dispersión alrededor del valor 96.0 del valor ajustado de la eficiencia de la red neuronal.

VIGILANCIA EN EL MÓDULO DE SALIDA

Re

sid

ua

l

0.90.80.70.60.5

4

3

2

1

0

-1

-2

-3

-4

-5

Figura 5.4. Residuales contra el factor ρb1,2 del experimento con el patrón natural

56

Valor ajustadoR

esid

ua

l10090807060

4

3

2

1

0

-1

-2

-3

-4

-5

Figura 5.5. Residuales contra valores ajustados de la eficiencia de la red considerando el

factor ρb1,2 del experimento con el patrón natural.

c) Normalidad.

De la figura 5.6, se deduce que los residuales no presentan evidencia importante que haga

asumir anormalidad en su distribución, ya que los puntos tienden a ubicarse siguiendo la línea

recta.

Residual

Po

rcie

nto

7.55.02.50.0-2.5-5.0

99

95

90

80

70

60

50

40

30

20

10

5

1

Figura 5.6. Gráfica de probabilidad normal de los residuales del experimento con el

patrón natural

57

5.6.5. Optimización de la eficiencia de la red neuronal.

Con un análisis de optimización se obtuvo el valor de nivel del factor ρb1,2 que maximiza la

eficiencia de la red neuronal en la clasificación del patrón natural. Este análisis se hizo

considerando que:

a) El tipo de respuesta (eficiencia) es una variable del tipo “mayor es mejor”, ya que son

valores altos los deseables.

b) El valor mínimo deseado para la eficiencia fue colocado en el análisis de optimización

en 90.0 %

c) El valor meta para la eficiencia considerado fue 98.0 %

Con estos parámetros, se obtuvo que la eficiencia predicha máxima alcanzable es 95.53% con

un valor 0.9 del factor ρb1,2. El factor de deseabilidad máximo obtenido fue 0.691. La tabla

5.6 muestra estos resultados.

Tabla 5.6. Optimización de la eficiencia de la red neuronal en la clasificación del patrón

natural

FACTOR VALOR DEL NIVEL EFICIENCIA ESTIMADA

(%) DESEABILIDAD

ρb1,2 0.70 95.00 0.625

β2 0.75

ρb1,2 0.90 95.50 0.688

β2 0.50

ρb1,2 0.00 95.53 0.691

β2 1.00

ρb1,2 0.90 95.53 0.691

β2 1.00

58

5.6.6. Validación experimental.

Se hizo una corrida confirmatoria de resultados, colocando los valores de los parámetros de la

red neuronal como se muestra en la tabla 5.7.

Tabla 5.7. Valores de los parámetros de la red neuronal que maximizan su eficiencia.

FACTOR VALOR DEL NIVEL

a1 0.2

β1 1.0

ρa2 0.2

ρb1,2 0.9

β2 1.0

Para la corrida confirmatoria se generaron 2000 vectores de tamaño 20 cada uno y se

obtuvieron los resultados indicados en la tabla 5.8.

Tabla 5.8. Resultados de la prueba confirmatoria de resultados.

CASO EFICIENCIA

ESPERADA (%)

EFICIENCIA

OBTENIDA (%)

I

95.53

100.0

II 100.0

III 100.0

IV 93.30

De estos resultados se confirma que el experimento es válido y condujo a eficiencias de la red

neuronal superiores a las esperadas en los casos I a III. El caso IV obtuvo menor eficiencia

que la predicha, con un error de 95.53% − 93.3% = 2.23%

5.6.7. Comparación con otros estudios.

Los resultados del experimento realizado con la clasificación del patrón natural, fueron

comparados con el estudio de referencia realizado por Hindi (2004). La tabla 5.9 muestra sus

resultados y los de esta tesis.

59

Tabla 5.9. Comparación de los resultados de esta investigación con un estudio similar.

RESULTADOS (EFICIENCIA, %)

CASO HINDI (2004) ESTA INVESTIGACIÓN

I 98.0 100.0

II 95.6 100.0

III 88.2 100.0

IV 89.8 93.30

PROMEDIO 92.9 98.3

Los resultados de esta investigación mejoran los obtenidos en el estudio previo.

Con esto concluye el experimento y los resultados sobre el patrón natural.

5.7. Especificación de los valores del efecto de variación especial.

Como se ha explicado, el valor del término “d” de la ecuación 2 es determinante en el tamaño

del efecto de la causa especial modelada por simulación de Monte Carlo. A diferencia del

patrón natural en estado de control, donde d → 0, en los patrones no naturales o bien, en el

natural, pero en estado fuera de control, d > 0. Ahora bien, como se ha explicado, todo vector

X con patrón natural tendrá distribución de probabilidad normal, lo que no se espera para los

patrones especiales. Esto es verdadero en ciertas condiciones y en ciertos patrones especiales,

ya que solo a partir del momento en que d > “a”, donde “a” es significativamente mayor que

0, se presenta anormalidad en X. Entonces, para d > a se espera que el patrón sea no natural y

adopte la característica de especial. Ahora bien, dentro del patrón natural, donde d → 0 pero n

crece, al grado de que la distribución de X sea normal pero tenga un patrón asociado a una

causa especial, se tiene un patrón natural en estado fuera de control estadístico. Por esta

razón, la selección adecuada de los valores de d es fundamental para ayudar a la predicción de

la red neuronal a tener menor error de predicción.

60

5.7.1. Cambio superior e inferior en el nivel de la media.

Se seleccionó un conjunto de 5 valores para el factor d de la ecuación 2. Para cada uno de

estos, se obtuvo una serie de 100 datos de X con µ = 0 y σ = 1 mediante simulación de Monte

Carlo de acuerdo a la ecuación 2 y se analizaron para determinar si las series tienen o no una

distribución normal usando la prueba de Anderson-Darling, tomando como referencia el valor

del estadístico “p”10

. Los resultados se muestran en la tabla 5.10.

Tabla 5.10. Tipo de distribución del vector X a distintos valores de “d”

d 1.0 2.0 2.5 3.0 4.0

p >0.05 >0.05 >0.05 <0.05 <0.05

DISTRIBUCIÓN normal normal normal no normal no normal

Estos resultados revelan hallazgos importantes al compararlos con los obtenidos en un estudio

experimental mostrado en el anexo E donde se observa que la red neuronal comienza a ser

eficiente en su predicción de este patrón a partir de d = 2.5. De este modo, para el patrón de

cambio en la media, a = 2.5

5.7.2. Tendencia creciente y decreciente.

A diferencia del patrón de cambio en la media, el patrón de tendencia creciente presenta una

característica específica: La distribución de X será siempre normal, sin importar la magnitud

de d, considerando d < 5 y un tamaño de vector de X menor a 30. Para obtener esta

conclusión, se probaron 50 vectores X, de tamaños 10, 20 y 30, a los valores d = 1, 2, 3, 4 y 5.

En el 100% de los casos, se aceptó la hipótesis de normalidad en X bajo la prueba de

Anderson-Darling.

10

Si p≤ 0.05 se rechaza la hipótesis de que los datos tienen distribución normal.

61

Esto podría confundir a la red neuronal, al clasificar este tipo de patrón como natural ya que

ambos patrones tienen distribución normal. La variable aleatoria X que sigue este patrón

(tendencia) está en función dos elementos, que son, la pendiente (d) y el tamaño del vector (n).

Su relación con la pérdida de control estadístico del proceso es directamente proporcional, de

tal forma que la rapidez con la que un valor X de un vector este fuera de los límites de control

del proceso depende de la magnitud de la pendiente y del número de datos considerados

(asociando cada dato a un periodo t). A valores mayores de pendiente y tamaño del vector,

mayor rapidez para tener valores de X fuera de los límites de control y viceversa. En esta

investigación, se consideró un tamaño de vector igual a 20 datos. Por esta razón, al ser “n”

constante, d es variable única.

Los límites de advertencia y de control aquí considerados son, respectivamente: (i) µ±2σ y

(ii) µ ±3σ. De este modo, como σ = 1 y µ = 0, se tiene que dichos límites son (i) -2 y +2 y

(ii) -3 y +3. Cuando el proceso se encuentra en control estadístico, se espera que µ = 0. A

partir de este valor, hay una amplitud permisible de variación de (i) ±2 y (ii) ± 3. Al dividir

esta amplitud entre el tamaño del vector, se tiene la magnitud asociada de “d”. De este modo,

con n = 20, se tiene que con (i) d = 2/20 = 0.1 y (ii) d = 3/20 = 0.15, con lo que se estarían

considerando casos de patrones con cercanía a los limites de advertencia (i) y control (ii) en

un patrón de tendencia.

5.8. Generación de vectores de datos de patrones especiales.

Se empleó el proceso generador de variables aleatorias por simulación de Monte Carlo,

descrito en secciones anteriores usando MATLAB®

.

5.9. Codificación de los datos de los patrones especiales.

La codificación se hizo con el programa elaborado en MATLAB®

para este fin y mostrado en

el anexo A.

62

5.10. Entrenamiento de la FuzzyARTMAP para los patrones especiales.

Los vectores X generados para la experimentación con la red neuronal para los patrones

especiales de variación, a partir de X~N(0,1), afectándolos por los valores de d de cada tipo de

patrón especial, fueron asociados a un vector binario en la etapa de entrenamiento de la red

neuronal. Esto se muestra en la tabla 5.11. Cabe hacer mención que el orden de colocación de

los vectores fue aleatorio para evitar sesgos posibles de clasificación. Por cada patrón a cada

valor específico de d se obtuvieron 50 vectores de 20 datos. Son 4 patrones especiales

considerados (cambio superior de la media, cambio inferior de la media, tendencia creciente y

tendencia decreciente) y cada uno contempla 2 valores de d. Lo anterior hace un total de

50x4x2 = 400 vectores de entrenamiento.

Tabla 5.11. Asociación del patrón especial con el código binario para el entrenamiento de

la FuzzyARTMAP.

CASO PATRÓN d. CÓDIGO BINARIO

1 Cambio superior de la media +3.00 1 0 0 0

2 Cambio superior de la media +4.00 1 1 0 0

3 Cambio inferior de la media -3.00 0 1 0 0

4 Cambio inferior de la media -4.00 0 1 1 0

5 Tendencia creciente +0.10 0 0 1 0

6 Tendencia creciente +0.15 0 0 1 1

7 Tendencia decreciente -0.1 0 0 0 1

8 Tendencia decreciente -0.15 1 0 0 1

5.11. Prueba de la FuzzyARTMAP para los patrones especiales.

Los vectores empleados para la prueba experimental de la red neuronal, fueron obtenidos por

simulación de Monte Carlo, de acuerdo a lo descrito anteriormente, en MATLAB®

. Se usaron

50 vectores por cada caso indicado en la tabla 5.11, por lo que fueron 8x50 = 400 vectores de

prueba. Su colocación en el archivo de prueba de la red neuronal fue aleatorio.

63

5.12. Aplicación del Diseño Experimental para patrones especiales.

5.12.1. Diseño del experimento.

El diseño del experimento, así como el análisis del mismo, fueron hechos con Minitab®

Statistical Software. La tabla 5.12 muestra el resumen del diseño de este experimento.

5.12.2. Análisis de Varianza.

El análisis de varianza de este experimento se muestra en la tabla 5.13. Los resultados indican

que al menos un efecto principal es significativo, así como también el efecto de curvatura de al

menos uno de los factores.

Tabla 5.12. Resumen del experimento para clasificar patrones especiales.

CONCEPTO VALOR

Tipo de experimento Diseño factorial fraccionado, 2k

Número de factores 7 a dos niveles

Resolución III

Número de réplicas 2

Número de corridas 18

Bloques 1

Puntos centrales 2

Diseño generador de alias D = AB, E = AC, F = BC, G = ABC

Variable de respuesta Eficiencia de predicción

Nivel de significancia 0.05

LETRA FACTORES

BAJO (-)

NIVEL

ALTO (+)

A Vigilancia en el modulo de entrada 1 (ρa1) 0.2 0.8

B Vigilancia en el campo de mapeo 1 (ab1) 0.2 0.8

C Razón de aprendizaje 1 (β1) 0.2 1.0

D Vigilancia en el modulo de salida (ρb1,2) 0.2 0.8

E Vigilancia del campo de mapeo 2 (ab2) 0.2 0.9

F Razón de aprendizaje 2 (β2) 0.2 1.0

G Vigilancia en el modulo de entrada 2 (ρa2) 0.2 0.8

64

Tabla 5.13. ANOVA para el experimento de clasificación de patrones especiales.

FUENTE DE

VARIACIÓN

SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADOS

MEDIOS F p

Efectos principales 7445.56 7 1063.65 804.44 0.000

Curvatura 31.64 1 31.64 23.93 0.001

Error 11.90 9 1.32

Total 7489.10 17

5.12.3. Efectos y coeficientes.

Los efectos principales de los factores significativos de esta experimentación, así como sus

coeficientes en la ecuación de regresión se muestran en la tabla 5.14.

Tabla 5.14. Tabla de efectos principales y coeficientes del modelo experimental para

patrones especiales.

TÉRMINOS/

CONSTANTES

EFECTOS

PRINCIPALES

COEFICIENTE

EN UNIDADES

CODIFICADAS

t p

Constante +10.53 +36.63 <0.05

ρa1 -18.51 -9.26 -32.2 <0.05

ab1 -13.54 -6.77 -23.55 <0.05

β1 -13.54 -6.77 -23.55 <0.05

ρb1,2 +13.54 +6.77 +23.55 <0.05

ab2 +13.54 +6.77 +23.55 <0.05

β2 +18.66 +9.33 +32.46 <0.05

ρa2 -20.91 -10.46 -36.37 <0.05

R2 = 99.84% R

2(ajustada) = 99.7%

De los resultados se puede confirmar que hay efectos significativos y que éstos son los 7

factores considerados en la experimentación, o bien, sus interacciones en efectos confundidos.

5.12.4. Análisis gráfico.

Análisis de efectos.

La figura 5.7 representa la significancia de los efectos de los factores estudiados en este

experimento. Se observan los cambios en la eficiencia de la clasificación de la red neuronal al

65

cambiar el nivel de bajo a alto de cada uno de estos. Se observa que ρa1, ρab1, β1 y ρa,2 tienen

pendiente negativa, lo que indica que tienen mejor desempeño en el nivel bajo, dado que la

variable de respuesta es mayor es mejor. Lo contrario ocurre con los factores ρb1,2, ρab2 y β2.

Los 7 factores presentan efecto de curvatura, pero no hay evidencia de que en su nivel central

mejoren el desempeño de la red neuronal que los niveles alto o bajo.

Efi

cie

ncia

me

dia

0.800.500.20

20

10

0

0.800.500.20 1.000.600.20

0.800.500.20

20

10

0

0.800.500.20 1.000.600.20

0.800.500.20

20

10

0

BV 1 RM1 LR1

V RM2 LR2

BV 2

Figura 5.7. Efectos de los factores significativos de la experimentación con patrones

especiales.

Análisis de idoneidad.

La gráfica de los residuales contra el orden de las corridas experimentales muestra que no hay

evidencia de violación al principio de independencia de los residuales al mostrar un patrón

aleatorio (ver figura 5.8). En la figura 5.9 no se observa que las varianzas puedan ser

significativamente diferentes, no obstante, la menor dispersión se presenta en valores altos de

la eficiencia de la red neuronal, lo cual no genera problema de experimentación. Finalmente,

la figura 5.10 presenta los puntos residuales ajustados a una distribución normal. Aunque el

ajuste no es perfecto, es posible tolerar ciertas desviaciones (Gutierrez y de la Vara, 2004).

ρa1 ρab1 β1

ρb1,2 ρap2 β2

ρa2

66

Orden de corridaR

esid

ua

l18161412108642

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5

Figura 5.8. Residuales contra el orden de las corridas experimentales de la

experimentación con patrones especiales.

Valor ajustado

Re

sid

ua

l

706050403020100

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5

Figura 5.9. Residuales contra valor ajustado de la experimentación con patrones

especiales.

Residual

Po

rce

nta

je

210-1-2

99

95

90

80

70

60

50

40

30

20

10

5

1

Figura 5.10. Gráfica de probabilidad normal de los residuales del experimento con

patrones especiales.

67

5.12.5. Validación experimental.

Para validar los resultados experimentales obtenidos en el uso de la red neuronal, se corrió una

prueba confirmatoria, operando la red neuronal a los niveles adecuados, que son: ρa1, ρab1, β1 y

ρa2 al nivel bajo, que es 0.2. Los factores ρb1,2, ρab2 y β2 tienen efectos con pendientes positivas,

lo que indica fijar el nivel en el valor alto, que es 0.8, 0.8 y1.0, respectivamente. La prueba de

confirmación consideró 400 vectores de tamaño 20 y se obtuvieron los siguientes resultados

(Tabla 5.15).

Tabla 5.15. Resultados de la prueba confirmatoria del experimento con patrones

especiales.

PATRÓN ESPECIAL EFICIENCIA DE

CLASIFICACIÓN

Cambio superior del nivel de la media d = 3, 4 96%

Cambio inferior del nivel de la media d = -3, -4 80%

Tendencia creciente d = 0.1, 0.15 86%

Tendencia decreciente d = -0.1, -0.15 96%

Promedio 90%11

11

Del 10% faltante al 100%, el 80% de los vectores fueron confundidos por la red neuronal entre ese mismo

grupo de patrones (por ejemplo el patrón de tendencia creciente por el patrón de cambio superior en el nivel de la

media). El 20% fue confundido con patrones no especificados.

68

Capítulo 6

MÉTODO PROPUESTO DE CONTROL ESTADÍSTICO DE

PROCESOS.

6.1. Método propuesto de control de procesos por reconocimiento de patrones.

El método propuesto consta de tres elementos: Proceso de aprendizaje, proceso de control y el

uso de la base de datos mejorada en su valor (BDM), tal como se muestra en la figura 6.1. El

primer elemento contiene tres subelementos, llamados, variable aleatoria (muestra de datos de

tamaño 20), aprendizaje (por la FuzzyARTMAP) de la base de datos inicial (BDI) y el

aprendizaje de la base de datos combinada (BDM + BDI).

Figura 6.1. Método de control de procesos

Inicialmente la FuzzyARTMAP es entrenada con la BDI, la cual está formada por los vectores

de datos con patrones especiales (natural fuera de control, cambio en la media y tendencia) y

no especiales (natural en control) generados por simulación. Posteriormente, esta BDI se

convierte en la BDM cuando la BDI es aumentada con vectores de datos obtenidos del proceso

de manufactura que no hayan sido reconocidos por el algoritmo de la figura 6.2. Tanto la BDI

Reconocimiento

de patrones

Control

Proceso de control

Base de datos mejorada

Variable aleatoria

BDI

BDM+BDI

Proceso de aprendizaje

69

como la BDM contienen a dos bases de datos internas, reservadas para agrupar a los vectores

de datos con distribución normal y no normal. Se asume que los vectores de datos con

distribución normal tienen patrón natural en alguno de dos tipos: (i) patrón natural en estado

de control estadístico (cuando µ y σ se mantienen cercanos o iguales a los valores deseados) y

(ii) patrón natural en estado fuera de control estadístico (cuando µ y/o σ han cambiado

significativamente, pero no al grado de generar anormalidad en la distribución de los datos del

vector). Los valores de µ y σ deseados para mantener al nivel de calidad de la producción

dentro de las especificaciones, están denotados por ε y τ respectivamente. Por otra parte, los

vectores de datos con distribución de probabilidad no normal forman la segunda base de datos

interna de BDI y BDM. Aquí se tienen a los datos cuyo patrón es cualquiera que no tenga

distribución normal y es, por ende, especial.

Figura 6.2. Algoritmo de control del proceso.

Reconocimiento de patrones Control

Vector X

Preparación de datos:

1. Estandarización.

2. Codificación.

3. Prueba de normalidad.

Tiene X

distribución normal?

Sí No

Ajustar los

parámetros de

la ANN a casos

normales

Ajustar los

parámetros de

la ANN a casos

no normales

Clasificación

del patrón

Patrón

conocido?

No

Sí

Patrón de

inestabilidad?

Sí

No

Cambio en µ y/o

σ respecto a ε y τ

Identificar causa

de variación

especial por tipo

de patrón

Restablecimiento

del control del

proceso

BDM

Nuevo vector X

Nuevo vector X

Acción

humana

Análisis

estadístico

Hacia proceso

de aprendizaje

70

La figura 6.2 se explica como sigue:

Vector X.

Se selecciona del proceso de manufactura una muestra de 20 datos consecutivos y ordenados

en el tiempo. No hay precisión sobre la frecuencia de colecta de datos, pudiendo ser de una

muestra cada 30 minutos, o bien, continua, si este algoritmo es procesado por medios

computacionales e incorporado al proceso de manufactura. Los datos pueden ser continuos o

discretos. Si son discretos, entonces se deberá considerar la fracción de disconformes.

Estandarización.

El vector X debe ser estandarizado con la ecuación 5, considerando los valores ε y τ.

𝑋𝐸 =𝑋 − 𝜀

𝜏 (5)

donde:

XE : Vector de datos estandarizados en función de ε y τ.

X: Vector de datos tomados del proceso de manufactura.

ε : Valor medio objetivo de la característica de calidad.

τ : Valor de la desviación estándar objetivo de la característica de calidad.

Codificación.

El vector XE se debe transformar en el vector Xc, donde Xc contiene 20 datos Xci, para

i = 1,2,3,…20 distribuidos dentro del intervalo [0;1]. La transformación se hace mediante el

programa elaborado para este propósito y que se muestra en el anexo A.

71

Prueba de normalidad.

Existen muchas pruebas de verificación de la normalidad de los datos. Se señalan: Anderson-

Darling, Kolmogorov y Shapiro-Wilks. Se debe seleccionar cualquiera de éstas para probar la

hipótesis de la normalidad de los datos contra la alterna de que no lo son.

Aplicación de la red neuronal.

Hay dos estados de aplicación de la red neuronal, que son, (i) cuando X se distribuye de forma

normal y (ii) cuando X no se distribuye de forma normal, ver tabla 6.1.

Tabla 6.1. Estados de uso de la red neuronal.

PARÁMETRO DE LA RED

NEURONAL

AJUSTADOS A DATOS

NORMALES

AJUSTADOS A DATOS

NO NORMALES

ρa1 0.2 0.2

ab1 cualquiera 0.2

β1 1.0 0.2

ρb1,2 0.9 >0.7

ab2 Cualquiera 0.8

β2 1.0 1.0

ρa2 0.2 0.2

Clasificación del patrón.

Después de aplicar la red neuronal en cualquiera de los dos estados indicados en la tabla 6.1 se

pueden obtener los patrones mostrados en la tabla 6.2.

72

Tabla 6.2. Clasificación del patrón por algoritmo.

TIPO DE PATRÓN INDICATIVO DEL ESTADO DEL PROCESO

Natural en control En control estadístico

Natural fuera de control Fuera de control estadístico

Cambio superior de la media Fuera de control estadístico

Cambio inferior de la media Fuera de control estadístico

Tendencia creciente Fuera de control estadístico

Tendencia decreciente Fuera de control estadístico

Patrón conocido y patrón de inestabilidad.

Después de haber procesado el vector X por la red neuronal, puede ocurrir que esta detecte un

patrón conocido o bien, este sea clasificado como desconocido. Si el patrón es conocido

entonces éste puede ser cualquiera de los indicados en la tabla 6.2 y el estado de control del

proceso habrá quedado definido. En caso de ser el estado de control como de estabilidad,

entonces el siguiente vector de datos deberá ser procesado por el algoritmo; si el patrón es de

inestabilidad, una causa especial de variación tiene que ser detectada (ver tabla 6.3.) y

suprimida para restablecer el control estadístico del proceso. En el caso de que el patrón sea no

conocido, la intervención humana es necesaria para aplicar las técnicas estadísticas

descriptivas y determinar el tipo de patrón que corresponda a la variación de estos datos. Si

esto ocurre, dicho patrón es adicionado a la BDI para obtener la BDM.

6.2. Determinación de causas especiales de variación.

Gutiérrez y de la Vara (2004) explican la asociación existente entre los patrones especiales y

las causas de variación que los originan. Esto, se resume en la tabla 6.3. No obstante, la

información indicada es de uso y aplicación general a cualquier proceso de manufactura, pero

no particular, por lo que deberán generase más causas especiales asociadas a los patrones, en

base al aprendizaje continuo del proceso de manufactura.

73

Tabla 6.3. Identificación de patrones especiales y su relación con causas de variación.

PATRÓN ESPECIAL CAUSAS PROBABLES

Natural en estado fuera de control

Cambios (superior o inferior) del

nivel de la media.

Introducción de nuevos trabajadores, máquinas,

materiales o métodos.

Cambios en los métodos de inspección.

Cambio en el nivel de atención de los trabajadores.

Mejoramiento o empeoramiento del proceso.

Tendencias (creciente o decreciente).

Deterioro o desajuste gradual del equipo de producción.

Desgaste de herramientas.

Calentamiento de maquinaria.

Cambios graduales en las condiciones ambientales.

6.3. Validación del algoritmo de identificación de la estabilidad del proceso.

La validación del algoritmo se llevó a cabo en dos etapas: experimental y de aplicación. La

primera consistió en la prueba con 12,500 vectores X generados por simulación de Monte

Carlo, tal cual se ha explicado en secciones anteriores. De estos vectores, 500 corresponden a

cada patrón enlistado en la tabla 6.4. La validación por aplicación está referida a la prueba del

algoritmo en dos casos de empresas de industrias distintas y de tipo de variable aleatoria

diferente.

Validación experimental.

La tabla 6.4 indica 25 divisiones de los patrones natural, cambio superior de la media, cambio

inferior de la media, tendencia creciente y tendencia decreciente. Se observan los valores de

los parámetros a los que fueron generados, así como también si el tipo de distribución es

normal o no.

La tabla 6.5 fue generada a partir de probar 25x500=12,500 vectores X. Se clasifica a cada

tipo de patrón como estable o inestable en función de su definición. El grupo de los 500

vectores de cada uno de los 25 patrones fue procesado de acuerdo al método de la figura 6.1 y

al algoritmo de la figura 6.2 Se aprecian los patrones donde el algoritmo tiene eficiencia

elevada de clasificación.

74

Tabla 6.4. Tipos de patrones para validación experimental.

PATRÓN PARÁMETROS TIPO DE DISTRIBUCIÓN12

NUM TIPO µ σ d

1 Natural 0.0 1.0 0.0 Normal











12 Cambio superior de la media 0.0 1.0 1.0 Normal

13 Cambio superior de la media 0.0 1.0 2.0 normal13

14 Cambio superior de la media 0.0 1.0 3.0 normal14

15 Cambio superior de la media 0.0 1.0 4.0 no normal

16 Cambio inferior de la media 0.0 1.0 1.0 Normal

17 Cambio inferior de la media 0.0 1.0 2.0 normal15

18 Cambio inferior de la media 0.0 1.0 3.0 normal16

19 Cambio inferior de la media 0.0 1.0 4.0 no normal

20 Tendencia creciente 0.0 1.0 0.05 Normal



23 Tendencia decreciente 0.0 1.0 -0.05 Normal



12

Prueba de normalidad hecha con la prueba de Anderson-Darling, con α=0.05 y aplicada a una muestra de 30

vectores de tamaño 20 para cada caso. 13

El 90% de los vectores tuvo distribución normal. 14



El 70% de los vectores tuvo distribución normal.

75

Tabla 6.5. Resultados de la validación experimental.

MUESTRAS TIPO DE PATRÓN TIPO DE

PROCESO

% DE CASOS DE

CLASIFICACIÓN

CORRECTA DEL PROCESO

(EN CONTROL/FUERA DE

CONTROL)

1 Natural no especial

Estable 99.8%

2 a 4

Natural especial por cambio

solo en µ, menor a 1.5σ

Inestable Menor a 50%

5 a 8 Natural especial por cambio

solo en σ, menor a 3σ Inestable 88.2% promedio

9 a 11

Natural especial por cambio

solo en µ, cuando σ=3

Inestable 99.8% promedio

12

Cambio pequeño superior en

la media con distribución

normal

Inestable 12%

13 y 14

Cambio superior en la media

con distribución normal


15

Cambio superior en la media

con distribución NO normal

Inestable 91%

16

Cambio pequeño inferior en la

media con distribución normal

Inestable 20.0%

17 y 18

Cambio inferior en la media

con distribución normal

Inestable 95% promedio

19

Cambio inferior en la media

con distribución NO normal

Inestable 77.8%

20 a 22

Tendencia creciente (de

pequeña a no pequeña)


23 a 25

Tendencia decreciente (de

pequeña a no pequeña)

Inestable 91%

De la tabla 6.5 se puede observar que los mejores resultados se encuentran en las muestras 1, 5

a 11, 13 a 15, 17, 18 y 20 a 25. En todas las muestras restantes se obtuvieron eficiencias bajas.

Al verificar estas muestras en la tabla 6.4 se obtiene la información de que comparten la

76

característica de lo que en control estadístico de procesos se denomina “cambios pequeños”, lo

que conduce a generar la conclusión de que el algoritmo propuesto no es eficiente para este

tipo de casos.

Validación por aplicación.

Se valido el algoritmo en dos casos de aplicación distintos entre si al tratarse de dos empresas

y dos tipos de variables aleatorias diferentes. A continuación se muestran los resultados y el

análisis estadístico correspondiente.

Caso 1. Variable aleatoria discreta.

En este caso se analizó a una empresa dedicada a la fabricación y distribución de productos

cosméticos. Esta empresa divide sus periodos de producción en campañas, teniendo 15 en el

año. Los datos tomados corresponden a una campaña. Estudios previos a los mostrados en

esta tesis, sugieren que no hay diferencia significativa en el nivel y comportamiento de la

calidad de producción entre los 15 periodos laborales, por lo que tomar uno de estos es

seleccionar una muestra representativa de la conducta anual de trabajo de la empresa.

La variable aleatoria estudiada es discreta y se traslada a la fracción de disconformes. Las

muestras de datos, llamadas vectores X, fueron tomadas del proceso de manufactura como se

indica en la tabla 6.6 bajo el concepto de vector móvil.

De este modo se recabaron los datos de los 21 vectores mostrados en la tabla 6.7, que son las

unidades defectuosas en las muestras tomadas. Los datos de la tabla 6.7 se trasladaron a

valores fraccionales, para obtener la fracción defectuosa, p, de cada dato. Estos datos se

muestran más adelante. Las gráficas y el tipo de patrón observado de estos 21 vectores se

muestran en la figura 6.3.

77

Tabla 6.6. Vectores móviles.

NÚMERO DE DATO

t.

1 2 3 …

VECTOR X1 VECTOR X2 VECTOR X3 …

1 X1

2 X2 X1

3 X3 X2 X1 4 X4 X3 X2

…

5 X5 X4 X3

6 X6 X5 X4

7 X7 X6 X5

8 X8 X7 X6

9 X9 X8 X7

10 X10 X9 X8

11 X11 X10 X9

12 X12 X11 X10

13 X13 X12 X11

14 X14 X13 X12

15 X15 X14 X13

16 X16 X15 X14

17 X17 X16 X15

18 X18 X17 X16

19 X19 X18 X17

20 X20 X19 X18

21

X20 X19

22

X20

23

…

78

Tabla 6.7. Número de unidades defectuosas en una muestra de tamaño n, en el tiempo t.

t

X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 8 5 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4

2 5 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2

3 2 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3

4 2 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7

5 3 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1

6 1 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7

7 6 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2

8 5 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1

9 0 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5

10 5 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5

11 11 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2

12 0 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4

13 1 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2

14 2 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2

15 1 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2

16 3 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4

17 1 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4

18 0 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2

19 5 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2

20 4 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2 0

21 2 3 7 1 7 2 1 5 5 2 4 2 2 2 4 4 2 2 0 4

79

X GRÁFICA PATRÓN

OBSERVABLE X GRÁFICA

PATRÓN

OBSERVABLE

1

Tendencia

decreciente 12

Tendencia

creciente con

pendiente 0.16

2

Pendiente 0 con

patrón especial 13

Tendencia

creciente con

pendiente 0.11

3

Pendiente 0 con

patrón especial 14

Tendencia

creciente con

pendiente 0.06

4

Patrón natural 15

Tendencia

creciente con

pendiente 0.04

5

Patrón natural 16

Patrón natural

6

Patrón natural 17

Patrón natural

7

Patrón natural 18

Tendencia

decreciente con

pendiente -0.02

8

Pendiente 0 con

patrón especial 19

Tendencia

decreciente con

pendiente -0.09

9

Tendencia

creciente con

pendiente 0.04

20

Tendencia

decreciente con

pendiente -0.1

10

Patrón natural 21

Tendencia

decreciente con

pendiente -0.08

11

Pendiente 0 con

patrón especial

Figura 6.3. Gráficas de los 21 vectores X de la empresa del caso 1.

80

La fracción de unidades defectuosas, o fracción disconforme, se define por

𝑝 = 𝑦

𝑛 (6)

donde:

p: fracción de disconformes.

y: número de piezas encontradas defectuosas en la muestra.

n: tamaño de la muestra.

Como y es una variable aleatoria discreta tipo Bernoulli, que sigue una distribución de

probabilidad Binomial, entonces sus parámetros son µ = n(p) y σ2 = µ(1 – p). Por otra parte,

la distribución de probabilidad de y será aproximadamente normal si µ > 517

.

Con esta información, tomando el horizonte de datos de un año completo de la empresa se

tiene que p = 0.0095. Este valor dista del deseado, el cual es de 0.005, para mantener al nivel

de calidad en 99.5%.

En los muestreos que se llevan a cabo en la empresa, 138n , por lo que los parámetros de y

son µ = 138(0.0095) = 1.311 unidades defectuosas en una muestra de tamaño 138 con σ2 =

1.311(1-0.0095) = 1.29. A valores tan pequeños de p y/o n, no se puede asegurar que la

distribución de probabilidad normal pueda ser usada para aproximar a la binomial, que estará

sesgada, y por tanto, no habrá posibilidad de calcular los límites de control por ausencia de

simetría. La figura 6.4 muestra la distribución de probabilidad asociada a este caso, junto con

los datos numéricos.

17

Este valor es empírico, pero es comúnmente aceptado. La referencia no empírica es cuando el tamaño de la

muestra crece.

81

y f(y)

0 0.5

1 0.3472

2 0.1195

3 0.0272

4 0.0046

Figura 6.4. Forma sesgada de la distribución de probabilidad para el caso de validación 1

Para el nivel de muestreo de 138 unidades inspeccionadas y para el valor meta de la fracción

de disconformes, que es de 0.005, se tiene que εp = 0.005. Si se desea tener esta información

no en términos de la fracción de defectuosos sino a través de las unidades no conformes,

entonces εy = 0.69 y τy = 0.832. Dicho de otra forma, para que el nivel de calidad de la

empresa se encuentre en 99.5% es necesario que la fracción de disconformes se ubique en

0.005, o bien, que el número medio de piezas defectuosas en un tamaño muestral medio de

138 piezas sea de 0.69 con una desviación estándar de 0.832. Ambas expresiones son

equivalentes.

Sabiendo que la teoría de los gráficos de control tradicionales indica que es necesario eliminar

las causas de variación especial antes de instalar un gráfico de control, pues de otro modo, éste

no hará más que indicar estados fuera de control continuamente, por inspección de los datos,

se concluye que este proceso de producción no está libre de causas de variación especial. De

este modo, se asume que los 21 vectores arrojan la información de un proceso sin control

estadístico, por lo que no es necesario elaborar gráficos de control para conocer esto.

La tabla 6.8 contiene los datos de la empresa puestos como la fracción no conforme.,

considerando su tamaño de muestra específico.

0

0.1

0.2

0.3

0.4

0.5

0.6

0 1 2 3 4

82

Tabla 6.8. Fracción no conforme de unidades revisadas en la empresa caso 1.

t.

Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 0.0734 0.0625 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248

2 0.0625 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222

3 0.0392 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186

4 0.0123 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438

5 0.0294 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111

6 0.0110 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429

7 0.0373 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123

8 0.0313 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111

9 0.0000 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249

10 0.0307 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200

11 0.0683 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160

12 0.0000 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247

13 0.0050 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118

14 0.0080 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247

15 0.0079 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124

16 0.0188 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235

17 0.0063 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444

18 0.0000 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124

19 0.0376 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117

20 0.0248 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117 0.0000

21 0.0222 0.0186 0.0438 0.0111 0.0429 0.0123 0.0111 0.0249 0.0200 0.0160 0.0247 0.0118 0.0247 0.0124 0.0235 0.0444 0.0124 0.0117 0.0000 0.0500

Para los datos de la tabla 6.7, como se mencionó, εy = 0.69 y τy = 0.832; los datos de la tabla

6.8 se asocian con εp = 0.005. En esta tesis, se usaron los primeros valores meta, es decir, εy =

0.69 y τy = 0.832. Continuando con el algoritmo, los datos deben ser estandarizados y

codificados. La estandarización se hizo con la ecuación 6 y la codificación de acuerdo con el

programa codificador mostrado en esta tesis. Los resultados estandarizados se indican en la

tabla 6.9. La tabla 6.10 contiene los datos codificados.

Tabla 6.9. Datos estandarizados de la empresa del caso 1

t.

X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 8.786 5.180 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978

2 5.180 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575

3 1.575 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776

4 1.575 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584

5 2.776 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373

6 0.373 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584

7 6.382 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575

8 5.180 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373

9 -0.829 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180

10 5.180 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180

11 12.392 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575

12 -0.829 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978

13 0.373 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575

14 1.575 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575

15 0.373 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575

16 2.776 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978

17 0.373 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978

18 -0.829 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575

19 5.180 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575

20 3.978 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575 -0.829

21 1.575 2.776 7.584 0.373 7.584 1.575 0.373 5.180 5.180 1.575 3.978 1.575 1.575 1.575 3.978 3.978 1.575 1.575 -0.829 3.978

83

Tabla 6.10. Datos codificados de la empresa del caso 1

t.

X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 0.988 0.788 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721

2 0.788 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587

3 0.587 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654

4 0.587 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921

5 0.654 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521

6 0.521 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921

7 0.855 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587

8 0.788 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521

9 0.454 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788

10 0.788 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788

11 1.188 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587

12 0.454 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721

13 0.521 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587

14 0.587 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587

15 0.521 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587

16 0.654 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721

17 0.521 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721

18 0.454 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587

19 0.788 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587

20 0.721 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587 0.454

21 0.587 0.654 0.921 0.521 0.921 0.587 0.521 0.788 0.788 0.587 0.721 0.587 0.587 0.587 0.721 0.721 0.587 0.587 0.454 0.721

Se aplicó la prueba de normalidad Anderson Darling para conocer como se distribuye cada

vector y se obtuvo la información mostrada en la tabla 6.11.

Tabla 6.11. Clasificación de los vectores de acuerdo al tipo de su distribución de

probabilidad.

X ESTADÍSTICO

p DISTRIBUCIÓN X

ESTADÍSTICO

p DISTRIBUCIÓN

1 0.071 normal 12 0.071 normal

2 0.034 no normal 13 0.038 no normal


4 0.077 normal 15 0.039 no normal






10 0.055 normal 21 0.016 no normal

11 0.019 no normal

Finalmente, los patrones fueron identificados y el proceso de producción diagnosticado. La

tabla 6.12 contiene esta información.

84

Tabla 6.12. Resultados obtenidos por el algoritmo identificador de estados de control

para la empresa del caso 1

Xi TIPO DE

DISTRIBUCIÓN

ESTADO DEL

PROCESO

RESULTADO POR ALGORITMO CON

BDI

RESULTADO POR ALGORITMO CON

BDM18

1 Normal Fuera de

control

Cambio en µ y en σ, respecto a ε y

τ respectivamente (caso IV tabla 3) No aplica

2 No normal Fuera de

control Tendencia creciente Pendiente 0 con patrón especial



4 Normal Fuera de

control



5 Normal Fuera de

control



6 Normal Fuera de

control



7 Normal Fuera de

control






control Tendencia creciente Tendencia creciente

10 Normal Fuera de

control

Cambio solo en µ respecto a ε

(caso II tabla 3) No aplica



12 Normal Fuera de

control




control Cambio superior No aplica


control Tendencia creciente No aplica


control Tendencia creciente No aplica

16 Normal Fuera de

control



17 Normal Fuera de

control



18 Normal Fuera de

control









18

Después de agregar a la BDI tres vectores no reconocidos, uno a la vez.

85

Al usar el algoritmo identificador de estados de control del proceso, se obtuvieron eficiencias

diferentes de acuerdo al uso de las bases de datos de entrenamiento, partiendo de la BDI. Al

usar este algoritmo con la BDI, se tuvo una eficiencia de reconocimiento de patrones del 62%

de los 21 mostrados en la tabla 6.9. Al agregar el vector 2 a la BDI se generó la BDM y con

esta se tuvo una eficiencia de 76%. Se agregaron dos vectores más y la eficiencia fue de 90%.

Caso 2. Variable aleatoria continua.

El segundo caso para la validación práctica del algoritmo identificador de estados de control

de manufactura corresponde a una empresa dedicada a la elaboración de productos lácteos. El

producto en cuestión es un tipo de queso en presentación individual de 400 grs de peso. Los

vectores formados a partir de los datos recabados se muestran en la tabla 6.13. Se omiten las

tablas de datos con la estandarización y codificación ya que el proceso fue mostrado con el

caso 1 de validación práctica.

A diferencia del caso 1, en este si fue posible elaborar un gráfico de control, pues los datos

tienden a distribuirse de forma normal. El gráfico de control usado fue el de mediciones

individuales, el cual fue aplicado en los vectores X donde los datos se distribuyen de forma

normal; para los vectores con distribución no simétrica, se usó el gráfico de control de la

media tomando un tamaño 3 de subgrupo. Los resultados de la validación se colocaron en la

tabla 6.14.

86

Tabla 6.13. Mediciones del peso en gramos de un producto alimenticio.

t.

Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 420 385 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418

2 385 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409

3 387 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399

4 376 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401

5 380 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403

6 437 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421

7 409 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402

8 405 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397

9 401 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397

10 401 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400

11 402 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355

12 400 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355

13 405 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433

14 412 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419

15 395 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425

16 398 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427

17 402 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430

18 430 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429

19 451 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432

20 418 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425

21 409 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427

22 399 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450

23 401 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407

24 403 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363

25 421 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396

26 402 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426

27 397 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415

28 397 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411

29 400 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396

30 355 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402

31 355 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399

32 433 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424

33 419 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406

34 425 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397

35 427 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394

36 430 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397

37 429 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375

38 432 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407

39 425 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405

40 427 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405 438

41 450 407 363 396 426 415 411 396 402 399 424 406 397 394 397 375 407 405 438 427

87

Tabla 6.14. Resultados obtenidos por gráfico de control y algoritmo propuesto para los

datos de la empresa del caso 2 de la validación práctica.

Xi TIPO DE

DISTRIBUCIÓN

RESULTADO

GRÁFICO DE

CONTROL

RESULTADO POR ALGORITMO

PROPUESTO

1 y 2 Normal Inestable En control, patrón natural

3 a 32 No normal Inestable Fuera de control, patrón de tendencia creciente

33 a 37 Normal Inestable En control, patrón natural

38 a 41 Normal Estable En control, patrón natural

De acuerdo a los resultados obtenidos se observa que el algoritmo clasificó como patrones

naturales a la muestras 1, 2, 33, 34, 35, 36, 37, 38, 39, 40 y 41. Esto significa que todas estas

muestras tienen igualdad en µ y σ de cada vector al vector X generado con µ=0 y σ=1. Esto

es comprobado a continuación para verificar la veracidad de los resultados obtenidos con el

algoritmo.

Dado que se asume normalidad en esos vectores, es posible realizar un análisis de varianza

para comparar los valores de sus medias. La ANOVA se muestra en la tabla 6.15. La figura

6.5 es el análisis gráfico de idoneidad, de la cual se asume que no se viola ningún principio de

este análisis.

Tabla 6.15. ANOVA de las comparaciones de las medias de las muestras

FUENTE DE

VARIACIÓN

SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADOS

MEDIOS F p

Muestras 0.001640 10 0.000164 0.72 0.701

Error 0.047326 209 0.000226

Total 0.048966 219

88

Residual

Po

rce

nta

je

0.0500.0250.000-0.025-0.050

99.9

99

90

50

10

1

0.1

Valor ajustado

Re

sid

ua

l

0.5220.5200.5180.5160.514

0.04

0.02

0.00

-0.02

-0.04

Residual

Fre

cu

en

cia

0.030.020.010.00-0.01-0.02-0.03-0.04

40

30

20

10

0

Orden de corrida

Re

sid

ua

l

220200180160140120100806040201

0.04

0.02

0.00

-0.02

-0.04

Gráfica de probabilidad normal Residualesvs. valor ajustado

Histograma de residuales Residuales vs. orden de corrida

Figura 6.5. Análisis de idoneidad de las comparaciones de las medias de las muestras

Del ANOVA realizado se concluye que no existe diferencia significativa entre las muestras.

Sin embargo, esto no prueba si son iguales a cero. La verificación de que µ=0 así como la de

σ=1, se hicieron mediante dos pruebas de hipótesis, una para la media y la otra para la

varianza, bajo las siguientes condiciones: Se comparó el vector 1 con un vector X con patrón

natural generado por simulación de Monte Carlo con µ=0 y σ=1.

a) Prueba de hipótesis para la media igual a 0.

Ho: las medias de los datos del vector 1y el vector X son iguales.

H1: las medias de los datos del vector 1 y el vector X no son iguales.

A un nivel de significancia de 0.05, la prueba con el estadístico t genera to = 0.78 y p = 0.446,

por lo que se acepta la hipótesis nula.

b) Prueba de hipótesis para la varianza igual a 1.

Ho: las varianzas de los datos del vector 1 y del vector X son iguales.

H1: las varianzas de los datos del vector 1 y del vector X no son iguales.

89

A un nivel de significancia de 0.05, la prueba con el estadístico t genera p = 0.0, por lo que se

rechaza la hipótesis nula, aceptando que la varianza de los datos del vector 1 no es igual a 1.

Sin embargo, esto no es problema, ya que se puede demostrar que la varianza del vector 1

estandarizado y codificado es menor a la del vector X.

La importancia de las conclusiones anteriores es que se determinó que el algoritmo fue

acertado en la clasificación de estos vectores en patrones naturales y en que el proceso está

bajo control estadístico, lo que no ocurrió con el gráfico de control.

Por otra parte, las muestras 3 a 32 fueron clasificadas como patrones no naturales por el

algoritmo, conduciendo a afirmar que el proceso se encuentra en estado inestable. Esta misma

conclusión se obtuvo por el gráfico de control, por lo que no es necesario probar nada al

respecto. No obstante, se aprecia que todas estas muestras denotaron patrón de tendencia

creciente, de acuerdo al algoritmo, situación que fue analizada para verificar su validez.

Si se hace una gráfica de puntos de los datos de las muestras 3 a 32, se observarán claramente

dos cosas:

a) Las muestras 3 a 9 y 19 a 30 tienen patrón de tendencia creciente.

b) La muestras 10 a 18, 31 y 32, no tienen dicho patrón.

La efectividad del algoritmo fue entonces de 19 aciertos en 30 casos (19 patrones

correctamente clasificados como de tendencia creciente y 30 muestras en total que así fueron

clasificadas).

Las muestras 10 a 18, 31 y 32, tienen patrón decreciente (por inspección). Este es un estado

de confusión de la red neuronal y puede ser debido a que las pendientes de las rectas de ajuste

de estas muestras son menores a la pendiente que tiene la recta de ajuste del vector X cuando

d=0.15, por lo que se puede suponer que como no se proporcionó patrón de entrenamiento en

estos casos, la red neuronal se confundió. Cabe mencionar que este es solo una suposición que

90

no fue estudiada en esta tesis, salvo lo correspondiente a la observación de las pendientes y de

los coeficientes de regresión de las rectas, que en todos los casos es muy bajo (menor a 20%).

También cabe mencionar que en esta tesis se ha señalado que el patrón en referencia presenta

siempre distribución normal, lo cual es correcto para vectores de X generados por simulación

y puede no serlo para conjuntos de datos provenientes de procesos de manufactura que son

afectados por puntos extraños que hacen que la distribución no sea simétrica, aun conservando

una cierta tendencia creciente.

Considerando el concepto BDM se incluyó en la BDI al vector de la muestra 11 para obtener

la base de datos mejorada, asociando esta muestra al patrón de tendencia decreciente. Los

resultados cambiaron a:

a) Las muestras 10 a 15, 31 y 32 fueron clasificadas correctamente, como patrón

decreciente.

b) Las muestras 16 a 18, permanecieron con error de clasificación.

De este modo, de los 41 conjuntos de datos, 39 fueron correctamente clasificados por el

algoritmo y en cuanto a la determinación del estado del proceso, éste condujo a una eficiencia

del 100% en la identificación correcta.

91

Capítulo 7

CONCLUSIONES

a) Es posible monitorear el proceso de manufactura mediante un algoritmo identificador

de estados de control que no requiera de límites de control, del cumplimiento del

supuesto de normalidad y de la intervención del juicio humano para diagnosticar al

proceso.

b) El algoritmo propuesto es eficiente en la identificación de estados de control del

proceso y en la identificación de patrones de estabilidad e inestabilidad.

c) Existe una relación demostrable entre los tipos de patrones natural y de cambio en el

nivel de la media y el tipo y forma de distribución de probabilidad de la variable

aleatoria que los genera.

d) En el patrón de cambio en el nivel de la media, se demostró que a medida que la

magnitud del cambio es grande, la distribución de probabilidad de los datos será la

mezcla de dos poblaciones normales, separadas entre sí por una magnitud proporcional

a la magnitud del cambio. Ver sección 4.7.3.

e) Los datos de un patrón natural tendrán siempre una distribución de probabilidad

normal.

f) La clasificación del patrón natural por la FuzzyARTMAP no requiere más que el

parámetro de vigilancia del módulo de salida para tener elevada eficiencia en su

predicción.

g) Es común encontrar efectos de curvatura de los parámetros de la FuzzyARTMAP, es

decir, su desempeño no es lineal.

92

h) Dado que el tipo de distribución de probabilidad de un conjunto de datos está

relacionado con el tipo de patrón que tiene, es posible explicar los casos de confusión

en la clasificación de la FuzzyARTMAP cuando los datos se distribuyen con

características similares.

i) En la clasificación del patrón natural, el parámetro vigilancia en el módulo de salida

(ρb1,2) de la FuzzyARTMAP influye fuertemente en el rango de 0.2 a 0.7 y en menor

grado en el rango 0.7 a 0.9

j) Si se considera a D como una variable aleatoria que se expresa como la diferencia

entre la variación especial y la variación natural de un conjunto de datos, mientras D

tienda a cero, la red neuronal confundirá patrones especiales con el natural.

k) Siempre se puede localizar un valor “a” tal que a partir de este, D>a, la

FuzzyARTMAP tendrá eficiencia elevada de predicción de patrón.

93

REFERENCIAS

Carpenter, G.A. & Grossberg, S. (1987). A Massively Parallel architecture for a Self-

Organizing Neural Pattern Recognition Machine. In Computer Vision, Graphics and Image

Processing, chapter. Academic Press. Inc.,54-115.

Carpenter, G.A., Grossberg, S., Markuzon, N., Reynolds, J.H., & Rosen, D.B. (1992). Fuzzy

ARTMAP: A Neural Network Architecture for Incremental Supervised Learning of Analog

Multidimensional Maps. IEEE Transactions on Neural Networks , 3 (5), 698-713.

Chang, S.I., & Aw, C.A. (1996). A Neural Fuzzy Control Chart for Detecting and Classifying

Process Mean Shifts. International Journal of Production Research , 34 (8), 2265-2278.

Chang, S.I., & Ho, E.S. (1999). A Two-Stage Neural Network Approach for Process Variance

Change Detection and Classification. International Journal of Production Research , 37 (7),

1581-1599.

Cheng, C.S. (1997). A Neural Network Approach for the Analysis of Control Chart Patterns.

International Journal of Production Research , 35 (3), 667-697.

Cheng, C.S. (1995). A Multi-Layer Neural Network Model for Detecting Changes in the

Process Mean. Computers and Industrial Engineering , 28 (1), 51-61.

Cook, D.F., Zobel, C.W., & Wolfe, M.L. (2006). Environmental Statistical Process Control

Using and Augmented Neural Network Classification Approach. European Journal of

Operational Research , 174 (3), 1631-1642.

Cook, D.F., & Chiu, C.C. (1998). Using Radial Basis Function Neural Networks to Recognize

Shifts in Correlated Manufacturing Process Parameters. IIE Transactions , 30 (3), 227-234.

De Veaux, R.D., Schumi, J., Schweinsberg, J., & Ungar, L.H. (1998). Prediction Intervals for

Neural Networks Via Nonlinear Regression. Technometrics , 40 (4), 273-282.

Evans, J.R., & M. Lindsay, W. (1993). The Management and Control of Quality. St. Paul,

MN, USA: West Publishing Company.

Guh, R.S. (2002). Robustness of the Neural Network Based Control Chart Pattern Recognition

System to Non-Normality. International Journal of Quality Realibility Management , 19 (1),

97-112.

Guh, R.S. (2005). Real-Time Pattern Recognition in Statistical Process Control: A Hybrid

Neural Network/Decision Tree-Based Approach. IMechE Part B: J. Engineering Manufacture

, 219.

94

Guh, R.S., & Hsieh, Y.C. (1999). A Neural Network Based Model for Abnormal Pattern

Recognition of Control. Computers and Industrial Engineering , 36, 97-108.

Guh, R.S., & Tannock, J.D.T. (1999). Recognition of Control chart concurrent Patterns Using

a Neural Network Approach. International Journal of Production Research , 37 (8), 1743-

1765.

Guo, Y., & Dooley, K.J. (1992). Identification of Change Structure in Statistical Process

Control. International Journal of Production Research , 30, 1655-1669.

Gutierrez- Pulido, H., y De la Vara-Salazar, R. (2004). Análisis y Diseño de Experimentos (1a.

ed.). México: Mc Graw Hill.

Hagan, M.T., Demuth, H.B., & Beale, M. (1996). Neural Network Design. Boston, MA, USA:

PWS.

Hindi, A.Al-Hindi. (2004). Control Chart Interpretation Using FuzzyARTMAP. Journal of

King Saud University. Engineering Sciences. , 16 (1), 1424.

Ho, E.S, & Chang, S.I. (1999). An Integrated Neural Network approach for Simultaneous

Monitoring of Process Mean and Variance Shifts a Comparative Study. International Journal

Production Research , 37 (8), 1881-1901.

Hwang, J.T.G., & Ding, A.A. (1997). Prediction Intervals For Artificial Neural Networks.

Journal Of The American Statistical Association , 92 (438), 748-757.

Hwarng, H.B., & Hubele, N.F. (1993). Back-Propagation Pattern Recognizers For X-Bar

Control Charts: Methodology And Performance. Computers And Industrial Engineering , 24

(2), 219-235.

Hwarng, H.B, & Chong, C.W. (1995). Detecting Process Nonrandomness Through A Fast

And Cumulative Learning ART-Based Pattern Recognizer. International Journal of

Production Research , 33 (7), 1817-1833.

Lucy-Bouler. (1993). T. L. Application To Forecasting Of Neural Network Recognition Of

Shifts And Trends In Quality Control Data. Proceedings Of The World Congress On Neural

Networks (WCNN’93) , 1, 631-633.

Montgomery, D. C. (1991). Control Estadístico de la Calidad. Iberoamérica. p.96.

Pacela, M., & Semeraro, Q. (2005). Understanding ART-Based Neural Algorithms As

Statistical Tools For Manufacturing Process Quality Control. Engineering Applications Of

Artificial Intelligence , 18, 645-662.

Pacela, M., Semeraro, Q., & Anglania, A. (2004). Manufacturing Quality Control By Means

Of A Fuzzy ART Network Trained On Natural Process Data. Engineering Applications Of

Artificial Intelligence , 17, 83-96.

95

Perry, M. B., Spoerre, J. K., & Velasco, T. (2001). Control Chart Pattern Recognition Using

Back Propagation Artificial Neural Networks. International Journal Of Production Research ,

39 (15), 3399-3418.

Ripley, B. D. (1994). Neural Networks And Related Methods For Classification. Journal Of

The Royal Statistical SocietySeries B (Methodological) , 56 (3), 409-456.

Smith, A. E. (1994). X-Bar And R Control Chart Interpretation Using Neural Computing.

International Journal Of Production Research , 32, 309-320.

Stützle, T. (1995). A Neural Network Approach To Quality Control Charts. Proceedings Of

The International Workshop On Artificial Neural Networks (IWANN'95). In: Mira, J. And

Sandoval, F. (Eds.), Lecture Notes In Computer Science. , 930, 1135-1141.

Swift, J. A. (1987). Development Of A Knowledge-Based Expert System For Control Chart

Pattem Recognition And Analysis. In Doctoral Thesis, Oklahoma State University.

Wani, M.A., & Pham, D.T. (1999). Efficient Control Chart Pattern Recognition Through

Synergistic And Distributed Artificial Neural Networks,. Proceedings of the Institution of

Mechanical Engineers, Part B: Journal of Engineering Manufacture , 213 (B2), 157-169.

Wardell, D.G., Moskowitz, H., & Plante, R.D. (1992). Control Charts in the Presence of Data

Correlation. Management Science , 38 (8), 1084-1105.

Zobel, C.W., & Cook, D.F.Q. (2004). Nottingham, An Augmented Neural Network

Classification Approach To Detecting Mean Shifts In Correlated Manufacturing Process

Parameters. International Journal Of Production Research , 42 (4), 741-758.

Zorriassantine, F., & Tannock, J.D.T. (1998). A review of neural networks for statistical

process control. Journal of Intelligent Manufacturing , 9, 209-224.

96

ANEXOS

97

ANEXO A. PROGRAMA CODIFICADOR DE DATOS HECHO EN MATLAB.

Propósito del programa: Este programa transforma un dato estandarizado dentro del intervalo

A [-9.0, +9.0] a su valor equivalente dentro del rango B [0,1].

Desarrollo matemático:

Debido a que los intervalos A y B deben ser equivalentes, y los valores extremos para A son

± 9.0 y 0.0 y +1.0 para B, entonces -9.0 debe ser transformado linealmente en 0.0 y

+9.0 en 1.0. Los rangos de A y B son, respectivamente, +9.0 -(-9.0) = 18.0 y

+1.0 - 0.0 = 1.0. Por inspección, se deduce la fórmula de transformación de un dato X del

intervalo A en su valor equivalente Y en el intervalo B, ya que, si el máximo valor de A es

X = + 9.0, para que este sea convertido a Y = +1.0, entonces será necesario:

𝑌 =𝑋 + (+9.0)

18=

𝑋 + 9.0

18

Ahora bien, generalizando los términos se tiene la fórmula de transformación de datos.

𝑌 =𝑋 + 𝐿

𝑅

donde, dados A[-9.0, +9.0] y B[0.0,1.0],

Y: Dato del intervalo A transformado a su equivalente dentro del intervalo B

X: Dato de A a ser transformado al intervalo B.

L: Valor extremo derecho del intervalo A.

R: Rango del intervalo A.

Programa: clc, clear

L=+9.0;

R=18.0;

X=[matriz de datos X];

for i=1:m

for j=1:n

Y(i,j)=(X(i,j)+L)/R;

end

end

Y

98

ANEXO B. COMPARACIÓN DE LAS PROPIEDADES ESTADÍSTICAS ENTRE

DATOS NO CODIFICADOS Y CODIFICADOS.

Descripción: Se probaron 100 datos con µ = 0 y σ = 1 y distribución normal (datos X), los

cuales fueron codificados (la codificación fue hecha sobre la estandarización) para

compararlos y observar similitudes de propiedades estadísticas. No se apreció diferencia

gráfica (ver figura B.1) ni estadística (ver tabla B.1.).

DATOS NO CODIFICADOS DATOS CODIFICADOS

X

2

1

0

-1

-2

X

0.65

0.60

0.55

0.50

0.45

0.40

0.35

X

210-1-2

X

0.650.600.550.500.450.400.35

X

Fre

cu

en

cia

1.60.80.0-0.8-1.6-2.4

20

15

10

5

0

X

Fre

cu

en

cia

0.600.550.500.450.400.35

20

15

10

5

0

Figura B.1. Comparación gráfica de los datos codificados y no codificados

99

Tabla B.1. Comparación estadística entre datos codificados y no codificados.

ESTADÍSTICAS DATOS NO CODIFICADOS DATOS CODIFICADOS

Media 0.0572 0.50357

Desviación estándar 0.8690 0.0543

Valor mínimo -2.2476 0.35950

Valor máximo 2.1764 0.63600

Sesgo 0.0000 0.0000

Kurtosis -0.1700 -0.1700

100

ANEXO C. EXPLORACIÓN PRELIMINAR PARA UBICAR AL ÁREA DE

FACTIBILIDAD EXPERIMENTAL CON VECTORES DE TAMAÑO PEQUEÑO.

Descripción: Se replicó la investigación hecha por Hindi (2004), con la diferencia de que aquí

se usó la técnica de diseño de experimentos.

Desarrollo de la experimentación: Los valores considerados en este experimento para µ y σ

fueron, respectivamente, 0 y 3 y 1 y 3, por lo que se obtienen 4 familias de patrones naturales:

a. Familia 1, µ = 0 y σ = 1, que denota un proceso en estado de control.

b. Familia 2, µ = 3 y σ = 1, que denota un proceso en estado fuera de control por cambio

en la media de los datos.

c. Familia 3, µ = 0 y σ = 3, que denota un proceso en estado fuera de control por cambio

en la variación de los datos.

d. Familia 4, µ = 3 y σ = 3, que denota un proceso en estado fuera de control por cambio

en la media y en la variación de los datos.

La generación de los datos por cada familia, tanto para los vectores de entrenamiento como

para los de prueba de la red neuronal, así como su codificación se hicieron conforme a lo

indicado en las secciones 5.2 a 5.5 de esta tesis. Las diferencias son el tamaño del vector de

datos y el número de vectores empleados para el entrenamiento y la prueba. Aquí se

emplearon, por familia, 50 vectores para entrenamiento y 25 para la prueba, todos con 8

datos.

El diseño del experimento empleado fue el mismo que se muestra en la tesis (ver tabla 5.12),

con excepción del punto central. Los datos experimentales se muestran en la tabla C.1., el

análisis de idoneidad en la figura C.1. y la gráfica de efectos significativos en la figura C.2.

101

Tabla C.1. Datos experimentales de exploración inicial con la red neuronal.

Número

de

corrida

ρa1 ρab1 β1 ρb1,2 ρab2 β2 ρa2

RÉPLICA

EFICIENCIA

(%)

1 2

1 0.2 0.2 0.2 0.8 0.8 1.0 0.2 30.0 27.0

2 0.8 0.2 0.2 0.2 0.2 1.0 0.8 0.0 0.0

3 0.2 0.8 0.2 0.2 0.8 0.2 0.8 0.0 0.0

4 0.8 0.8 0.2 0.8 0.2 0.2 0.2 10.0 5.0

5 0.2 0.2 1.0 0.8 0.2 0.2 0.8 0.0 0.0

6 0.8 0.2 1.0 0.2 0.8 0.2 0.2 10.0 8.0

7 0.2 0.8 1.0 0.2 0.2 1.0 0.2 39.0 32.0

8 0.8 0.8 1.0 0.8 0.8 1.0 0.8 0.0 0.0

Residual

Po

rce

nta

je

420-2-4

99

90

50

10

1

Valor ajustado

Re

sid

ua

l

403020100

4

2

0

-2

-4

Residual

Fre

cu

en

cia

43210-1-2-3

10.0

7.5

5.0

2.5

0.0

Orden de observación

Re

sid

ua

l

16151413121110987654321

4

2

0

-2

-4

Gráfica de probabilidad normal de los residuales Residuales vs valor ajustado

Histograma de residuales Residuales vs orden de corrida

Figura C.1. Análisis de idoneidad.

102


Po

rce

nta

je

1050-5-10-15-20

99

95

90

80

70

60

50

40

30

20

10

5

1

G

F

D

C

A

Gráfica de probabilidad normal de efectos estandarizados(Alpha = .10)

Figura C.2. Efectos significativos.

De todo lo anterior se observa:

a. Hay evidencia para asumir que el modelo no es idóneo, pues se violan los principios de

normalidad y de varianzas constantes.

b. No obstante, se pueden ver resultados indicativos importantes, como que hay factores

que pueden no ser significativos en la respuesta, como son ab1 y ab2.

Por lo anterior se analiza la gráfica de efectos principales (ver figura C.3.)

Efi

cie

ncia

me

dia

0.80.2

20

10

0

0.80.2 1.00.2

0.80.2

20

10

0

0.80.2 1.00.2

0.80.2

20

10

0

BV 1 RM 1 B 1

V RM 2 B2

BV 2

Efectos medios principales

Figura C.3. Efectos principales.

A: ρa1

B: ρab1

C: β1

D: ρb1,2

E: ρab2

F: β2

G: ρa2

Tipo de efecto

No significativo

Significativo

ρa1 ρab1 β1

ρb1,2 ρab2 β2

ρa2

103

Donde se confirma el bajo efecto de dichos factores. Además, en esta gráfica es posible

observar que:

a. a1, a2 y b1,2 actúan mejor en su nivel bajo.

b. β1 y β2 tienen mejor desempeño en el nivel alto.

Con lo que se obtiene como conclusión la necesidad de probar un campo de operación de los

factores y niveles mostrados en la tabla C.2.

Tabla C.2. Factores y niveles que determinan el campo de operación de la RAN

FACTOR NIVEL BAJO NIVEL ALTO

a1 0.2 0.5

a2 0.2 0.5

b1,2 0.2 0.5

β1 0.5 1.0

β2 0.5 1.0

Con estos factores y niveles se corre un experimento con las siguientes características:

Número de Factores: 5

Número de corridas: 16

Número de réplicas: 2

Resolución: III

Tipo de diseño: 25 fracción ¼

Diseño generador de alias: D=AB, E=AC

Estructura de alias:

A + BD + CE + ABCDE

B + AD + CDE + ABCE

C + AE + BDE + ABCD

D + AB + BCE + ACDE

E + AC + BCD + ABDE

BC + DE + ABE + ACD

BE + CD + ABC + ADE

104

Corridas experimentales (tabla C.3.)

Tabla C.3. Corridas experimentales.

a1 a2 b1,2 β1 β2

0.5 0.2 0.2 0.5 0.5

0.5 0.5 0.5 1 1

0.2 0.5 0.5 0.5 0.5

0.2 0.2 0.5 1 0.5

0.5 0.2 0.5 0.5 1

0.2 0.5 0.2 0.5 1

0.5 0.5 0.2 1 0.5

0.5 0.2 0.2 0.5 0.5

0.5 0.5 0.2 1 0.5

0.2 0.5 0.2 0.5 1

0.2 0.2 0.2 1 1

0.2 0.2 0.2 1 1

0.5 0.5 0.5 1 1

0.5 0.2 0.5 0.5 1

0.2 0.2 0.5 1 0.5

0.2 0.5 0.5 0.5 0.5

Así, se obtienen los resultados experimentales indicados en la tabla C.4.

Tabla C.4. Datos experimentales.

CORRIDA

NÚMERO a1 a2 b1,2 β1 β2

RÉPLICA

EFICIENCIA (%)

1 2

1 0.2 0.2 0.2 1 1 39.0 32.0

2 0.5 0.2 0.2 0.5 0.5 13.0 11.0

3 0.2 0.5 0.2 0.5 1 11.0 10.0

4 0.5 0.5 0.2 1 0.5 9.0 10.0

5 0.2 0.2 0.5 1 0.5 14.0 13.0

6 0.5 0.2 0.5 0.5 1 7.0 5.0

7 0.2 0.5 0.5 0.5 0.5 13.0 12.0

8 0.5 0.5 0.5 1 1 7.0 3.0

Cuyo análisis genera las gráficas de idoneidad (figura C.4.) y de efectos significativos (figura

C.5.) mostrados a continuación.

105

Residual

Po

rce

nta

je

420-2-4

99

90

50

10

1

Valor ajustado

Re

sid

ua

l

40302010

4

2

0

-2

-4

Residual

Fre

cu

en

cia

43210-1-2-3

6.0

4.5

3.0

1.5

0.0

Orden de corridas

Re

sid

ua

l

16151413121110987654321

4

2

0

-2

-4

Gráfica de probabilidad normal Residuales vs valores ajustados

Histograma Residuales vs orden de corridas

Análisis de residuales

Figura C.4. Análisis de idoneidad.


Po

rce

nta

je

5.02.50.0-2.5-5.0-7.5-10.0

99

95

90

80

70

60

50

40

30

20

10

5

1

BE

BC

D

C

B

A

Efectos estandarizados(Alpha = .05)

Figura C.5. Efectos significativos estandarizados.

A: ρa1

B: ρab1

C: β1

D: ρb1,2

E: ρab2

F: β2

G: ρa2

Tipo de efecto

No significativo

Significativo

106

Con la ANOVA (tabla C.5) y efectos principales (figura C.6):

Tabla C.5. Análisis de varianza.

FUENTE DE

VARIACIÓN GRADOS DE

LIBERTAD SUMA DE

CUADRADOS CUADRADOS

MEDIOS F p

Efectos principales 5 989.31 197.862 41.11 0.000 Interacciones 2 289.13 144.563 30.04 0.000 Error 8 38.50 4.813 Total 15 1316.94

Efi

cie

ncia

me

dia

0.50.2

17.5

15.0

12.5

10.0

0.50.2

0.50.2

17.5

15.0

12.5

10.0

1.00.5

BV1 BV2

V LR 1

Efectos principales

Figura C.6. Efectos principales.

Con lo anterior se aprecia idoneidad del modelo por lo que los resultados son confiables. Se

asume ahora que los factores significativos son a1, a2, b1,2 y β1, a los niveles 0.2, 0.2, 0.2 y

1.0, respectivamente, aunque sus efectos están confundidos. Sin embargo, a estos niveles es

muy baja la eficiencia de la red neuronal. Se experimenta ahora tomando un tamaño 15 de

vector, a diferencia de los 8 considerados, teniendo así los resultados experimentales

mostrados en el anexo D.

β1 ρb1,2

ρa1 ρa2

107

ANEXO D. EXPLORACIÓN PRELIMINAR PARA UBICAR AL ÁREA DE

FACTIBILIDAD EXPERIMENTAL CON VECTORES DE TAMANO GRANDE.

Se corrió el experimento mostrado en la tabla D.1. Este experimento se corrió como un diseño

fraccionado a 5 factores con dos niveles. Los efectos estandarizados se pueden observar en la

figura D.1, el análisis de idoneidad en la figura D.2. y la ANOVA en la tabla D.2.

Tabla D.1. Datos experimentales.

CORRIDA

NÚMERO a1 a2 b1,2 β1 β2

RÉPLICA

1 2

1 0.2 0.2 0.2 1 1 27 26

2 0.5 0.2 0.2 0.5 0.5 23 25

3 0.2 0.5 0.2 0.5 1 16.5 15

4 0.5 0.5 0.2 1 0.5 21 21.5

5 0.2 0.2 0.5 1 0.5 45 43.5

6 0.5 0.2 0.5 0.5 1 39 37

7 0.2 0.5 0.5 0.5 0.5 24.5 25

8 0.5 0.5 0.5 1 1 19 21.5


Po

rce

nta

je

20100-10-20

99

95

90

80

70

60

50

40

30

20

10

5

1

BE

BC

E

D

C

B

A

Gráfica de probabilidad normal de efectos estandarizados( Alpha = .05)

Figura D.1. Efectos estandarizados.

A: ρa1

B: ρab1

C: β1

D: ρb1,2

E: ρab2

F: β2

G: ρa2

Tipo de efecto

No significativo

Significativo

108

Residual

Po

rcie

nto

210-1-2

99

90

50

10

1

Valor ajustado

Re

sid

ua

l

403020

1.0

0.5

0.0

-0.5

-1.0

Residual

Fre

cu

en

cia

1.51.00.50.0-0.5-1.0

4

3

2

1

0

Orden de corrida

Re

sid

ua

l

16151413121110987654321

1.0

0.5

0.0

-0.5

-1.0

Gráfica de probabilidad normal Residuales vs valor ajustado

Histograma Residuales vs orden de corrida

Análisis de residuales

Figura D.2. Análisis de idoneidad.

Tabla D.2. Análisis de varianza.

FUENTE

GRADOS

DE

LIBERTAD

SUMA DE

CUADRADOS CUADRADOS

MEDIOS F p

Efectos principales 5 1124.95 224.91 177.77 0.000 Interacciones dobles 2 150.78 75.391 59.57 0.000 Residual Error 8 10.13 1.266 Total 15 1285.86

Finalmente, los efectos son:

Constante 12.1806

a1 -6.45833

a2 19.5139

b1,2 79.3056

β1 4.87500

β2 0.41667

a2 *b1,2 -131.944

a2 * β2 -20.8333

109

De todo lo anterior, se concluye que el experimento es válido e indica que hay efectos e

interacciones significativas.

Por lo que se puede deducir:

a) Es mejor un tamaño grande del vector.

b) La red es más eficiente para detectar cambios grandes.

c) Casi todos los factores influyen, además de sus interacciones.

d) a1 aplica a nivel bajo para detectar cambios pequeños y en nivel alto para cambios

grandes.

e) β1 no cambia, por lo que se queda fijo en nivel alto.

f) b1,2 es cambiante.

g) β2 es cambiante.

h) a2 no cambia, por lo que se queda fijo en nivel bajo.

110

ANEXO E. EVOLUCIÓN DE LA EFICIENCIA DE LA RED NEURONAL EN LA

CLASIFICACIÓN DE PATRONES

En el artículo denominado “On the use of the FuzzyARTMAP Neural Network for Pattern

Recognition in Statistical Process Control using a Factorial Design” de los autores J. A.

Vázquez López, I. López Juárez y M. Peña Cabrera, aceptado para publicación en The

International Journal of Computers, Communications & Control al volúmen V-2010, se

muestra la experimentación realizada para observar cómo evoluciona la eficiencia de la red

neuronal en la clasificación de patrones especiales, en función del tamaño del efecto de la

causa especial de variación. Aquí se muestran las condiciones de operación de la

FuzzyARTMAP adecuadas para maximizar la eficiencia (tabla E.1.) y algunos de los

resultados obtenidos (figura E.1 a y b).

Tabla E.1. Operación de la FuzzyARTMAP

FACTOR NIVEL

ÓPTIMO

a1 0.8

ab1 0.2

β1 1.0

b1,2 0.8

ab2 0.2

β2 0.2

a2 0.6

(a) Patrón Cambio en el nivel de la media.

111

(b) Patrón Tendencia

Figura E.1. Evolución de la eficiencia para vectores de tamaño pequeño.

La eficiencia en la predicción del patrón natural quedó en 30%, debido al tamaño pequeño del

vector y a la combinación de los patrones especiales.

112

ANEXO F. ARTÍCULOS

Durante el desarrollo de la investigación, los siguientes artículos han sido publicados o

aceptados para su difusión científica:

J. A. Vázquez-López, I. López-Juárez, M. Peña-Cabrera

On the use of the FuzzyARTMAP Neural Network for Pattern Recognition in Statistical

Process Control using a Factorial Design. International Journal of Computers,

Communications & Control. (En prensa).

J. A. Vázquez-López, I. López-Juárez, M. Peña-Cabrera

Aplicación del diseño experimental en la red neuronal FuzzyARTMAP para el reconocimiento

de patrones estadísticos especiales. XVIII Congreso de la Asociación Chilena de Control

Automático (ACCA). IFAC-IEEE-Chile, Santiago de Chile, 10-12 Diciembre 2008.

J. A. Vázquez-López, I. López-Juárez

SPC without control limits and normality assumption: A new method.

14th Iberoamerican congress on pattern recognition. Noviembre 15-18, 2009. (Aceptado).

J. A. Vázquez-López, I. López-Juárez

Estimación de estados de control empleando diseño experimental y redes neuronales.

Congreso Nacional 2009 de la Asociación de México de Control Automático. Septiembre 30 a

Octubre 2, 2009. (Aceptado).

113

ANEXO G. ALGORITMOS EMPLEADOS PARA LA IMPLEMENTACIÓN DE LA

RED FUZZYARTMAP

ART-1

En la Figura G.1 se puede observar la arquitectura ART-1, la cual consiste en dos capas, F1 y

F2. F1, con el vector de salida X ≡ (x1, . . . , xm), registra el vector de entradas F0 → F1

en I ≡ (I1, . . . , Im). Cada neurona en la capa F1 está conectada a una neurona de la capa F2 a

través de los pesos adaptables Zij. El índice i indica que la conexión va desde la i-ésima

neurona en F1 a la j-ésima neurona de la capa F2.

Figura G.1. Arquitectura de la ART-1

Elección de F2

Sí se denota a Tj como el total de las entradas de F1 al j-ésimo nodo en F2, entonces, se puede

decir que:

𝑇𝑗 = 𝑥𝑖

𝑀

𝑖=1

𝑍𝑖𝑗 (𝐺. 1)

donde j = 1, . . . , N.

Sí algún Tj > 0, entonces el índice j de la elección de F2 está dado por Tj = max Tj : j = 1 . . .N,

donde j se define de manera que la salida de la capa F2 sea cero, excepto para el nodo con la

máxima activación. Entonces, y = (y1, . . . , yN) tiene como salida

114

𝒚𝒋 = 𝟏 𝒔𝒊 𝒋 = 𝑱𝟎 𝒔𝒊 𝒋 ≠ 𝑱

(𝐺. 2)

Resonancia o restablecimiento

Cada nodo de F2 está conectado a todos los nodos de F1 a través de las conexiones zji, las

cuales contienen valores binarios. Así, el i-ésimo nodo de entrada que viene de F1 es la capa

de F2 siguiente.

N

j

ijjii yZV1

(G.3)

donde i = 1, . . . ,M.

Este sistema de vigilancia está compuesto por el comparador que se muestra en la Figura 2, el

cual controla la disparidad tolerada entre las señales de subida (actividad) y bajada

(aprendizaje esperado). En otras palabras, compara la norma del Vector X respecto a la norma

del vector ρI, donde ρ ε [0, 1] el cual es el parámetro de vigilancia.

La norma ℓ1 del vector a = (a1, . . . , aM) se puede obtener por:

M

i

iaa1

(G.4)

El Vector X está definido por:

xi = ViIiX = V ∩ I = zj ∩ I (G.5)

Dependiendo del resultado de esta comparación, el sistema de vigilancia puede restablecer la

neurona actual activa y buscar otra neurona o modificar los pesos.

115

Aprendizaje

El aprendizaje se produce sí el parámetro de vigilancia se cumple para la neurona elegida J, es

decir:

I

Iz j (G.6)

Los pesos de las conexiones son modificadas por:

nueva

j

nueva

jnueva

j

anterior

j

neeva

jzL

LzZzIz

1 (G.7)

Las ecuaciones anteriores son para aprendizaje rápido, las cuales usan la forma algebraica de

las ecuaciones diferenciales no-lineales para LTM (Long Term Memory) Carpenter y

Grossberg (1992). Para la implementación del ART-1, solo son necesarios dos parámetros: ρ y

L.

Fuzzy ART (FA)

El sistema FAM (FuzzyARTMAP) incorpora dos módulos tipo FA, ARTa y ARTb, por lo cual

se hace la descripción de los sistemas tipo FA antes de mencionar el FAM. Cada sistema

Fuzzy ART incluye (i) una capa F0 de nodos, los cuales representan al vector de entradas

actuales y (ii) una capa F1, la cual recibe las entradas de subida F0 y las de bajada F2, que

representan la neurona activa o categoría. El vector F0 se puede escribir como I = (I1, . . . , IM),

con cada componente Ii en el intervalo [0, 1], donde i = 1, . . . ,M. El vector F1 se puede

escribir como x = (x1, . . . , xM) y el vector F2 como y = (y1, . . . , yM).

116

Parámetros

La dinámica de la red tipo Fuzzy ART está determinada por (i) el parámetro de

elección α, (donde α > 0), (ii) un parámetro de aprendizaje β, (donde β ε [0, 1]) y (iii)

un parámetro de vigilancia ρ, (donde ρ ε [0, 1]).

Elección de categoría

Para cada entrada I y cada nodo de F2, la función de elección Tj está definida por:

j

j

jW

WIIT

)( (G.8)

donde el operador está definido por (p q)i = min(pi,q1) y la norma ∙ esta dado por

M

i

ipp1

(G.9)

La selección de una categoría, se realiza cuando al menos un nodo de F2 puede llegar a ser

activo, la categoría seleccionada está dada por J donde Tj = max(Tj : j = 1, . . . ,N).

Sí más de un Tj es máxima, se selecciona la categoría con el índice j menor. En el sistema de

selección, el vector de activación F1 está definido por la ecuación:

𝑋 = 𝐼 𝑠𝑖 𝐹2 𝑒𝑠𝑡𝑎 𝑖𝑛𝑎𝑐𝑡𝑖𝑣𝑎𝐼∇𝑤𝑗 𝑠𝑖 𝑒𝑙 𝑗 − 𝑒𝑠𝑖𝑚𝑜 𝑛𝑜𝑑𝑜 𝑑𝑒 𝐹2 𝑒𝑠𝑡𝑎 𝑎𝑐𝑡𝑖𝑣𝑜

(𝐺. 10)

Resonancia

La resonancia ocurre sí la función |I ∇ wJ |/|I| de la categoría seleccionada J cumple con el

criterio de vigilancia.

117

jI w

I (G.11)

Esto es, cuando la J-ésima categoría es seleccionada, la resonancia ocurre sí:

jx I w I (G.12)

El aprendizaje se produce como se muestra en la ecuación

jI w

I (G.13)

Aprendizaje

Una vez que la búsqueda finaliza, los pesos del vector wJ se establecen de acuerdo a la

ecuación:

( ) (1 )nueva nueva anterior

j j jw I w w (G.14)

Un aprendizaje rápido corresponde a β = 1.0

FuzzyARTMAP (FAM)

En el sistema (FAM), los módulos ARTa y ARTb están unidos por medio de un modulo

inter − ART Fab

, llamado map-field, como se muestra en la Figura 7.2. La red neuronal tipo

FuzzyARTMAP tiene dos módulos Fuzzy ART, uno que maneja las entradas y el segundo para

las salidas, ARTa y ARTb. También tiene un campo de correspondencia Fab el cual vincula las

entradas con las salidas.

Para el entrenamiento, un patrón en forma de vector se presenta en ARTa y en el vector

correspondiente de entrada en ARTb. En pocas palabras, la red neuronal recibe un vector a el

118

cual deduce a que categoría corresponde y con el segundo vector confirma o refuta la

hipótesis.

Figura G.2. Arquitectura de la red tipo FuzzyARTMAP

Algoritmo de FAM

Como el FuzzyARTMAP utiliza dos módulos tipo Fuzzy ART entonces se tiene que:

a: vector de entradas

ρ: parámetro de vigilancia

M: número de elementos en a

β: parámetro de aprendizaje.

Donde el algoritmo esta dado por los siguientes pasos:

1) Inicializar todos los pesos a 1.0 y poner los nodos de F2 en valor neutro (no empleados).

119

2) Aplicar código complementario al vector a M − dimensional para obtener

I (a, ac) = (a1, . . . , aM, ac1, . . . , acM), donde aci = 1 − ai, para i = 1, . . . ,M

3) Para todos los nodos de F2, calcular la función de elección, para el vector I y el j-ésimo

nodo de F2. La función de selección es:

( )j

j

j

I wT I

w

(G.15)

Donde wj es el vector de pesos para el nodo j y α es el parámetro de selección. El operador

fuzzy ∇ está definido por (p ∇ q)i = min(pi, qi) y la norma | ・ | está definida por

1

M

i

i

P p

(G.16)

4) Encontrar el nodo J de F2 con la función de selección máximo TJ = maxTj : j = 1, . . . ,N.

La salida del vector Y de F2 está dada por yJ = 1 y yj = 0 para j ≠ J.

5) Verificar sí existe resonancia, sí el nodo seleccionado J satisface

jI w

I

(G.17)

Sí existe resonancia, entonces se deben modificar los pesos de wj, como

( ) (1 )nueva anterior anterior

J j Jw I w w . De otra manera poner la función de selección TJ a 0

(cero).

6) Repetir los pasos (4) y (5) hasta que la ecuación de vigilancia sea alcanzada.

7) Para un nuevo patrón realizar los pasos del (2) al (6)

120

Durante el proceso de entrenamiento, el proceso de aprendizaje se desactiva en ARTa

(β = 0). El parámetro de vigilancia ρa del ARTa varia durante el aprendizaje. Inicialmente ρa es

conocido como base de vigilancia y ρb es puesto a 1.0 para distinguir sin problemas las salidas

deseadas.

Cuando los vectores a (entrada) y b (salida) están presentes en ARTa y ARTb, respectivamente,

un criterio de vigilancia es evaluado para verificar sí la neurona ganadora de ARTa

corresponde al vector de salida usado.

b ab

j

abb

y w

y

(G.18)

Donde yb

es el vector de salida del ARTb (patrón actual activo en F2b), J es el índice de la

neurona ganadora en F2a, ab

Jw son los pesos de las conexiones a la j-ésima neurona de F2a y ρa

es el parámetro de vigilancia del campo correspondiente.

Cuando se conoce un criterio de vigilancia, la nueva asociación es aprendida entre los vectores

a y b modificando los pesos utilizando la ecuación siguiente

(1 )ab ab ab

J ab Jw x w (G.19)

Y los pesos del ARTa también son modificados utilizando la ecuación

( ) (1 )nueva anterior anterior

J j Jw I w w (G.20)

DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA VARIABLES … · 2017-09-14 · 0 desarrollo...

Documents

Transcript of DESARROLLO DE UN MÉTODO DE CONTROL ESTADÍSTICO PARA VARIABLES … · 2017-09-14 · 0 desarrollo...