Evaluación de Parámetros Estadísticos para la ...

12
Evaluación de Parámetros Estadísticos para la Identificación de Fallas en un Rodamiento Autor: Jacobo Arango Giraldo 201223686 Asesor: Giacomo Barbieri Contexto Los motores de inducción o motores de jaula de ardilla son hoy en día los motores más utilizados en maquinaria rotativa para todo tipo de aplicaciones en las diferentes industrias. Dentro de sus ventajas se encuentra su facilidad de instalación, confiabilidad, bajos costos, fácil manejo, versatilidad y bajos requisitos de mantenimiento. No obstante, los motores de inducción están propensos a muchos tipos de fallas que en consecuencia pueden llegar a causar una suspensión absoluta del mecanismo al cual se encuentran conectados, lo que deriva en enormes pérdidas de producción en términos de tiempo y costos, desperdicio de materia prima e incluso posibles lesiones humanas. Dentro de las razones principales por las cuales los motores de inducción quedan generalmente fuera de servicio son su antigüedad (horas de funcionamiento), inusuales cargas al sistema, lubricaciones incorrectas o inadecuadas, calor y sellado erróneo. En este orden de ideas, una detección temprana de las fallas en los motores de inducción es muy importante para prevenir el colapso absoluto del motor y las enormes pérdidas en producción que conlleva este evento. [1] Con el fin de reducir los costos operativos, prolongar la vida útil de las máquinas y mejorar el tiempo de funcionamiento operativo, ha sido necesario desarrollar metodologías de mantenimiento basado en la condición (CBM). El CBM se utiliza para evaluar el estado de la máquina y detectar sus componentes defectuosos. Ahora, los componentes que a menudo son la principal fuente de fallas en máquinas rotativas, como los aerogeneradores, son los rodamientos. [2] Los cojinetes o rodamientos son componentes mecánicos que reducen la fricción entre un eje y sus piezas conectadas a este por medio de bolas que pueden girar libremente. Las fallas de rodamientos constituyen el 44% del número total de fallas en máquinas rotativas. [3] Los daños presentes en los cojinetes pueden aparecen en cada uno de sus componentes: bola o rodillo, pista interior, pista exterior y jaula. El mantenimiento basado en la condición (CBM) en máquinas rotativas es una tarea crucial para garantizar la confiabilidad en los procesos industriales. Esta metodología está orientada a detectar el estado de la máquina (estado normal y defectuoso), así como a diagnosticar el tipo de falla (falla en rodamiento, desbalanceo, desalineación, etc.) utilizando señales disponibles como vibración, emisiones acústicas y señales de corriente. [4] [5] [6] En la última década, con el fin de automatizar, mejorar la confiabilidad y la sensibilidad y reducir el costo de los métodos de diagnóstico tradicionales, herramientas basadas en técnicas de inteligencia artificial se han ido desarrollando y empleando con mayor frecuencia en el campo de la ingeniería mecánica. [7] Los métodos basados en la inteligencia artificial son algoritmos que no requieren ninguna comprensión sobre las tecnicidades del sistema a estudiar y por el contrario son basadas exclusivamente en los datos. Muchas técnicas de inteligencia artificial como redes neuronales artificiales, algoritmos genéticos o redes neuronales difusas han sido utilizadas en los últimos años para detectar fallas en rodamientos. [6] [8]

Transcript of Evaluación de Parámetros Estadísticos para la ...

Page 1: Evaluación de Parámetros Estadísticos para la ...

Evaluación de Parámetros Estadísticos para la Identificación de Fallas en un Rodamiento

Autor: Jacobo Arango Giraldo 201223686

Asesor: Giacomo Barbieri

Contexto Los motores de inducción o motores de jaula de ardilla son hoy en día los motores más utilizados en maquinaria rotativa para todo tipo de aplicaciones en las diferentes industrias. Dentro de sus ventajas se encuentra su facilidad de instalación, confiabilidad, bajos costos, fácil manejo, versatilidad y bajos requisitos de mantenimiento. No obstante, los motores de inducción están propensos a muchos tipos de fallas que en consecuencia pueden llegar a causar una suspensión absoluta del mecanismo al cual se encuentran conectados, lo que deriva en enormes pérdidas de producción en términos de tiempo y costos, desperdicio de materia prima e incluso posibles lesiones humanas. Dentro de las razones principales por las cuales los motores de inducción quedan generalmente fuera de servicio son su antigüedad (horas de funcionamiento), inusuales cargas al sistema, lubricaciones incorrectas o inadecuadas, calor y sellado erróneo. En este orden de ideas, una detección temprana de las fallas en los motores de inducción es muy importante para prevenir el colapso absoluto del motor y las enormes pérdidas en producción que conlleva este evento. [1] Con el fin de reducir los costos operativos, prolongar la vida útil de las máquinas y mejorar el tiempo de funcionamiento operativo, ha sido necesario desarrollar metodologías de mantenimiento basado en la condición (CBM). El CBM se utiliza para evaluar el estado de la máquina y detectar sus componentes defectuosos. Ahora, los componentes que a menudo son la principal fuente de fallas en máquinas rotativas, como los aerogeneradores, son los rodamientos. [2] Los cojinetes o rodamientos son componentes mecánicos que reducen la fricción entre un eje y sus piezas conectadas a este por medio de bolas que pueden girar libremente. Las fallas de rodamientos constituyen el 44% del número total de fallas en máquinas rotativas. [3] Los daños presentes en los cojinetes pueden aparecen en cada uno de sus componentes: bola o rodillo, pista interior, pista exterior y jaula. El mantenimiento basado en la condición (CBM) en máquinas rotativas es una tarea crucial para garantizar la confiabilidad en los procesos industriales. Esta metodología está orientada a detectar el estado de la máquina (estado normal y defectuoso), así como a diagnosticar el tipo de falla (falla en rodamiento, desbalanceo, desalineación, etc.) utilizando señales disponibles como vibración, emisiones acústicas y señales de corriente. [4] [5] [6] En la última década, con el fin de automatizar, mejorar la confiabilidad y la sensibilidad y reducir el costo de los métodos de diagnóstico tradicionales, herramientas basadas en técnicas de inteligencia artificial se han ido desarrollando y empleando con mayor frecuencia en el campo de la ingeniería mecánica. [7] Los métodos basados en la inteligencia artificial son algoritmos que no requieren ninguna comprensión sobre las tecnicidades del sistema a estudiar y por el contrario son basadas exclusivamente en los datos. Muchas técnicas de inteligencia artificial como redes neuronales artificiales, algoritmos genéticos o redes neuronales difusas han sido utilizadas en los últimos años para detectar fallas en rodamientos. [6] [8]

Page 2: Evaluación de Parámetros Estadísticos para la ...

Trabajo Previo La detección de fallas y el diagnóstico de tipo de fallas en rodamientos se han estudiado ampliamente durante varios años mediante el uso de métodos de procesamiento de señales y más recientemente, mediante métodos de aprendizaje automatizado (Machine Learning). Ahora, para determinar la falla de un rodamiento, es necesario definir una serie de características o atributos que faciliten observar si el rodamiento considerado defectuoso empeora o permanece igual. Para esto, se requiere de una técnica de preprocesamiento de señales, que facilite extraer la información más relevante de una señal de vibración, de corriente o acústica, proveniente del sistema de rodamientos. Por ejemplo, Prudhom et al. [9] determinó que muchas características pueden definirse en base a los resultados de las transformaciones de tiempo-frecuencia. En particular, propone un atributo que usa información de la Transformada de Fourier de tiempo corto (STFT). Liu [10] propuso otra característica que se halla aplicando la descomposición del paquete wavelet a la señal bruta y la transformada de Hilbert para calcular la frecuencia y la amplitud instantáneas de las señales de banda estrecha de alta y baja frecuencia. Gangsar y Tiwari [4] propusieron el uso de parámetros estadísticos clásicos extraídos de la señal de vibración como indicadores de severidad de falla. Entrando en materia de investigación, algunos estudios realizados para diagnosticar el tipo de fallas en rodamientos han sido los de Tran et al. [11], Zhong Ming y Bin [6], Gangsar y Tiwari [4] y Ulloa [12]. Tran et al presenta un método de diagnóstico de fallas basado en el sistema de inferencia neuro-difuso adaptativo (ANFIS) en combinación con árboles de decisión. El árbol de clasificación y regresión (CART), que es uno de los métodos del árbol de decisión, se utiliza como un procedimiento de selección de características para seleccionar los atributos más pertinentes del conjunto de datos. Zhong Ming y Bin utilizan redes neuronales multicapa para distinguir entre los diferentes tipos de daños en los motores de inducción. Los coeficientes de las características obtenidos por la descomposición de los paquetes wavelet de la corriente del estator se utilizan junto con la velocidad de deslizamiento como entrada de la red neuronal multicapa. Gangsar y Tiwari tenían como propósito estudiar el poder predictivo de un algoritmo SVM para situaciones donde la información o los datos requeridos no estaban disponibles a las velocidades y cargas evaluadas. Los atributos utilizados fueron características extraídas de las señales de vibración y corriente del montaje. Finalmente, Ulloa propone una metodología para detectar fallas en maquinaria rotativa, evitando el proceso de extracción de características, mediante la obtención del espectrograma de la señal original de vibración y posterior uso de redes neuronales convolucionales. En vista de que hasta ahora no se ha abordado el problema de distinguir qué parámetros pueden llegar a ser determinantes en la identificación de la falla en un rodamiento, el presente estudió tendrá como objetivo distinguir analíticamente dentro de una serie de parámetros estadísticos (extraídos de la señal de vibración), cuales son aquellos que son esenciales y suficientes para la distinción de este tipo de falla. De igual forma, se medirá el desempeño máximo que podrá llegar a tener un algoritmo de relativa sencillez como lo es la regresión logística en la identificación de este tipo de falla, alimentando el modelo con aquellos parámetros encontrados como significativos. Por último, se comparará el poder de clasificación que se obtiene utilizando el conjunto de todos los parámetros encontrados en literatura y utilizando únicamente aquellos encontrados como determinantes.

Page 3: Evaluación de Parámetros Estadísticos para la ...

Alcance El presente estudio tiene como finalidad generar una serie de recomendaciones sobre tipos de parámetros a utilizar en futuros estudios de Mantenimiento Basado en la Condición (CBM), más específicamente en investigaciones dirigidas a detectar fallas en rodamientos. Con el fin de validar los resultados obtenidos y asegurarnos de su robustez en la detección de fallas en rodamientos para diferentes configuraciones experimentales, se comprobará el desempeño del algoritmo empleado (regresión logística) en dos bases de datos diferentes. La primera, del Center for Intelligent Maintenance Systems (IMS) de la Universidad de Cincinnati [13], disponible en línea y la segunda utilizando datos extraídos del montaje preparado por Ulloa [12] y disponible en el laboratorio Colivri de la Universidad de los Andes. La forma como se verificará la validez de los resultados será a través de los diferentes indicadores de desempeño disponibles para los algoritmos de Machine Learning. Entre ellos; Accuracy, Precision, Recall y AUC.

Accuracy = 𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠+𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠

𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 Ecuación 1. Accuracy

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 + 𝐹𝑎𝑙𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 Ecuación 2. Precision

𝑅𝑒𝑐𝑎𝑙𝑙 =𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎𝑚𝑒𝑛𝑡𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 + 𝐹𝑎𝑙𝑠𝑜𝑠 𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠 Ecuación 3. Recall

En donde Accuracy (Ecuación 1) se refiere a la probabilidad de que el algoritmo prediga correctamente si un rodamiento se encuentra dañado o no. Precision (Ecuación 2) habla acerca de las observaciones que fueron clasificadas como “daño”, cuáles de ellas realmente estaban en realidad dañadas y Recall (Ecuación 3) es una medida que indica del total de observaciones que estaban en estado de “daño” cuantas de ellas alcanzó a capturar el modelo como dañadas. Finalmente, el AUC o Área Bajo la Curva ROC por sus siglas en inglés mide la capacidad del modelo para distinguir entre una clase (“rodamiento en buen estado”) y la otra (“rodamiento dañado”). Cuanto más alto sea el AUC, mejor será el modelo en clasificar rodamientos dañados como dañados y rodamientos buenos como buenos. Ejecución Los rodamientos pueden ser clasificados en dos grupos principales (rodamientos de bolas y rodamientos deslizantes) y su aplicación depende del uso particular para el cual fueron diseñados. Normalmente, los rodamientos de contacto deslizante emiten mucha menos energía de vibración que los rodamientos de bolas, de modo que el monitoreo del estado sobre estos últimos es mucho más fácil. Sin embargo, la causa por la cual ambas clases de rodamientos emiten vibraciones, se debe principalmente a la forma de daño superficial que sufren estos elementos. Las superficies maquinadas o rectificadas no son perfectamente planas o lisas. De hecho, es común que incluso un rodamiento totalmente nuevo emita señales de vibración como consecuencia de las imperfecciones resultantes del mecanizado con el cual fue maquinado. Las pistas internas y externas de los rodamientos que han sido formadas mediante mecanizado suelen mostrar una distribución aleatoria de rugosidad en la dirección de maquinado. Más aún, estudios de metrología han llegado a establecer que la distribución de las alturas de estas asperezas exhibe una distribución gaussiana o normal. [14]

Page 4: Evaluación de Parámetros Estadísticos para la ...

La función de distribución normal o gaussiana es bien conocida por su forma de “campana” y por representar una serie de fenómenos aleatorios en la vida real. A partir de esta, un conjunto de momentos estadísticos pueden ser utilizados para describir la forma de la curva de distribución. Por ejemplo, el tercer momento el cual está relacionado con el “skewness”, es usado para identificar la falta de simetría en dicha curva de distribución. Así mismo, a medida que las superficies del rodamiento comienzan a ser desgastadas, la forma de la función de densidad de probabilidad cambia y tiende a ser más “puntiaguda”. Este cambio puede ser monitoreado mediante el cuarto momento estadístico o por su forma normalizada llamada “kurtosis”. Para una buena calidad superficial, que es cuando el rodamiento está completamente nuevo, está demostrado que el coeficiente de kurtosis toma un valor de 3,0. En general, los momentos impares están relacionados con la información sobre la posición del pico de la función de distribución de probabilidad en relación con la media; mientras que los pares, indican las características de la función de probabilidad. Para una distribución normal teóricamente perfecta, todos los momentos impares son cero y los momentos pares toman un valor numérico finito. A medida que las superficies del rodamiento comienzan a sufrir daños, estos momentos dejarán de tomar sus valores teóricos y, por lo tanto, podrán ser usados para monitorear la condición del rodamiento. [14] En vista de esto, en los últimos años, varios autores han venido implementando el uso de estas estadísticas como variables de entrada para sus algoritmos de Machine Learning; entre ellos, Gangsar & Tiwari [4], Chuang, Zhousuo & Zhengjia [15], Dyer & Stewart [16] y Kankar, Sharma & Harsha [17]. De manera que, para el presente estudio decidimos recopilar las diferentes características estadísticas utilizadas en la literatura, resumidas en la Tabla 1, y aplicar un análisis estadístico que ayude a determinar cuáles de ellas eran redundantes y reflejaban la misma información que otras.

Tabla 1. Características Estadísticas

Característica Fórmula Característica Fórmula

F1 = Media 1

𝑁∑ 𝑥(𝑖)

𝑁

𝑖=1

F14 = Kurtosis 𝐹4

(𝐹10 )4

F2 = Momento Estadístico 2

1

𝑁∑(𝑥(𝑖) − 𝐹1 )2

𝑁

𝑖=1

F15 = RMS √∑ 𝑥(𝑖)2𝑁

𝑖=1

𝑁

F3 = Momento Estadístico 3

1

𝑁∑(𝑥(𝑖) − 𝐹1 )3

𝑁

𝑖=1

F16 (∑ √|𝑥(𝑖)|𝑁

𝑖=1

𝑁)

2

F4 = Momento Estadístico 4

1

𝑁∑(𝑥(𝑖) − 𝐹1 )4

𝑁

𝑖=1

F17 ∑ |𝑥(𝑖)|𝑁

𝑖=1

𝑁

F5 = Momento Estadístico 5

1

𝑁∑(𝑥(𝑖) − 𝐹1 )5

𝑁

𝑖=1

F18 = Max max 𝑥(𝑖)

F6 = Momento Estadístico 6

1

𝑁∑(𝑥(𝑖) − 𝐹1 )6

𝑁

𝑖=1

F19 = Min min 𝑥(𝑖)

F7 = Momento Estadístico 7

1

𝑁∑(𝑥(𝑖) − 𝐹1 )7

𝑁

𝑖=1

F20 𝐹15

𝐹17

F8 = Momento Estadístico 8

1

𝑁∑(𝑥(𝑖) − 𝐹1 )8

𝑁

𝑖=1

F21 𝐹18

𝐹15

F9 = Peak to Peak max 𝑥(𝑖) − min 𝑥(𝑖) F22 𝐹18

𝐹17

F10 = Desviación Estándar √

∑ (𝑥(𝑖) − 𝐹1 )2𝑁𝑖=1

𝑁 − 1 F23

𝐹18

𝐹16

Page 5: Evaluación de Parámetros Estadísticos para la ...

F11 = Media / Desviación Estándar

𝐹1

𝐹10

F24 𝐹3

(𝐹15 )3

F12 = Crest Factor

max 𝑥(𝑖)

√∑ 𝑥(𝑖)2𝑁𝑖=1

𝑁

F25

𝐹4

(𝐹15 )4

F13 = Skewness 𝐹3

(𝐹10 )3

Con esto en mente, la independencia entre variables o multicolinealidad fue probada a través de la matriz de correlaciones, la cual cuantifica la relación entre cada pareja de variables mediante un coeficiente de correlación que va entre 0 y 1. No obstante, considerando que las correlaciones entre par de variables puede llegar a ser limitante, dado que es probable que una correlación entre una pareja de variables sea insignificante y sin embargo, exista una dependencia lineal entre tres o más variables, los Factores de Inflación de Varianza (VIF, por sus siglas en inglés) fueron calculados. Los VIF´s miden en cuanto aumenta la varianza de una variable j por la presencia de correlaciones con otras variables presentes en el modelo. Los Factores de Inflación de Varianza pueden ser calculados mediante la Ecuación 4, donde Rj

2 representa el valor R2 de aplicar una regresión sobre la variable j en función de las variables restantes. [18]

𝑉𝐼𝐹𝑗 =1

1 − 𝑅𝑗2 Ecuación 4. Variance Inflation Factor

Un VIF de 1 indicaría que no existe ninguna correlación entre la variable j y las variables restantes. Además, la literatura sugiere que VIF´s excediendo un valor de 5 requieren de investigación adicional y los VIF´s que exceden un valor de 10 son una clara evidencia de multicolinealidad grave. Con el objetivo de medir y comparar el desempeño de una regresión logística en clasificar los dos estados de rodamientos (“bueno” & “dañado”), usando las 25 variables mostradas en la Tabla 1 y usando únicamente aquellas que fueron determinadas como independientes a través del método de los Factores de Inflación de Varianza (VIF), se debía primero pre-procesar los datos encontrados en línea y tomados con el montaje construido por Ulloa [12]. La base de datos del Center for Intelligent Maintenance Systems (IMS) de la Universidad de Cincinnati [13], fue tomada con un montaje compuesto por un motor conectado a un eje mediante una polea, el cual a su vez se encontraba soportado por 4 rodamientos. La base de datos constaba de 3 experimentos similares, en donde la velocidad de rotación del motor era de 2000 RPM y una carga radial de 6000 lb era aplicada sobre los rodamientos 2 y 3 hasta que alguno de los 4 rodamientos fallara. En cada experimento se registraron señales de vibración medidas con acelerómetros ubicados en cada uno de los rodamientos. Los datos fueron adquiridos durante 1 segundo en intervalos de tiempo constante de 10 minutos a una frecuencia de muestreo de 20 kHz. Por el otro lado, el banco de pruebas disponible en Uniandes consistía en un motor conectado a un eje, el cual a su vez se encontraba soportado por dos rodamientos y poseía un volante de inercia en la mitad de los apoyos (Figura 1). Para registrar las señales de vibración, se instaló un acelerómetro Bruel & Kjaer 4396 en el soporte del rodamiento opuesto al motor; este sensor fue conectado a un DAQ National Instruments y los datos fueron adquiridos durante 1 segundo en intervalos de tiempo de 3 minutos, a una frecuencia de muestreo de 10 kHz.

Page 6: Evaluación de Parámetros Estadísticos para la ...

Figura 1. Banco de Pruebas Uniandes

Para garantizar la correcta alineación y balanceo de todo el montaje, en primer lugar, se utilizaron guías laser para verificar la posición del eje en la dirección horizontal y luego, se hizo uso de un comparador de carátulas y de unas galgas de diferentes espesores para medir la diferencia de alturas y corregir estas. Por último, para comprobar que el montaje se encontrara totalmente balanceado, se recrearon una serie de espectrogramas de frecuencia a las respuestas en vibración de varias masas ubicadas a un radio de 20 mm del eje de rotación (Figura 2). En estas, se puede observar la presencia de un armónico a 30 Hz, el cual corresponde exactamente a la frecuencia de rotación del motor; de modo que, es posible concluir que existía un desbalanceo dado por las tolerancias de manufactura del sistema y este fue corregido introduciendo una masa de 15.6 gramos a un radio de 20 milímetros del eje de rotación.

Figura 2. Respuesta en Frecuencia vs Diferentes Masas

Finalmente, con el propósito de acelerar el proceso de desgaste en el rodamiento, se introdujo medio gramo de polvo de Alúmina (Ref: Panadyne – Reactive Grade Alumina (Al2O3) MR70) en la grasa interna del rodamiento y se corrió el experimento durante 66 minutos. Este polvo tenía un tamaño promedio de partícula de 0.64 μm y una dureza típica de 1500 Vickers [19]; aproximadamente 2 veces la dureza del acero 100Cr6 con la cual están fabricados los rodamientos (58-65 Rockwell C) [20]. Análisis Tomando como referencia el experimento 2 de la base de datos IMS [13], se comenzó por calcular la matriz de correlaciones, expuesta en la Tabla 2.

Page 7: Evaluación de Parámetros Estadísticos para la ...

Tabla 2. Matriz Correlaciones

Hecho esto, se pudo observar que existía un gran número de correlaciones superando el valor de 0.8, de modo que se confirmó la sospecha de dependencia lineal entre algunas de las variables expuestas. Sin embargo, con el objetivo de profundizar sobre la relación entre una estadística y las demás otras, y además encontrar aquel grupo de parámetros independientes, se procedió a calcular los Factores de Inflación de Varianza (VIF) para cada una de las variables. Siguiendo las recomendaciones propuestas por Olusegun, Garba y Samson [18], se realizó un proceso iterativo. En este, se eliminaba la variable con VIF más alto y a continuación se recalculaba nuevamente los VIF´s de las variables restantes. El proceso se repitió hasta que finalmente permanecieran únicamente aquellas variables cuyo VIF no excediera el valor recomendado de 5. A través de este, se determinó que el grupo de estadísticas linealmente independiente entre ellas era aquel expuesto en la Tabla 3.

Tabla 3. Grupo Variables Independientes

Variable Significado VIF

F8 Momento Estadístico 8 1.22 F11 Media/Desviación Estándar 1.57 F13 Skewness 1.98

F16 (∑ √|𝑥(𝑖)|𝑁

𝑖=1

𝑁)

2

2.70

En este sentido, con la intención de probar nuestra hipótesis de suficiencia de variables, corrimos una regresión logística en la cual se usaban como variables de entrada las 25 estadísticas descritas en la Tabla 1 y a la par, otra regresión logística en la cual se usará como variables de entrada,

Page 8: Evaluación de Parámetros Estadísticos para la ...

únicamente aquellas estadísticas linealmente independientes y reflejadas en la Tabla 3. Para el proceso de etiquetado y de futura evaluación del desempeño del algoritmo en clasificar tipos de rodamientos, se decidieron tomar los 100 primeros datos del experimento 2 como condición “buena” y los últimos 100 datos de este mismo experimento como condición “dañada”. Realizado esto, pudimos ver que tanto el Accuracy, Precision, Recall e incluso el AUC tomaban todos unos valores de 100% corriendo el modelo con todas las variables y corriéndolo únicamente con las 4 variables independientes. No obstante, con el fin de darle aún más validez a nuestro hallazgo y terminar de probar la hipótesis, se midió de igual forma el desempeño de la regresión logística usando ambos sets de variables, pero esta vez utilizando otro experimento (experimento #3 IMS) y otra configuración experimental (datos registrados con montaje Uniandes). Para esto, nuevamente se tomaron los 100 primeros datos del experimento 3 de IMS como condición “buena” y los últimos 100 datos del mismo experimento como condición “dañada”. Y por otra parte, al poseer un número limitado de datos (22) tomados con el montaje del laboratorio Colivri, decidió dividirse el primer dato en 30 datos diferentes para etiquetarlos como condición “buena”, y dividir el último dato en 30 datos diferentes para etiquetar estos como condición “dañada”, teniendo en cuenta que en un solo segundo se estaban llegando a capturar 10000 registros diferentes. Hecho esto, pudimos evidenciar nuevamente que las diferentes medidas de desempeño del algoritmo no cambiaban al utilizar un set de variables u el otro en ninguno de los dos experimentos adicionales, por lo cual logramos concluir que las 4 variables de la Tabla 3 eran suficientes para alcanzar el mismo poder de clasificación de un algoritmo que fuese alimentado con las 25 variables expuestas en la Tabla 1 y de las cuales varias de ellas eran redundantes y reflejaban la misma clase de información. Logrado esto, decidimos profundizar aún más en el tema y ver cuáles de las variables estaban causando un tan buen desempeño en el algoritmo. Para esto, probamos cuales de las variables por separado, eran más determinantes en clasificar el estado del rodamiento como dañado o no dañado. Llevado a cabo esto, logramos determinar que existían 8 características que, por separado, alcanzaban un desempeño del 100 en la exactitud y demás medidas de evaluación del algoritmo. Estas fueron la 2, 9, 10, 15, 16, 17, 18 y 19 de la Tabla 1, las cuales respectivamente son el momento

estadístico 2, Peak to Peak, Desviación Estándar, Root Mean Square, (∑ √|𝑥(𝑖)|𝑁

𝑖=1

𝑁)

2

, ∑ |𝑥(𝑖)|𝑁

𝑖=1

𝑁,

máximo y mínimo de la señal. Observando la evolución de estas anteriores 8 características a lo largo del tiempo en la Figura 3, pudimos observar el motivo por el cual el algoritmo alcanzaba un tan buen desempeño con tan sólo una de estas variables y era que la diferencia en valores para cada una de estas estadísticas al inicio del proceso de desgaste y al final de este, era lo suficientemente diferente como para que la regresión logística estuviera en capacidad de distinguir entre las dos clases de estado, sin estar sujeto a equivocaciones.

Page 9: Evaluación de Parámetros Estadísticos para la ...

Figura 3. Evolución Características Determinantes de Estado

Cierre Los desarrollos e investigaciones hechas en detección de fallas han estado limitadas a saber si el mecanismo está en una condición diferente a la del estado nominal, es decir, si el elemento está o no en falla. Después de la detección de fallas, se necesita una evaluación de daño; esta evaluación ha estado enfocada a indicar el modo de falla en el que se encuentra el dispositivo, dejando de un lado el análisis de la magnitud de la falla. La severidad de la falla puede estudiarse desde dos perspectivas; la primera, asociada al tamaño físico de la falla (tamaño de las imperfecciones en las pistas de los rodamientos) y la segunda, relacionada con la degradación general del rodamiento. En el primer caso, se requieren técnicas de procesamiento de señales más complejas para analizar el comportamiento dinámico en casos como el evento de entrada y de salida de la bola sobre la imperfección en la pista interna del rodamiento; en el segundo, la idea es definir un indicador del nivel de daño (ligero, medio, severo) basado en la degradación del componente. En el estudio asociado a la degradación general del rodamiento, a diferencia del estudio donde se estudia el tamaño físico de la falla, no hay ningún defecto localizado para ser identificado como falla. Un ejemplo de esto es el desgaste generalizado de las pistas del rodamiento producido por partículas de residuos, falta o pérdida de lubricante, desalineación o progresión de fallas localizadas. Este tipo de falla, a diferencia de las fallas que se centran en el tamaño físico del defecto, genera patrones de vibración complejos sin frecuencias de vibración características, lo cual hace que este tipo de fallas haya sido menos investigado y de cabida a un nuevo campo de investigación. [21] En el actual trabajo, se investigaron cuáles de las características disponibles en la literatura y usadas por una variedad de autores, eran determinantes y suficientes para detectar el problema de falla “binaria” en un rodamiento. A través de este, se logró concluir que incluso con la selección de

Page 10: Evaluación de Parámetros Estadísticos para la ...

características correctas y expuestas en la Figura 3, bastaba con usar una de ellas para resolver el problema de clasificación a la perfección incluso usando un algoritmo básico de Machine Learning como lo es la regresión logística. De modo que, para futuros trabajos, se sugiere abordar el problema de clasificación en distintos niveles de daño para el problema de falla progresiva en un rodamiento. Para esto, se logró avanzar en una parte del trabajo de investigación, en la cual se alcanzó a determinar que ninguna de las 25 características descritas en la Tabla 1 exhibía un comportamiento “progresivo” y continuo a lo largo del tiempo. Este comportamiento gradualmente creciente no se llegó a evidenciar ni siquiera al aplicar un filtro Butterworth de segundo orden [22] (con una frecuencia de corte del doble de la frecuencia natural de daño que exhibía el rodamiento evaluado) sobre las características, ni combinando dichas estadísticas calculadas a partir de señales de vibración medidas en ejes completamente ortogonales (x & y). De manera que, resta experimentar con medición de señales tales como acústicas o térmicas, para ver si estas pueden ser aptas como variables de entrada para el problema de clasificación de distintos niveles de desgaste.

Page 11: Evaluación de Parámetros Estadísticos para la ...

Referencias

[1] D. Siyambalapitiya y P. McLaren, «Reliability Improvement and Economic Benefits of On-Line Monitoring System for Large Induction Machines,» IEEE Transactions on Industry Applications, 1990.

[2] E. Terrell, W. Needelman y J. Kyle, «Wind Turbine Tribology,» Springer, 2012.

[3] G. Georgoulas, T. Loutas, C. Stylios y V. Kostopo, «Bearing Fault Detection Based on Hybrid Ensemble Detector and Empirical Mode Decomposition,» Mechanical Systems and Signal Processing, 2013.

[4] P. Gangsar y R. Tiwari, «A Support Vector Machine Based Fault Diagnostics of Induction Motors for Practical Situation of Multi Sensor Limited Data Case,» Measurement, 2019.

[5] R. Li, «Rotating Machine Fault Diagnostics using Vibration and Acoustic Emission Sensors,» University of Illinois, 2012.

[6] Z. Ye, B. Wu y A. Sadeghian, «Induction Motor Mechanical Fault Online Diagnosis with the Application of Artificial Neural Network,» IEEE Applied Poweer Electronics, 2001.

[7] A. Siddique, G. S. Yadava y B. Singh, «Applications of Artificial Intelligence Techniques for Induction Machine Stator Fault Diagnostics: Review.,» IEEE Diagnostics for Electric Machines, Power Electronics and Drives., 2003.

[8] V. Tran, B. Yang, M. Oh y A. Tan, «Fault Diagnosis of Induction Motor Based on Decision Trees and Adaptive Neuro-Fuzzy Inference,» Expert Systems with Applications, 2009.

[9] A. Prudhom, J. Antonino-Daviu, H. Razik y V. Climen, «Time-Frequency Vibration Analysis for the Detection of Motor Damages Caused by Bearing Currents,» Mechanical Systems and Signal Processing, 2017.

[10] Y. Liu, «Fault Diagnosis Based on SWPT and Hilbert Transform,» Procedia Engineering, 2011.

[11] V. Tran, B. Yang, M. Oh y A. Tan, «Fault Diagnosis of Induction Motor Based on Decision Trees and Adaptive Neuro-fuzzy Inference,» Expert Systems with Applications, 2009.

[12] F. Ulloa, «Detección de Fallas en Maquinaria Rotativa: Implementación de una Red Neuronal Convolucional,» Uniandes, 2018.

[13] J. Lee, H. Qiu, G. Yu, J. Lin y R. T. S. , «"Bearing Data Set", NASA Ames Prognostics Data Repository,» IMS, University of Cincinnati, 2007. [En línea]. Available: https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/. [Último acceso: 11 02 2019].

[14] M. H. R. y H. F., «Application of Statistical Moments to Bearing Failure Detection,» Applied Acoustics, vol. 44, pp. 67-77, 1995.

[15] S. Chuang, Z. Zhousuo y H. Zhengjia, «Research on Bearing Life Prediction Based on Support Vector Machine and its Application.,» Journal of Physics: Conference Series, 2011.

[16] D. Dyer y R. M. Stewart, «Detection of Rolling Element Bearing Damage by Statistical Vibration Analysis,» Journal of Mechanical Design, vol. 100, pp. 229-235, 1978.

[17] P. K. Kankar, S. C. Sharma y S. P. Harsha, «Fault Diagnosis of Ball Bearings Using Machine Learning Methods,» Expert Systems with Applications, vol. 38, pp. 1876-1886, 2011.

[18] M. Olusegun Akinwande, H. Garba Dikko and A. Samson, "Variance Inflation Factor: As a Condition for the Inclusion of Suppressor Variable(s) in Regression Analysis," Open Journal of Statistics, Zaria, 2014.

[19] Panadyne Inc, «Panadyne Products,» 2018. [En línea]. Available: http://www.panadyne.com/reactivegradealumina_mr_70.html. [Último acceso: 23 05 2019].

Page 12: Evaluación de Parámetros Estadísticos para la ...

[20] SKF, «Materials for Bearing Rings and Rolling Elements,» [En línea]. Available: https://www.skf.com/group/products/bearings-units-housings/super-precision-bearings/principles/bearing-specifics/materials/materials-for-bearing-rings-and-rolling-elements/index.html. [Último acceso: 23 05 2019].

[21] B. Dolenc, P. Boškoski y Đ. Juričić, «Distributed Bearing Fault Diagnosis Based on Vibration Analysis,» Mechanical Systems and Signal Processing, 2016.

[22] Y. Wang, G. Xu, L. Liang y K. Jiang, «Detection of Weak Transient Signals Based on Wavelet Packet Transform and Manifold Learning for Rolling Element Bearing Fault Diagnosis,» Mechanical Systems and Signal Processing, vol. 54, pp. 259-276, 2015.

[23] J. Stack, T. Habetler y R. Harley, «Fault Classification and Fault Signature Production for Rolling Element Bearings in Electric Machines,» IEEE Transactions on Industry Applications, 2003.

[24] B. Muruganatham, M. Sanjith, B. Krishnakumar y S. Murty, «Roller Element Bearing Fault Diagnosis Using Singular Spectrum Analysis.,» Mechanical Systems and Signal Processing, 2013.

[25] Y. Zhang, H. Zuo y F. Bai, «Classification of Fault Location and Performance Degradation of a Roller Bearing,» International Measurement Confederation, 2013.