Cómo la IA y el Machine Learning están redifiniendo la ...

titularidad

WHITE PAPER

Cómo la IA y el Machine Learning están redifiniendo la lucha contra el lavado de dineroAproveche todas las ventajas para combatirlo.

ii

ContenidoEvolución del panorama del lavado de dinero ............................................................... 01Aquí es donde la IA entra en juego ................................................................................... 01Bases del machine learning ................................................................................................ 02

Machine Learning supervisado .......................................................................................... 02Machine Learnig sin supervisión ........................................................................................ 02

Machine Learning en el trabajo − 6 casos de uso de AML .......................................... 03El Machine Learnig como complemento de la vigilancia de las transacciones .............. 03Machine Learnig para la detección de anomalías ............................................................. 04Machine Learnig para la segmentación de clientes .......................................................... 05Machine Learnig para la clasificación de riesgo del cliente ............................................. 05Machine Learnig para el análisis de redes sociales ........................................................... 05Machine Learnig para el ajuste y la puesta a punto .......................................................... 05

Los tres principales desafíos para adoptar el Machine Learning ............................... 06Los conocimientos, las personas y los sistemas necesarios no están en su lugar .......... 06Los datos de entrenamiento son difíciles .......................................................................... 06Los modelos de Machine Learnig tienden a ser sistemas de caja negra ........................ 07

Cómo puede ayudar SAS ................................................................................................... 07Características principales .................................................................................................. 07

La evolución del panorama del blanqueo de capitalesLos delincuentes financieros son astutos a la hora de disfrazar el origen de sus beneficios ilegales y de introducir ese dinero en el sistema financiero, ya sea para beneficio personal o para apoyar a las empresas delictivas. Si bien la mayor parte del dinero blanqueado proviene del tráfico de drogas y de la delincuencia organizada, los acontecimientos del 11 de septiembre también pusieron de relieve la financiación encubierta de actividades terroristas, que tradicionalmente ha sido aún más difícil de detectar.

Es un desafío desalentador. El inmenso volumen de datos que se espera que las instituciones financieras analicen para cumplir los requisitos reglamentarios para detectar e informar sobre actividades sospechosas. Los datos son por lo general diversos y subordinados. Es común que los sistemas utilicen sólo un subconjunto de los datos disponibles al generar las alertas. Los sistemas tradicionales de vigilancia de transaction son difíciles de mantener y se basan en normas y reglas que son fáciles de probar y sortear por los delincuentes. Los procesos de investigación suelen ser sumamente manuales, desde la reunión de los datos de apoyo para un caso hasta la presentación de un informe completo de actividades sospechosas (SAR).

Mientras tanto, los blanqueadores de dinero trabajan día y noche para permanecer ocultos, diseñando constantemente nuevas formas de ocultar el flujo de fondos.

Las herramientas y tácticas tradicionales para combatir el lavado de capitales (AML) y la financiación del terrorismo (CFT) toman más tiempo y cuestan más de lo que deberían. Para fortificar la defensa, las instituciones financieras necesitan formas de:

• Automatizar las tareas que antes requerían la intervención humana, como la disposición de alertas.

• Detectar más riesgos y priorizarlos efectivamente con sofisticadas técnicas analíticas.

• Proporcionar un contexto más rico para investigaciones con acceso a conocimientos más amplios.

Aquí es donde la IA entra en juegoEl concepto de inteligencia artificial (IA) cuenta con visiones de robots que aprenden demasiado, se otorgan demasiado poder y derrotan a sus creadores. La realidad de la IA es mucho menos dramática. En términos generales, se trata de permitir que una máquina tome una decisión que un humano podría haber tomado.

Cuando Amazon y Netflix te recomiendan cosas que te pueden gustar, la IA está entre bastidores. Cuando los asistentes personales inteligentes de Siri y Alexa te ayudan a organizar tu vida y hacen recomendaciones, o cuando el reconocimiento facial autentifica tus pagos en línea o por móvil, la inteligencia artificial está trabajando. Desde los coches sin conductor hasta las ofertas de productos personalizados, pasando por la detección de fraude de tarjetas de crédito, la IA y las tecnologías de machine learning están beneficiando a una gran cantidad de industrias y creando otras nuevas con las que no se sueña.

Un subconjunto de IA, machine learning permite que un programa de ordenador aprenda de los datos en vez de a través de una programación explícita. Estos programas trabajan tomando datos de ejemplo, encontrando patrones en ellos que pueden ser demasiado complejos para que un humano los vea intuitivamente, y luego aplicando los hallazgos a los nuevos datos. Cuando esta capacidad de aprendizaje se une a la potencia de la computación moderna, se tiene una receta para un sistema que pueda tomar complejas decisiones de forma automatizada.

1

2

Algunas técnicas de machine learning pueden destilar nuevos elementos de datos no conocidos anteriormente o no disponibles para los modelos ALD/CFT. Estos modelos pueden interpretar patrones previamente desconocidos a partir de vastas fuentes de datos, que a su vez pueden alimentar otros esfuerzos de modelación. Otras técnicas de machine learning pueden ser utilizadas para hacer directamente predicciones basadas en patrones que encuentran. Cuanto más entrenamiento recibe un modelo con datos de retroalimentación, más preciso se vuelve y menos afinación requiere.

Sabores del Machine LearningEl enfoque correcto de machine learning para el ALD/CFT depende de la información que tengas entrenando el modelo y lo que esperas conseguir.

Machine Learning supervisadoCon el machine learning supervisado, el modelo se presenta con entradas de muestra y sus salidas asociadas, y el objetivo es elaborar una regla general que relacione esas entradas con las salidas. Por ejemplo, ¿qué atributos se asociaron a los casos que se convirtieron en el SARS? ¿Qué conclusiones se asociaron con falsos positivos o falsos negativos? El modelo aprende a predecir mejor el resultado cuando se aplica a nuevos datos.

Las técnicas típicas de aprendizaje supervisado incluyen:

• Estadísticas bayesianas que describen la probabilidad condicional de un evento basado en datos entrantes así como información o creencias previas sobre el evento.

• Árboles de decisión un modelo de decisiones de "si/entonces" y sus consecuencias possibles.

• Las redes neuronales donde las "neuronas" están conectadas por peso, una técnica ampliamente utilizada para el reconocimiento de voz, análisis de imagen y control adaptativo.

• Análisis de regresión para modelar y analizar las relaciones entre una variable dependiente y una o más variables independientes.

• Bosques al azar un método de aprendizaje en conjunto para la clasificación, regresión y otras tareas, que opera construyendo una multitud de árboles de decisión.

Machine Learning sin supervisiónCon el machine learning no supervisado, el algoritmo aprende de los datos de la muestra que no han sido etiquetados, clasificados o categorizados. El algoritmo es por sí mismo para encontrar estructura o patrones ocultos en los datos. Como no sabe qué datos representan actividades sospechosas, quiere que el modelo cree una función que describa la estructura de los datos, marque las anomalías y luego aplique este conocimiento a los nuevos datos.

Las técnicas comunes de aprendizaje sin supervisión incluyen:

• Análisis de afinidad una técnica de análisis y extracción de datos que descubre las relaciones entre las actividades realizadas por entidades específicas (o registradas sobre ellas).

• Agrupación una forma de minería de datos exploratoria que agrupa "objetos" en un grupo (cúmulo) en el que los objetos son más similares entre sí en algún sentido que a los otros clusters.

• Cartografía de los vecinos más cercanos un ejercicio de optimización para encontrar el punto en un conjunto dado que esté más cerca (o sea más similar) a cualquier punto dado.

Al mirar todas las cuentas, atributos de los clientes y eventos juntos, el machine learning no supervisado puede descubrir patrones significativos que no se verían con los sistemas anti lavado de dinero tradicionales basados en reglas.

3

En resumen, el machine learning permite que un programa de ordenador aprenda de los datos en vez de a través de una programación explícita. El programa toma datos de muestra, encuentra patrones in que podrían ser demasiado complejos para que un humano los vea, y luego aplica los hallazgos a los nuevos datos.

Con los avances en la potencia de la computación moderna, las decisiones altamente complejas pueden ser automatizadas con mayor velocidad y precisión. Es fácil ver el valor del machine learning para seguir el ritmo de la evolución de los esquemas ALD/CFT.

Machine Learning en el trabajo − 6 casos de uso de AMLGracias a los avances en el manejo de grandes datos, el machine learning puede ahora cambiar la arquitectura del AML. Las instituciones financieras también pueden:

• Reemplazar sus motores basados en reglas por modelos de machine learning.

• Utilizar el machine learning como un sistema de apoyo para desarrollar modelos que se alimentan del motor basado en reglas y que aportan nueva inteligencia a actividades como la clasificación de riesgos, el ajuste de reglas y la priorización de alertas.

Veamos algunas formas en que el machine learning se está utilizando para temas de AML.

El machine learning como complemento de la vigilancia de transaccionesAlertas históricas asociadas con comportamientos sospechosos, disposiciones productivas o presentaciones de SAR − conocidas "buenas" alertas − y un modelo de machine learning supervisad puede entrenarse con estos datos para ser más inteligente en la puntuación y la priorización de las nuevas alertas. Los investigadores pueden entonces:

• Concéntrese en las alertas que tienen más probabilidades de dar lugar a la presentación de un informe SAR.

• Descubrir los vínculos ocultos entre los malos actores de hoy en día y sus homólogos históricos.

Un enfoque consiste en crear un modelo de machine learning de priorización de alertas sobre un sistema de supervisión de transacciones existente para puntuar alertas según su nivel de sospecha. O un modelo de machine learning puede ser diseñado para aumentar o reemplazar completamente los escenarios basados en reglas. De cualquier manera, un modelo de machine learning puede ayudar a los investigadores a priorizar las colas de flujo de trabajo para la revisión, o las alertas de auto-disposición − escalar alertas de alto riesgo e "hibernar" alertas de bajo riesgo.

Con los modelos de machine learning, puede:

• Reducir los falsos positivos con una segmentación más estricta. Los escenarios basados en reglas y los modelos de segmentación suelen ser amplios y se basan en campos de datos convencionales como el tipo de cuenta y la demografía de los clientes. Un enfoque amplio conduce a más falsos positivos, más carga de trabajo para los investigadores y un mayor costo para la organización. Por el contrario, las técnicas de machine learning, como la agrupación, pueden definir segmentos más granulares para una evaluación más centrada del riesgo.

• Aumentar los verdaderos positivos con analítica. Los modelos de machine learning pueden identificar actividades y comportamientos sospechosos que los sistemas tradicionales de monitoreo de transacciones basadas en reglas no detectarían. Estos modelos pueden descubrir enlaces ocultos y relaciones, desenterrando nuevos patrones de actividades sospechosas que antes eran indetectables.

Los modelos pueden procesar cantidades masivas de datos sobre información demográfica, geográfica y de actividad de los malos actores y sus redes. Armados con una visión holística y global, los investigadores pueden llevar a cabo una investigación más efectiva.

4

Figura 1. Un modelo de machine learning puede proporcionar alertas más productivas sobre actividades sospechosas al considerar relaciones más complejas.

Machine Learning para la detección de anomalíasLos programas AML se basan en el concepto de encontrar actividades sospechosas, pero no hay una definición objetiva de "sospechoso". Ese es un problema para el aprendizaje supervisado de la máquina, que necesita aprender de los ejemplos etiquetados, como "sospechoso" o "no sospechoso".

Las técnicas de detección de anomalías abordan este problema identificando las observaciones que parecen matemáticamente "distantes" de la esperada − diferente de su propia actividad histórica o de la actividad actual de sus pares. Los valores atípicos − comportamiento fuera de la norma − podría justificar una mirada más cercana. Con poca dirección y sin datos etiquetados, los métodos de detección de anomalías pueden detectar actividades potencialmente sospechosas no definidas en una regla.

Figura 2. Un ejemplo conceptual simple de detección de valores atípicos basado en dos variables.

Un banco de la región de Asia y el Pacífico redujo los falsos positivos en un 33% mediante la elaboración de un enfoque de puntuación de alerta e "hibernación" para predecir las investigaciones dignas.

Un banco regional de Estados Unidos de nivel 2 modernizó el sistema de monitoreo para el combate del lavado de dinero basado al implementar SAS® mediante el modelo de red neuronal, que redujo los elementos de trabajo en un 50% y aumentó las tasas de conversión de SAR del 5% al 15%.

5

Machine Learning para la segmentación de clientesLos diferentes clientes realizan transacciones diferentes y por lo tanto deben ser monitoreados de manera diferente. Así que, naturalmente, los programas AML segmentan a los clientes en grupos de pares. Hay muchas maneras lógicas de segmentar los grupos de pares, por ejemplo, por demografía, estructura de negocios o volumen de transacciones. Pero los algoritmos de machine learning sin supervisión ofrecen posibilidades más sofisticadas.

Por ejemplo, un algoritmo de agrupación como el de la agrupación K-means clasifica las entidades en grupos similares identificando las observaciones que están matemáticamente "cercanas" entre sí por uno o varios factores. Así como dos ciudades pueden ser similares sobre la base de una combinación de factores como la distancia física, la densidad más el tamaño de la población, diferentes entidades pueden considerarse similares a través de una combinación de atributos y ser supervisadas en consecuencia.

Machine Learning para la clasificación de riesgo del clienteLos algoritmos de machine learning pueden utilizar datos conocidos sobre el comportamiento histórico de un cliente y las actividades sospechosas que dan lugar a la presentación del SAR para clasificar (o puntuar) a otros clientes con atributos similares. Este enfoque puede combinarse con datos de fuera de la organización para dar una visión más holística y global del cliente como parte del proceso de conocer a su cliente. Los modelos de machine learning se pueden entrenar para la selección de clientes incorporando la asignación de puntuaciones y utilizando estas puntuaciones como etiquetas para entrenar a los modelos de sistemas de supervisión de transacciones.

Machine Learning para el análisis de redes socialesEl machine learning puede identificar redes entrelazadas de actividades y actores sospechosos. Los modelos de machine learning no supervisados pueden examinar las cuentas y los clientes que participan en transacciones con un mal actor o una persona que figura en la lista de personas políticamente expuestas (PEP)/sanciones. Los modelos de machine learning pueden descubrir rápidamente patrones, vínculos y redes ocultas entre millones de cuentas y variables − y conectar a los malos actores con otros en su red.

Machine Learning para el ajuste y la puesta a puntoPara ser eficaces, las reglas/modelos deben adaptarse a lo que ocurre en el mundo. Imagina el poder de un sistema que puede examinar automáticamente masas de datos para ayudar a establecer reglas y mantenerlas actualizadas. El machine learning puede ser usado para establecer umbrales derivados de los datos que se calibran a sí mismos con base a lo que aprenden. Estos modelos pueden procesar grandes volúmenes de datos sobre alertas productivas para establecer umbrales más precisos. Basándose en los resultados de estos modelos, las organizaciones pueden establecer un ajuste continuo y automatizado, una manera mucho mejor de gestionar un proceso que requiere mucho tiempo.

Un banco mundial de primer nivel probó la validez de aplicar la IA para detectar riesgos ocultos o falsos negativos en su base de clientes e identificó la operación de 416 clientes sospechosos como negocios de servicios monetarios, 89 de los cuales no habían sido detectados anteriormente.

Tier 1, un banco global mejoró la experiencia del cliente para el negocio de financiamiento del comercio, acelerando los tiempos de diligencia debida y mejorando la precisión. El banco desplegó algoritmos de deep learning para clasificar los tipos de documentos que se estaban examinando, reduciendo así el esfuerzo del proceso de examen de dos semanas por persona a aproximadamente un minuto.

6

Los tres principales desafíos para adoptar el machine learningA pesar de los beneficios probados del machine learning en múltiples industrias, las instituciones financieras se han retrasado en adoptarlo para el lavado de dinero. De la experiencia de SAS con los clientes de esta industria, hay tres cuestiones principales:

• Los conocimientos necesarios, las personas y los sistemas no están en su lugar.

• Los datos de entrenamiento son difíciles.

• Los modelos de machine learning tienden a ser sistemas de "caja negra".

Veamos más de cerca estos desafíos.

Los conocimientos necesarios, las personas y los sistemas no están en su lugar.No es un secreto que hay una escasez de talento profesional en ciencias de la información. A pesar del sugimiento de muchos nuevos títulos universitarios y programas de certificación, las empresas todavía luchan por encontrar y retener profesionales cualificados para llevar a cabo sus ambiciones analíticas. Un buen proceso de desarrollo de modelos es iterativo, continuo e intensivo en tiempo. Implica probar varios tipos de modelos, combinaciones de variables de entrada y parámetros de modelos − y luego continuamente actualizando, probando y reubicando.

Para las organizaciones que carecen de talento en ciencias de los datos, parte de la solución es tener un conjunto de herramientas de software que automatice gran parte de este trabajo de análisis y gestione el ciclo de vida del modelo. No obstante, sigue siendo útil tener a mano la experiencia humana para diseñar y ajustar estos sistemas de forma inteligente y eficiente.

SAS cuenta con un equipo de consultores analíticos altamente experimentados que implementan soluciones en una amplia variedad de industrias. Nuestro equipo de Soluciones de Inteligencia de Seguridad está formado por expertos de la industria con experiencia en análisis de AML en instituciones bancarias de primer nivel.

Los datos de entrenamiento son difícilesPara que un algoritmo de machine learning funcione, los datos para construirlo tienen que ser identificados, reunidos, fusionados en un mercado de datos centralizado y gestionados por su calidad. Incluso los datos supuestamente "limpios" pueden tener problemas desconocidos como campos perdidos o valores atípicos.

Los modelos de machine learning supervisados también requieren datos de salida de muestra − por ejemplo, datos sobre alertas productivas y no productivas. Algunas organizaciones pueden utilizar los datos de un sistema de lucha contra el lavado de dinero existente, pero cualquier nueva característica necesitará datos recién etiquetados, lo que requiere el trabajo de los investigadores.

A menudo se pasan por alto estas medidas necesarias de preparación de datos.

SAS ha establecido arquitecturas de datos y procesos para abordar estos problemas de gestión de datos como parte de nuestra solución estándar de AML.

7

Los modelos de machine learning tienden a ser sistemas de caja negraSi bien los modelos de machine learning son fantásticos para encontrar patrones, no lo hacen de una manera que sea fácil de entender y explicar a un regulador. Muchos de los modelos de machine learning que están recibiendo más atención en este momento − las redes neuronales, los bosques aleatorios y el aumento de gradientes − son enfoques opacos. El resultado de estos modelos es complejo hasta el punto de ser poco práctico de descifrar. Existen técnicas para hacer ingeniería inversa de los resultados de manera que se puedan entender mejor, pero estos modelos siguen siendo un desafío para explicar.

Por otra parte, las técnicas de modelización estadística de "caja blanca", como los modelos de regresión y los árboles de decisión, intercambian cierto poder de predicción por transparencia, lo que resulta útil para explicar a un regulador. Y los escenarios basados en reglas son naturalmente los más fáciles de entender y explicar.

Entonces, ¿qué tipo de análisis debería utilizar su organización? Depende de la naturaleza de su problema y del nivel de opacidad del modelo con el que su organización se sienta cómoda. Las instituciones financieras más maduras analíticamente han visto resultados positivos con los modelos de caja negra, pero no todas las organizaciones están listas para dar ese paso. Dependiendo de los datos y el caso de uso, la ganancia incremental de un enfoque más complejo podría no estar justificada. Puede que decida experimentar con ambos para comprender plenamente las compensaciones.

SAS apoya ambos enfoques y puede ayudar a guiarle en esta decisión.

Cómo puede ayudar SASSAS ha estado desarrollando software analítico durante más de 40 años. Trabajando estrechamente con los clientes de servicios financieros, hemos desarrollado una solución que cubre los procesos de AML en todas las áreas clave, como el monitoreo de actividades sospechosas, la diligencia del cliente, el filtrado de listas de vigilancia y la gestión de casos de investigación.

Características principales• Gestión de datos. Aborde los retos de datos del combate contra el lavado de dinero,

desde el procesamiento de grandes datos hasta el acceso e integración de las fuentes heredadas − todo en una sola plataforma.

• Alto rendimiento analítico y visualización. Obtenga una visión rápida de insights del big data con una infraestructura que permite probar hipótesis, hacer preguntas y simular escenarios.

• Monitoreo y reporte de actividades sospechosas. Confíe en un motor de escenarios robusto y flexible que detecta con mayor precisión la actividad sospechosa y genera alertas para los eventos que cumplan con los parámetros definidos.

• Coincidencia de listas. Utilice algoritmos de coincidencia difusa, puntuación inteligente y consolidación de alertas para identificar a las personas, organizaciones o jurisdicciones que representan un riesgo regulatorio.

• Investigación y gestión de alertas. Utilice una interfaz basada en la web para obtener una visión general de los elementos de trabajo de investigación, con fácil acceso a la base de datos.

8

• Detección de anomalías en grupos de pares. Analítica en memoria identifica rápidamente la actividad potencialmente sospechosa comparando el comportamiento de una entidad con el comportamiento histórico y el de sus colegas.

• Búsqueda. Busque en grandes repositorios de datos con indexación distribuida, replicación y consultas con equilibrio de carga, recuperación y conmutación por error automatizada y mucho más.

• Arquitectura multiusuario. Servir de forma segura a múltiples grupos con una sola instalación segregando los datos.

La última generación del software SAS® Machine Learning está disponible en la plataforma SAS® Viya® que funciona en un entorno distribuido en memoria. SAS automatiza los procesos end-to-end asociados contra el combate de lavado de dinero, desde la gestión de datos hasta la gestión de modelos, pasando por la gestión y gobierno de casos.

SAS Viya sirve a una amplia gama de usuarios, desde analistas de negocios hasta científicos de datos. Son interfaces intuitivas de apuntar y hacer clic, o bien, la opción de programar con el lenguaje de programación SAS Base o con APIs soportadas de otros lenguajes de programación populares como R y Python. Y por supuesto, hay visualizaciones intuitivas de datos que permiten a los usuarios empresariales explorar los datos en múltiples dimensiones. Sus desarrolladores, analistas y líderes pueden elegir su modo de trabajo preferido.

Figura 3. SAS apoya el continuo anti lavado de dinero, desde la gestión de datos y

modelos hacia la gestión de las alertas, investigaciones y reportes.

Aprenda más en sas.com/en_us/software/anti-money-laundering.html.

Contáctenos en [email protected].

http://sas.com/en_us/software/anti-money-laundering.html

mailto:GHUSPSDAMLPresales%40sas.com?subject=

SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en EE.UU. y otros países. ® indica el registro de EE.UU. Otros nombres de marcas y productos son marcas comerciales de sus respectivas compañías. Copyright © 2020, SAS Institute Inc. Todos los derechos reservados. 111682_G137366.0820

Para comunicarse con su oficina local de SAS, sírvase visitar el sitio: sas.com/offices

http://www.sas.com/offices

http://sas.com/offices

Cómo la IA y el Machine Learning están redifiniendo la ...

Documents

Transcript of Cómo la IA y el Machine Learning están redifiniendo la ...