sábado, 16 de octubre de 2010

Minería de datos contra el "pitufeo"

Tuve la ocasión de asistir a un evento de SPSS como conferencista invitado. Allí también tuve la oportunidad de escuchar a un conferencista que me interesó mucho: utiliza software de minería de datos para la detección del lavado de activos en bancos. El nos explicó, particularmente,algunas técnicas usadas para detectar el "pitufeo".

Como su nombre lo indica, esta técnica de lavado de activos consiste en utilizar un sinnúmero de personas diferentes para hacer "pequeñas" consignaciones o transacciones en una determinada cuenta. Estas personas son los "pitufos", en honor a la serie de dibujos animados creada por el belga Peyo. Una verdadera lástima que el verbo "pitufear", que estas criaturas usaban indiscriminadamente para reemplazar otros verbos, se haya vuelto sinónimo de una actividad ilegal.

Estas transacciones de "pitufeo" están justo por debajo de un límite establecido, a partir del cual dichas operaciones deben reportarse en un papel especial y pueden llamar la atención de las autoridades.

Pues bien: los bancos están utilizando algoritmos de minería de datos- en particular, clustering y reglas de asociación- para clasificar clientes con comportamientos sospechosos. El trabajo se hace sobre más de 20 millones de transacciones mensuales y un par de millones de clientes. En el camino, por supuesto, están aprendiendo de sus clientes y detectando la manera usual en que grupos de dichos clientes se comportan, en cuanto a bancos se refiere. !Una verdadera mina de oro! Sin embargo, parece que esta información no se está reenviando o compartiendo con mercadeo y ventas.

Estos análisis de pitufeo se complementan con asociaciones en sistemas de referenciación geográfica para analizar, por ejemplo, sucursales en zonas que se sabe -por detección satelital- tienen un mayor número de hectáreas de cultivos ilícitos o influencia guerrillera. Mediante inteligencia han detectado prácticas sospechosas como el uso del canal virtual repetidamente desde zonas remotas donde lo usual es utilizar las transacciones físicas, hasta la detección de pagos hipotecarios por adelantado que no corresponden a los ingresos de las personas.

Estas detecciones sospechosas deben ser enviadas a entidades gubernamentales para que ellas inicien investigaciones. Lo realmente malo de esta situación es que los bancos no reciben realimentación de los resultados, es decir, no saben cuántos de los supuestos sospechosos de "pitufeo" o lavado de activos realmente estaban realizando estas actividades, debido a la sensibilidad de los datos. Es una verdadera lástima, digo yo, porque unas cifras consolidadas , que no revelarían nada en particular, si serían útiles para saber si los patrones detectados corresponden a actividades ilícitas o son meras fantasías de los analistas del banco.