Por Isocler Junior, Head of Data Analytics | AI Solutions | OS na iblue consulting
Os algoritmos de AI e ML usados para detectar fraudes são divididos em: aprendizado supervisionado e não supervisionado. No aprendizado supervisionado, os modelos são treinados com dados históricos rotulados ou batizados de “label”, que consistem em casos confirmados de fraude e não fraude ( o famoso binário 1 / 0 ). A partir desses dados, o sistema aprenderá a identificar características comuns classificadas como fraudes, aplicando esse conhecimento em novos casos. Para facilitar o entendimento, vamos pensar em uma financeira que dispõe de um histórico de todos os empréstimos que já foram concedidos. Alguns desses empréstimos foram pagos em dia, enquanto outros se tornaram inadimplentes. No aprendizado supervisionado, o sistema é então, alimentado com esses dados históricos, onde cada caso já foi rotulado como ‘adimplente’ ou ‘inadimplente’. Com base nesse exemplo, o modelo aprende quais características (idade, renda, histórico de crédito, tipo de moradia, estado civil etc.) estão associadas a cada categoria. Desta forma, quando um novo cliente solicitar um empréstimo, o sistema usará esse ‘aprendizado’ para prever se ele terá maior ou menor probabilidade de se tornar um devedor, ajudando na tomada de decisão do analista financeiro.
Já no aprendizado não supervisionado, os algoritmos analisam dados sem rótulos (label) específicos, buscando correlações e padrões anômalos por conta própria.
Imagine que você é o gerente de uma loja e observa o comportamento de seus clientes que entram em sua loja todos os dias, por meses. Com o tempo, você aprende a identificar como é o comportamento comum: os clientes entram, alguns pegam os produtos para ler rótulos, visitam um determinado setor da loja com mais frequência, e fazem suas compras em aproximadamente 10 minutos. Agora, imagine que um cliente entrou e começou a agir de forma diferente, ou seja, ele anda repetidamente pelos corredores sem pegar nada ou fica muito tempo em uma área específica e que não é comum ter visitação. Mesmo que você nunca tenha visto esse comportamento antes, você percebe que algo está fora do padrão que você havia observado. Da mesma forma, no aprendizado não supervisionado, os algoritmos monitoram os dados e detectam comportamentos incomuns, mesmo que esses padrões sejam novos e ainda não catalogados. No aprendizado não supervisionado, não precisamos “conhecer” o nome do cliente, idade, ou outras variáveis específicas. Pelo contrário, focamos no comportamento e como ele se compara ao padrão geral. O algoritmo “aprende” a identificar o que é considerado “normal” e, a partir disso, detecta comportamentos que se desviam desse padrão, mesmo que não esteja claro o que exatamente está acontecendo. Dentre as técnicas, o Isolation Forest é amplamente utilizado pelos cientistas de dados para detecção de anomalias, porque este algoritmo cria várias árvores de decisão para isolar os comportamentos atípicos. Se um comportamento é isolado rapidamente (com poucas divisões da árvore), ele é considerado uma anomalia. Logo, isso é útil quando se lida com novas táticas de fraude, ainda não catalogadas, pois o sistema consegue identificar comportamentos que se desviam do padrão, mesmo que ainda não tenha sido “ensinado” sobre um tipo de fraude específica.
Assim, usar AI e ML traz uma série de benefícios para as empresas. Em primeiro lugar, há uma redução significativa nos custos operacionais, já que os processos de auditoria, que antes demandavam equipes especializadas e muitas horas de trabalho, agora são automatizados e realizados em poucos segundos. Além disso, a precisão dos modelos de AI permite que as fraudes sejam detectadas mais rapidamente, reduzindo o impacto financeiro e aumentando a confiança do consumidor nos serviços oferecidos. Quem não fica feliz em saber que sua operadora de cartão de crédito bloqueou uma operação de compra suspeita e te avisou?
O aprimoramento do AI para modelos que usam redes neurais como Deep Learning pode ajudar no reconhecimento de padrões de fraudes, como o uso repetido de determinados códigos de procedimentos médicos ou a ocorrência de pedidos de reembolso elevados logo após o término de um contrato com um credenciado do plano de saúde. Esses modelos têm uma capacidade de adaptação e aprendizagem contínua. Eles conseguem processar e analisar dados estruturados e não estruturados (por exemplo, descrições textuais em relatórios médicos que mesmo em imagens, arquivos PDF podem ser convertidos em texto) para detectar irregularidades que seriam difíceis de identificar manualmente.
E como o mercado está exposto a riscos o tempo todo, o volume de dados está cada vez maior e não temos muito tempo para pensarmos em quais modelos são mais assertivos, contamos com a vantagem de adotar motores de AutoML (Automated Machine Learning) que podem desempenhar um papel crucial na criação, implementação e otimização de vários algoritmos, inclusive para detecção de fraudes. O AutoML automatiza muitas etapas do processo de construção de diversos modelos de machine learning, facilitando a criação de soluções mais eficientes, e apoiando as equipes de ciência de dados. Com o AutoML, a seleção de features (variáveis relevantes ao modelo) fica mais fácil, identificando as que são mais propensas para padrões de fraudes, sem contar que o AutoML testa rapidamente uma variedade enorme de modelos, faz automaticamente a calibração dos modelos usando centenas de parâmetros e no final, seleciona aquele com melhor métrica de desempenho para o conjunto de dados específico.
Um ponto importante é que, embora a AI não consiga garantir uma taxa de acerto de 100%, ela aumenta a probabilidade de identificar fraudes, permitindo que as equipes concentrem seus esforços em casos que realmente apresentem maior risco. Isso melhora a eficiência operacional e reduz os falsos positivos, algo que costumava ser um grande desafio nos métodos tradicionais.
Os algoritmos de AI e Machine Learning estão desempenhando um papel crucial na detecção de fraudes, tanto em ambientes supervisionados quanto não supervisionados. Ao combinar a capacidade de processar grandes volumes de dados com a detecção de padrões complexos e comportamentos anômalos, essas tecnologias estão revolucionando a segurança e a eficiência das operações empresariais. No entanto, a implementação dessas soluções apresenta desafios técnicos e estratégicos que precisam ser considerados para maximizar seu potencial.
No próximo artigo, “Desafios na Implementação de AI”, vamos explorar as barreiras e dificuldades enfrentadas pelas empresas ao adotar essa tecnologia. Desde a complexidade na escolha dos modelos até a integração eficiente com os sistemas legados, compreender esses desafios é essencial para qualquer organização que busca implementar AI com sucesso. Não perca!
A iblue consulting está preparada para ajudar sua empresa a enfrentar esses desafios com soluções completas de AI e MLOps. Com experiência na integração de dados, conformidade regulatória e na construção de modelos de machine learning eficazes, podemos otimizar o seu processo de detecção de fraudes, garantindo maior segurança e eficiência operacional. Visite www.iblueconsulting.com.br e descubra como nossas soluções podem transformar a sua estratégia de prevenção de fraudes.