O encontro da Inteligência Artificial (IA) com o LEI
A economia digital e globalizada torna a verificação de identidade por empresas e autoridades mais importante e mais difícil de ser realizada com precisão. A transparência de todos os atores é um pré-requisito para qualquer análise, relatório com ressalvas ou investimento sustentável. A transparência começa com a descoberta das entidades envolvidas numa transação. Hoje, os algoritmos de IA são aplicados para responder à pergunta básica “Com quem estou fazendo negócios?” Isso desperdiça recursos computacionais e apenas aumenta o erro associado aos objetivos posteriores, como a análise de risco. A evolução das transações e dos ecossistemas digitais para utilizar o LEI e o vLEI, a fim de identificar e autenticar organizações, aumenta a confiança nos ecossistemas digitais e permite a aplicação valiosa de algoritmos de IA para identificar padrões suspeitos e avaliar riscos.
Identificar e compreender a forma jurídica de uma entidade é crucial em muitos processos financeiros e comerciais. A forma e a estrutura jurídica das empresas podem informar como conduzir as transações de forma eficaz e servir como um indicador de risco. A vasta gama de formas jurídicas de entidades dentro de e entre diferentes jurisdições tornou a categorização e a estruturação eficaz dessas informações um desafio para as organizações. Essa tarefa se torna ainda mais difícil devido às semelhanças nos tipos e na representação textual dessas formas jurídicas entre jurisdições. Automatizar o processo de identificação da forma jurídica de uma entidade pode, portanto, reduzir o risco, criar transparência e aumentar a eficiência operacional, ao permitir capacidades de processamento direto (STP).
O Repositório de LEIs fornece dados de entidades jurídicas de código aberto, padronizados e de alta qualidade. Esses são pré-requisitos para qualquer bom projeto de análise de dados ou modelo de IA. A moeda do Repositório de LEIs é protegida, ao ser atualizada três vezes ao dia. Confiar em normas globais não garante apenas uniformidade. Fazer isso aumenta a qualidade dos dados e oferece um conjunto de dados rotulados pronto para uso para o desenvolvimento de modelos de Aprendizagem de Máquina (ML) e IA.
Entendimento de Nome da Entidade Jurídica (LENU)
A GLEIF colaborou com o Sociovestix Labs para criar uma ferramenta de aprendizagem de máquina que reconhece a forma jurídica específica de uma entidade e automatiza a atribuição de código correspondente à Forma Jurídica da Entidade (ELF). A “Lista de Códigos de Formas Jurídicas de Entidades” é baseada na norma ISO 20275 “Serviços Financeiros - Formas Jurídicas de Entidades” e atribui um código alfanumérico exclusivo de quatro caracteres para cada forma jurídica de entidade. A forma jurídica de uma entidade é crucial ao verificar e rastrear uma identidade organizacional. Contudo, a ampla variedade de formas jurídicas de entidades que existem no âmbito das jurisdições e entre elas tem tornado difícil para que organizações de grande porte capturem formas jurídicas como dados estruturados. A ferramenta, treinada no banco de dados de mais de dois milhões de registros do Identificador de Entidade Jurídica (LEI) da GLEIF, permite que bancos, sociedades de investimento, grandes empresas, governos e outras organizações de grande porte analisem de maneira retrospectiva seus dados mestre, extraiam a forma jurídica do texto não estruturado da razão social e apliquem de maneira uniforme um código ELF para cada tipo de entidade, em conformidade com a norma ISO 20275.
A ferramenta, conhecida como Entendimento de Nome da Entidade Jurídica (LENU), oferece uma série de benefícios tanto para a organização quanto para o mercado global mais amplo. Eles incluem:
- Automatizar a padronização de dados não estruturados (forma jurídica da entidade como parte do nome da organização), promovendo maior qualidade de dados.
- Superar problemas de classificação de dados de forma jurídica decorrentes, por exemplo, de variações linguísticas e inconsistências de abreviaturas e promover maior conhecimento e transparência no mercado global.
- Apresentar a forma jurídica de uma entidade em formato legível por máquina, que pode ser utilizado por ferramentas de IA e em outros processos e aplicações empresariais digitalizados.
- Ignorar os riscos e as limitações associados ao envolvimento manual com dados, incluindo tempo, ineficiência, erro humano e altos custos administrativos.
Ao criar conjuntos de dados mais completos com categorização melhorada de entidades jurídicas, a ferramenta promove maior conhecimento e transparência no mercado global. Funciona com o LEI para criar um conjunto de dados globalmente uniforme.
O LENU é uma biblioteca Python de código aberto acessível no Git Hub. O LENU usa os dados LEI para desenvolver modelos específicos de jurisdição e permite que o usuário obtenha uma sugestão para uma forma jurídica de qualquer razão social. A GLEIF instituiu um ciclo de qualidade de dados no qual a forma jurídica sugerida pela ferramenta é comparada com o código ELF nos dados LEI atuais. No caso de discrepâncias claras entre os resultados do modelo e os dados LEI atuais, a GLEIF cria contestações de dados, que são enviadas para emissores de LEIs para verificação exata e atualização dos registros de dados, onde necessário. Os dados atualizados são então usados para desenvolver a próxima versão dos modelos com uma fonte de dados aprimorada que, em última análise, impulsiona o desempenho do modelo.
O LENU utiliza arquitetura de modelo de transformador e modelos básicos de BERT para processar vários idiomas e jurisdições. Os modelos também estão disponíveis e prontos para uso no Hugging Face, onde o usuário encontrará modelos específicos de jurisdição adaptados para detecção de formas jurídicas.
A GLEIF, a Universidade de St. Gallen e a Sociovestix Labs resumiram suas descobertas em um artigo de pesquisa científica, “Classificação da Forma de Entidade Jurídica baseada em Transformador”. O estudo destaca o potencial significativo dos modelos baseados em Transformador no avanço da padronização e integração de dados. A introdução da forma jurídica da entidade por meio de itens de dados padronizados acrescenta mais confiança às tarefas de ligação de entidades, permitindo pares de mapeamento robustos em vários conjuntos de dados, uma vez que cada entidade só pode ter uma forma jurídica.
Acreditamos que a adoção mais ampla do padrão de código ELF aumentará significativamente a transparência, ao mesmo tempo em que melhorará as tarefas de integração de dados em vários domínios. Ao tornar a nossa biblioteca de código aberto acessível gratuitamente ao público, queremos facilitar a adoção de códigos ELF por entidades em todo o mundo. Convidamos todas as partes interessadas a utilizá-lo para classificação da forma jurídica da entidade.