Intelligence artificielle (IA) et LEI
Dans une économie numérique et mondialisée, la vérification des identités est d'autant plus cruciale mais aussi difficile pour les entreprises et les pouvoirs publics. La transparence de toutes les parties prenantes est une condition sine qua non pour tout investissement durable, déclaration conforme ou analyse. La transparence implique d'abord l'identification des entités impliquées dans une transaction. Aujourd’hui, les algorithmes d’IA servent à répondre à la question fondamentale « Avec qui je fais affaire ? ». Cela entraîne le gaspillage des ressources informatiques et aggrave les erreurs associées aux objectifs en aval comme l’analyse des risques. L'évolution des transactions et des écosystèmes numériques vers l'utilisation de LEI et de vLEI afin d'identifier et d'authentifier les organisations renforce la confiance dans les écosystèmes numériques et assure l'application d'algorithmes d'IA pour identifier les modèles suspects et évaluer les risques.
De nombreux processus financiers et commerciaux exigent l'identification et la compréhension de la forme juridique d'une entité. La forme et la structure juridiques des sociétés peuvent guider le mode de gestion efficace des transactions et servir d'indicateur de risque. En raison du large éventail de formes juridiques des entités, au sein et entre les différentes juridictions, les organisations éprouvent des difficultés à classer et structurer correctement ces informations. Cette tâche devient encore plus ardue en raison des similitudes dans les types et la représentation textuelle de ces formes juridiques dans toutes les juridictions. L'automatisation du processus d'identification de la forme juridique d'une entité peut donc réduire les risques, ajouter de la transparence et accroître l'efficacité opérationnelle en instaurant des capacités de traitement direct (STP).
Le référentiel LEI fournit des données sur les entités légales de qualité, normalisées et open source. Ces conditions préalables doivent accompagner tout projet d’analyse de données ou modèle d’IA. La sécurité de la devise du référentiel LEI passe par son actualisation trois fois par jour. Le respect de normes mondiales garantit bien plus que la cohérence. Il améliore la qualité des données et réunit un ensemble de données considérées comme prêtes à l'emploi pour développer des modèles d'apprentissage automatique (ML) et d'IA.
Compréhension du nom de l'entité légale (LENU)
En collaboration avec Sociovestix Labs, la GLEIF a mis au point un outil d'apprentissage automatique capable de reconnaitre la forme juridique d'une entité et automatise l'attribution du code de catégorie juridique (ELF) correspondant. La « Liste de codes des catégories juridiques », fondée sur la norme ISO 20275 « Services financiers - Formes juridiques des entités (ELF) », attribue à chaque forme juridique d’entité un code alphanumérique unique de 4 caractères. La forme juridique d'une entité est un élément clé de la vérification et du filtrage des identités des organisations. Cependant, la grande variété de formes juridiques d'entités au sein des juridictions, et entre elles, a compliqué la saisie d'une forme juridique sous forme de données structurées pour les grandes organisations. Le nouvel outil, formé à partir de la base de données composée de plus de deux millions d'identifiants d'entité légale (LEI) de la GLEIF, permettra aux banques, aux sociétés d'investissement, aux entreprises, aux gouvernements et autres grandes organisations d'analyser rétrospectivement leurs données de référence, d'extraire la forme juridique du texte non structuré de la dénomination légale et appliquer uniformément un code ELF à chaque type d'entité, selon la norme ISO 20275.
L'outil, connu sous le nom de Legal Entity Name Understanding (LENU), présente plusieurs avantages à l'organisation et au marché mondial dans son ensemble. Il s’agit notamment des sujets suivants:
- Automatiser la normalisation des données non structurées (forme juridique d'entité faisant partie du nom de l'organisation), favorisant une meilleure qualité des données.
- Surmonter les problèmes de classification des données de forme juridique provenant, par exemple, des différences linguistiques et des incohérences des abréviations et promouvoir une meilleure compréhension et transparence du marché mondial.
- Présenter la forme juridique d'une entité dans un format lisible par machine, utilisable par les outils d'IA et dans d'autres processus et applications métiers numérisés.
- Surmonter les risques et les limites associés à l'utilisation manuelle des données, notamment le temps, les inefficacités, les erreurs humaines et les coûts administratifs élevés.
En créant des ensembles de données plus riches dans un classement amélioré des entités légales, l'outil favorise une meilleure compréhension et une plus grande transparence du marché mondial. Associé au LEI, il crée un ensemble de données globalement cohérent.
LENU est une bibliothèque Python open source accessible sur Git Hub. LENU utilise les données des LEI pour mettre au point des modèles spécifiques à la juridiction et permet à l'utilisateur d'obtenir une suggestion de forme juridique pour une raison sociale donnée. La GLEIF a créé une boucle de qualité des données dans laquelle la forme juridique suggérée par l'outil est comparée au code ELF dans les données LEI actuelles. En cas de divergences évidentes entre les résultats du modèle et les données LEI actuelles, la GLEIF crée des contestations de données qui sont envoyées aux émetteurs de LEI pour effectuer une vérification exacte et mettre à jour les données. Les données mises à jour sont ensuite utilisées pour développer la nouvelle version des modèles avec une source de données améliorée qui optimise les performances du modèle.
LENU s'appuie sur une architecture de modèle de transformateur et des modèles de base BERT pour traiter diverses langues et juridictions. Les modèles sont également disponibles et prêts à être utilisés sur Hugging Face, où l'utilisateur trouvera des modèles propres à chaque juridiction et adaptés à la détection des formes juridiques.
La GLEIF, l'Université de Saint-Gall et Sociovestix Labs ont synthétisé leurs conclusions dans un document de recherche scientifique intitulé « Classement des formes juridiques des entités fondées sur un transformateur ». L'étude met en évidence l'énorme potentiel des modèles fondés sur Transformer afin de faire évoluer la normalisation et l'intégration des données. L'introduction de la forme juridique d'une entité par des éléments de données normalisés renforce la confiance dans les tâches de liaison d'entités, assurant de solides paires de correspondance sur plusieurs ensembles de données, car chaque entité ne peut avoir qu'une seule forme juridique.
LENU Git Hub Repository
Hugging Face Models
Liste de codes des catégories juridiques d'entités
Scientific Research Paper
Nous pensons qu'une adoption élargie de la norme de code ELF renforcera considérablement la transparence et les tâches d'intégration de données dans divers domaines. En rendant notre bibliothèque open source accessible au public, nous souhaitons faciliter l'adoption mondiale des codes ELF par les entités. Nous invitons toutes les parties prenantes à l'utiliser pour la classification des formes juridiques des entités.