Künstliche Intelligenz (KI) trifft auf den LEI
In der digitalen und globalisierten Wirtschaft wird die Identitätsüberprüfung durch Unternehmen und Behörden immer wichtiger und auch schwieriger zu bewerkstelligen. Die Transparenz aller Akteure ist eine Voraussetzung für jede nachhaltige Investition, qualifizierte Berichterstattung oder Analyse. Transparenz beginnt mit der Identifizierung der an einer Transaktion beteiligten Parteien. Heutzutage werden KI-Algorithmen eingesetzt, um die grundlegende Frage „Mit wem mache ich Geschäfte?“ zu beantworten. Dies verschwendet Rechenressourcen und erhöht lediglich die Fehleranfälligkeit, die mit nachgelagerten Zielen wie der Risikoanalyse einhergeht. Die Weiterentwicklung digitaler Transaktionen und Ökosysteme, um auch den LEI und vLEI bei der Identifizierung und Authentifizierung von Organisationen zum Einsatz zu bringen, stärkt das Vertrauen in digitale Ökosysteme und ermöglicht eine wertbringende Verwendung von KI-Algorithmen zur Identifizierung verdächtiger Muster und zur Einschätzung von Risiken.
In vielen finanziellen und geschäftsbezogenen Prozessen ist es von ausschlaggebender Bedeutung, die Rechtsform eines Unternehmens zu identifizieren und verstehen. Die Rechtsform und Struktur von Unternehmen können Aufschluss darüber geben, wie Transaktionen auf effektive Weise durchgeführt werden können, und außerdem als Risikoindikator dienen. Die große Vielfalt an Rechtsformen von Unternehmen innerhalb und zwischen den verschiedenen Rechtsräumen erschwert es Organisationen, diese Informationen auf effektive Weise zu kategorisieren und zu strukturieren. Diese Aufgabe wird aufgrund der Ähnlichkeiten in der Art und Textdarstellung dieser Rechtsformen in den verschiedenen Rechtsräumen zusätzlich erschwert. Eine Automatisierung des Prozesses, mit dem die Rechtsform eines Unternehmens identifiziert wird, kann daher das Risiko senken, Transparenz schaffen und die betriebliche Effizienz steigern, indem Straight-Through-Processing-Funktionen (STP) ermöglicht werden.
Das LEI Repository stellt hochwertige, standardisierte Open-Source-Daten zu Rechtsträgern zur Verfügung. Dies sind Grundvoraussetzungen für jedes gute Datenanalyseprojekt oder KI-Modell. Die Aktualität des LEI Repository wird dadurch sichergestellt, dass es dreimal täglich auf den neuesten Stand gebracht wird. Die Einbeziehung globaler Standards bietet nicht nur Konsistenz. Sie sorgt auch für mehr Datenqualität und bietet einen gebrauchsfertigen, gekennzeichneten Datensatz, um Modelle für maschinelles Lernen (ML) und KI zu entwickeln.
Legal Entity Name Understanding (LENU)
GLEIF hat in Zusammenarbeit mit Sociovestix Labs ein maschinelles Lerninstrument entwickelt, das die spezifische Rechtsform eines Unternehmens erkennt und die entsprechende Zuweisung des Entity Legal Form (ELF)-Codes automatisiert. Die Code-Liste für Rechtsformen basiert auf der Norm ISO 20275 „Finanzdienstleistungen – Rechtsformen von Entitäten (ELF)“ und weist jeder Rechtsform eines Unternehmens einen eindeutigen alphanumerischen Code bestehend aus vier Zeichen zu. Die Rechtsform eines Unternehmens ist bei der Überprüfung und Bestätigung der organisatorischen Identität von entscheidender Bedeutung. Aufgrund der großen Vielfalt an Rechtsformen innerhalb und zwischen den verschiedenen Rechtsräumen von Unternehmen ist es für große Organisationen jedoch schwierig, Rechtsformen in Form von strukturierten Daten zu erfassen. Das auf der Legal Entity Identifier (LEI)-Datenbank von GLEIF mit über zwei Millionen Datensätzen basierende Tool ermöglicht es Banken, Wertpapierfirmen, Unternehmen, Regierungen und anderen großen Organisationen, ihre Stammdaten nachträglich zu analysieren, die Rechtsform aus dem unstrukturierten Text des juristischen Namens zu extrahieren und jedem Unternehmenstyp einheitlich einen ELF-Code gemäß der Norm ISO 20275 zuzuweisen.
Das als Legal Entity Name Understanding (LENU) bekannte Tool bietet eine Reihe von Vorteilen sowohl auf Ebene der Organisationen als auch für den breiteren globalen Markt. Dazu zählen:
- Automatisierung der Standardisierung unstrukturierter Daten (Rechtsform des Unternehmens als Teil des Namens der Organisation) zur Förderung einer höheren Datenqualität.
- Überwindung von Problemen bei der Klassifizierung von Rechtsformdaten, die zum Beispiel auf sprachliche Variationen und Abkürzungsinkonsistenzen zurückzuführen sind, und Förderung von vermehrten Einblicken und Transparenz bezogen auf den globalen Markt.
- Darstellung der Rechtsform eines Unternehmens in einem maschinenlesbaren Format, das von KI-Tools und in anderen digitalisierten Geschäftsprozessen und Anwendungen genutzt werden kann.
- Umgehen der Risiken und Einschränkungen, die mit der manuellen Bearbeitung von Daten verbunden sind, einschließlich Zeitaufwand, Ineffizienz, menschliches Versagen und hohe Verwaltungskosten.
Durch die Erstellung umfangreicherer Datensätze mit verbesserter Rechtsträgerkategorisierung erhöht das Tool die Einblicke und Transparenz bezogen auf den globalen Markt. Es arbeitet mit dem LEI zusammen, um einen weltweit konsistenten Datensatz zu erstellen.
LENU ist eine Open-Source-Python-Bibliothek, auf die über Git Hub zugegriffen werden kann. LENU verwendet die LEI-Daten, um rechtsgebietsspezifische Modelle zu erstellen, und ermöglicht es dem Nutzer, einen Vorschlag für eine Rechtsform für einen beliebigen juristischen Namen zu erhalten. GLEIF hat eine Datenqualitätsschleife eingerichtet, in der die vom Modell vorgeschlagene Rechtsform mit dem ELF-Code in den aktuellen LEI-Daten abgeglichen wird. Bei eindeutigen Diskrepanzen zwischen den Ergebnissen des Modells und den aktuellen LEI-Daten führt GLEIF eine Datenanfechtung durch, die an die LEI-Vergabestellen zur genauen Überprüfung und ggf. Aktualisierung der Datensätze gesendet wird. Die aktualisierten Daten werden anschließend verwendet, um die nächste Modellversion mit einer dann verbesserten Datenquelle zu erstellen, was letztendlich die Leistung des Modells steigert.
LENU nutzt die Transformer-Modell-Architektur und BERT-Basismodelle zur Verarbeitung der verschiedenen Sprachen und Rechtsräume. Die Modelle sind auch auf Hugging Face verfügbar und einsatzbereit, wo Nutzer rechtsraumspezifische Modelle zur Erkennung von Rechtsformen finden.
GLEIF, die Universität St. Gallen und Sociovestix Labs haben ihre Ergebnisse in einem wissenschaftlichen Forschungspapier mit dem Titel „Transformatorbasierte Klassifizierung der Rechtsform von Entitäten“ zusammengefasst. Die Studie unterstreicht das beträchtliche Potenzial transformatorbasierter Modelle, um die Datenstandardisierung und Datenintegration weiter voranzutreiben. Die Integration der Rechtsform von Unternehmen über standardisierte Datenelemente erhöht die Sicherheit bei der Verknüpfung von Unternehmen und ermöglicht robuste Zuordnungspaare über mehrere Datensätze hinweg, da jedes Unternehmen nur eine Rechtsform haben kann.
LENU Git Hub Repository
Hugging Face Models
Code-Liste für Rechtsformen
Scientific Research Paper
Wir glauben, dass eine breitere Einführung des ELF-Codestandards für erheblich mehr Transparenz und zugleich für bessere Ergebnisse bei Datenintegrationsaufgaben in verschiedenen Bereichen sorgen wird. Wir möchten die Übernahme von ELF-Codes durch Unternehmen weltweit erleichtern, indem wir unsere Open-Source-Bibliothek der Öffentlichkeit frei zugänglich machen. Wir laden daher alle Beteiligten ein, sie bei der Klassifizierung der Rechtsform von Unternehmen zu verwenden.