Sztuczna inteligencja (AI) w służbie systemu LEI
Cyfryzacja i globalizacja gospodarki sprawiają, że weryfikacja tożsamości przez firmy i urzędy nabiera coraz większego znaczenia, a jednocześnie coraz trudniej jest zapewnić rzetelność tych procesów. Transparentność wszystkich uczestników rynku jest warunkiem wstępnym każdej zrównoważonej inwestycji, odpowiedniej sprawozdawczości czy analiz. Przejrzystość rozpoczyna się od ustalenia tożsamości podmiotów uczestniczących w danej transakcji. Obecnie algorytmy oparte na sztucznej inteligencji są wykorzystywane do udzielania odpowiedzi na zasadnicze pytanie „Z kim robię interesy?”. Wymaga to angażowania znacznych zasobów obliczeniowych oraz dodatkowo potęguje margines błędu na dalszych etapach procesu, takich jak analiza ryzyka. Rozwój cyfrowych ekosystemów i realizowanych za ich pomocą transakcji w kierunku wykorzystywania identyfikatorów LEI i vLEI do identyfikowania i uwierzytelniania uczestniczących stron zwiększy zaufanie wobec tych środowisk oraz pozwoli używać algorytmów AI do zadań o większej wartości dodanej, takich jak wykrywanie podejrzanych wzorców czy ocena ryzyka.
Rozpoznawanie formy prawnej podmiotów ma kluczowe znaczenie w wielu procesach biznesowych i finansowych. Forma prawna i struktura przedsiębiorstwa może podpowiadać, jak skutecznie przeprowadzać transakcje i jak dużym ryzykiem jest obarczona współpraca z danym podmiotem. Duża różnorodność form prawnych podmiotów w zależności od kraju i regionu utrudnia kontrahentom skuteczne porządkowanie i systematyzowanie tych informacji. Dodatkowy kłopot sprawia pozorne podobieństwo cech i nazewnictwa form, w związku z czym łatwo o pomyłkę i błędną interpretację. Automatyzacja procesu identyfikowania formy prawnej podmiotu pozwoli wprowadzić bezpośrednie przetwarzanie danych (STP), co obniży ryzyko, wzmocni przejrzystość i usprawni wykonywanie wszystkich operacji.
Repozytorium LEI zawiera sprawdzone, ujednolicone dane podmiotów prawnych dostępne w otwartym formacie. Są one nieodzowne w każdym porządnym projekcie analizowania danych czy modelu sztucznej inteligencji. Aktualność repozytorium LEI jest gwarantowana poprzez aktualizowanie go trzy razy dziennie. Bazowanie na międzynarodowych standardach nie tylko gwarantuje spójność. Poprawia także jakość danych oraz umożliwia korzystanie z gotowego zbioru oznaczonych informacji nadających się do trenowania modeli uczenia maszynowego (ML) i sztucznej inteligencji.
Biblioteka Legal Entity Name Understanding (LENU)
Fundusz GLEIF przy współpracy z firmą Sociovestix Labs zbudowała narzędzie uczenia maszynowego, które rozpoznaje formę prawną konkretnego podmiotu i automatyzuje przypisanie mu odpowiedniego kodu formy prawnej podmiotu (ELF). „Lista kodów form prawnych podmiotów (ELF)” opiera się na normie ISO 20275 „Usługi finansowe – formy prawne podmiotów (ELF)” i przypisuje każdej formie prawnej podmiotu unikalny kod alfanumeryczny składający się z czterech znaków. Forma prawna podmiotu ma kluczowe znaczenie podczas weryfikowania i badania tożsamości organizacji. Jednak duża różnorodność form prawnych podmiotów, które funkcjonują w poszczególnych krajach, utrudnia dużym organizacjom zaprotokołowanie formy prawnej w postaci ustrukturyzowanych danych. Nowe narzędzie, wykorzystujące bazę danych identyfikatorów podmiotów prawnych GLEIF zawierającą ponad dwa miliony rekordów, pozwala bankom, firmom inwestycyjnym, korporacjom, jednostkom rządowym i innym dużym organizacjom na retrospektywną analizę ich podstawowych danych, wyodrębnienie formy prawnej z niestrukturyzowanego tekstu nazwy prawnej i jednolite zastosowanie kodu ELF do każdego typu podmiotu zgodnie z normą ISO 20275.
Narzędzie to, znane pod nazwą Legal Entity Name Understanding (LENU), przynosi szereg korzyści zainteresowanej organizacji, ale także w kontekście całego globalnego rynku. Należą do nich:
- Automatyzacja ujednolicania nieusystematyzowanych danych (forma prawna podmiotu jako składnik nazwy organizacji), co podnosi jakość danych.
- Przezwyciężanie problemów z klasyfikowaniem informacji o formie prawnej, wynikających na przykład z różnic językowych czy niespójności w używaniu skrótów, oraz zapewnienie lepszego wglądu w globalny rynek i zwiększanie jego przejrzystości.
- Przedstawianie formy prawnej podmiotu w postaci nadającej się do odczytu maszynowego, którą mogą wykorzystywać narzędzia sztucznej inteligencji oraz inne cyfrowe procesy i aplikacje biznesowe.
- Uniknięcie zagrożeń i ograniczeń towarzyszących ręcznemu przetwarzaniu danych, takich jak czasochłonność, nieefektywność, błędy ludzkie i wysokie koszty administracyjne.
Tworząc kompletniejsze zbiory danych z lepszym klasyfikowaniem podmiotów prawnych, narzędzie lepiej pokazuje obraz globalnego rynku i zwiększa jego przejrzystość. Wykorzystując system identyfikatorów LEI, generuje dane spójne w skali całego świata.
LENU to biblioteka open source języka Python dostępna w serwisie Git Hub. Na podstawie danych LEI LENU tworzy modele odpowiednie dla konkretnych jurysdykcji i proponuje formę prawną dla dowolnej nazwy prawnej. Pętla jakości danych GLEIF porównuje tę sugerowaną formę prawną z kodem ELF w aktualnych danych LEI. Jeżeli wystąpią wyraźne rozbieżności między wynikami wyświetlanymi przez model a aktualnymi danymi LEI, w razie potrzeby GLEIF wysyła zastrzeżenia dotyczące danych do podmiotów nadających LEI w celu dokładnej weryfikacji i aktualizacji rekordów. Na podstawie takich uaktualnionych danych powstają kolejne wersje modeli, a ich wydajność i niezawodność ciągle się poprawia.
Wykorzystując architekturę z modelem transformerowym i modele bazowe BERT, biblioteka jest w stanie przetwarzać treści dla różnych języków i krajów/regionów. Modele są również dostępne i gotowe do użytku w serwisie Hugging Face, gdzie użytkownicy znajdą modele przystosowane do rozpoznawania formy prawnej w konkretnych krajach i regionach.
GLEIF, Uniwersytet St. Gallen i Sociovestix Labs podsumowali efekty swoich badań w opracowaniu naukowym zatytułowanym „Klasyfikowanie form podmiotów prawnych za pomocą transformera”. Podkreślają w nich duży potencjał wykorzystania modeli transformerowych do ujednolicania i integrowania danych. Wprowadzanie formy prawnej podmiotu za pomocą standardowych elementów danych zwiększa niezawodność w operacjach kojarzenia z podmiotem, co pozwala tworzyć wiarygodne pary powiązań wśród wielu zbiorów danych, ponieważ każdy podmiot może mieć tylko jedną formę prawną.
LENU Git Hub Repository
Hugging Face Models
Lista kodów form prawnych podmiotów (ELF)
Scientific Research Paper
Uważamy, że szersze upowszechnienie standardu kodów ELF istotnie zwiększy przejrzystość oraz usprawni integrowanie danych w różnych dziedzinach. Udostępniając publicznie naszą bibliotekę open source, chcemy ułatwić stosowanie kodów ELF użytkownikom na całym świecie. Zachęcamy wszystkie zainteresowane strony do używania tych kodów w klasyfikowaniu form prawnych podmiotów.