La inteligencia artificial (IA) se une al LEI
La economía digital y globalizada hace que la verificación de la identidad por parte de empresas y autoridades sea más importante, pero también más difícil de realizar con precisión. La transparencia de todas las partes implicadas es un requisito para cualquier inversión sostenible, informe cualificado o análisis. La transparencia comienza con el descubrimiento de las entidades involucradas en una transacción. Hoy en día, se aplican algoritmos de IA para responder a la pregunta básica «¿con quién estoy haciendo negocios?». Proceder de este modo desperdicia recursos informáticos y solo aumenta el error asociado con objetivos posteriores como el análisis de riesgos. La evolución de las transacciones y los ecosistemas digitales para utilizar el LEI y el vLEI para identificar y autenticar organizaciones mejora la confianza en los ecosistemas digitales y permite la valiosa aplicación de algoritmos de IA para identificar patrones sospechosos y evaluar riesgos.
Identificar y comprender la forma jurídica de una entidad es crucial en muchos procesos financieros y relacionados con los negocios. La forma y la estructura jurídicas de las corporaciones pueden informar sobre cómo realizar transacciones de manera efectiva y servir como indicador de riesgo. La enorme diversidad de formas jurídicas de las entidades en las jurisdicciones y entre ellas ha dificultado que las organizaciones categoricen y estructuren esta información de manera efectiva. Esta tarea se vuelve aún más difícil debido a las similitudes en los tipos y la representación textual de estas formas jurídicas en todas las jurisdicciones. Por tanto, automatizar el proceso de identificación de la forma jurídica de una entidad puede reducir el riesgo, crear transparencia y aumentar la eficiencia operativa al permitir capacidades de procesamiento directo.
El Repositorio de LEI proporciona datos de entidades legales de código abierto, normalizados y de alta calidad. Se trata de requisitos previos para cualquier buen proyecto de análisis de datos o un modelo de IA adecuado. La moneda del Repositorio de LEI se protege actualizándola tres veces al día. Confiar en estándares globales no solo asegura la coherencia, sino que también aumenta la calidad de los datos y ofrece un conjunto de datos etiquetados listos para usar con el fin de desarrollar modelos de aprendizaje automático e IA.
Legal Entity Name Understanding (LENU)
La GLEIF ha colaborado con Sociovestix Labs para crear una herramienta de aprendizaje automático que reconoce la forma jurídica específica y automatiza la asignación de su código de forma jurídica de entidad (ELF). La «Lista de Códigos de Formas Jurídicas» se basa en la norma ISO 20275 «Servicios financieros - Formas de Personas Jurídicas» y asigna un código alfanumérico único de cuatro caracteres a cada forma de persona jurídica. La forma jurídica de una entidad es crucial a la hora de verificar y controlar la identidad de una organización. Sin embargo, la gran variedad de formas jurídicas de las entidades que existen dentro de las jurisdicciones y entre ellas ha dificultado a las grandes organizaciones captar las formas jurídicas como datos estructurados. La herramienta, formada sobre la base de datos del Identificador de Entidad Legal (LEI) de la GLEIF, con más de dos millones de registros, permite a bancos, empresas de inversión, corporaciones, gobiernos y otras grandes organizaciones analizar retrospectivamente sus datos maestros, extraer la forma jurídica del texto no estructurado del nombre legal y aplicar uniformemente un código ELF a cada tipo de entidad, de acuerdo con la norma ISO 20275.
La herramienta, conocida como Legal Entity Name Understanding (LENU), ofrece diversas ventajas tanto para la organización como para el mercado global en general. Entre ellas, se incluyen las siguientes:
- Automatiza la normalización de datos no estructurados —forma jurídica de la entidad como parte del nombre de la organización—, fomentando una mayor calidad de los datos.
- Supera los problemas de clasificación de los datos de la forma legal derivados, por ejemplo, de variaciones del idioma e incoherencias en las abreviaturas, y promueve mayores comprensión y transparencia en el mercado global.
- Presenta la forma jurídica de una entidad en un formato legible por máquina, que pueden utilizar herramientas de IA y demás procesos y aplicaciones comerciales digitalizados.
- Evita los riesgos y las limitaciones asociados con la interacción manual con los datos, incluidos el tiempo, la ineficiencia, los errores humanos y los altos costes administrativos.
Al crear conjuntos de datos más completos con una categorización mejorada de las entidades legales, la herramienta promueve mayores comprensión y transparencia en el mercado global. Funciona con el LEI para crear un conjunto de datos coherente a escala mundial.
LENU es una biblioteca Python de código abierto accesible en Git Hub. LENU utiliza los datos de LEI para crear modelos específicos de cada jurisdicción y permite al usuario obtener una sugerencia de forma jurídica para cualquier nombre jurídico dado. La GLEIF ha establecido un bucle de calidad de los datos en que la forma jurídica sugerida por la herramienta se compara con el código ELF en los datos de LEI actuales. En caso de que existan claras discrepancias entre los resultados del modelo y los datos de LEI actuales, la GLEIF formula impugnaciones de datos que se envían a los emisores de LEI para que puedan realizar una verificación exacta y actualizar los registros de datos, si fuera necesario. A continuación, los datos actualizados se utilizan para crear la siguiente versión de los modelos con una fuente de datos mejorada que, en última instancia, aumenta el rendimiento del modelo.
LENU utiliza una arquitectura de modelo de transformador y modelos base BERT para procesar varios idiomas y jurisdicciones. Los modelos también están disponibles y listos para usar en Hugging Face, donde el usuario encontrará modelos específicos de cada jurisdicción diseñados para la detección de formas legales.
La GLEIF, la Universidad de St. Gallen y Sociovestix Labs resumen sus conclusiones en un artículo de investigación científica, «Clasificación de la forma jurídica de las entidades según el modelo transformador». El estudio destaca el significativo potencial de los modelos basados en transformador para avanzar en la normalización y la integración de datos. La introducción de la forma jurídica de la entidad a través de elementos de datos normalizados aumenta la confianza en las tareas de vinculación de entidades, lo que permite pares de asignación sólidos en múltiples conjuntos de datos, pues cada entidad solo puede tener una forma legal.
LENU Git Hub Repository
Hugging Face Models
Lista de códigos de formas jurídicas
Scientific Research Paper
Creemos que una adopción más amplia del estándar del código ELF mejorará significativamente la transparencia y al mismo tiempo mejorará las tareas de integración de datos en diversos ámbitos. Al hacer que nuestra biblioteca de código abierto sea de libre acceso para el público, queremos facilitar la adopción de códigos ELF por parte de entidades de todo el mundo. Invitamos a todas las partes interesadas a utilizarlo para la clasificación de la forma jurídica de las entidades.