A qualidade dos dados requer ações proativas
Gestão proativa
Para apoiar as organizações emissoras de LEI, a GLEIF fornece os processos apropriados e obrigatórios juntamente com uma interface técnica para possibilitar que os emissores de LEI avaliem proativamente a qualidade dos dados de um LEI e os dados de referência relacionados. Isso inclui uma dedicada verificação de registros duplicados. Os registros de LEI precisam ser verificados um de cada vez usando as APIs de serviço Web automatizadas: Pré-verificação de governança de dados e Verificação de registros duplicados.
Pré-verificação de governança de dados
Os emissores de LEI são obrigados a enviar todos os registros de LEI atualizados e recém-criados para o instrumento de pré-verificação da GLEIF antes de carregá-los no repositório global. O instrumento de pré-verificação aplica as mesmas Verificações de Qualidade de Dados que também são executadas diariamente para registros de LEI já publicados. Com base nos resultados da pré-verificação, os emissores de LEI podem corrigir problemas potenciais de qualidade de dados antes que essas inconsistências entrem no conjunto de dados públicos. Além de verificar o resultado, o solicitador também recebe uma explicação que facilita uma correção direcionada e rápida do problema informado.
O uso obrigatório do instrumento pelas organizações emissoras de LEI apoia o processo de aprimoramento global contínuo, elevando o nível da qualidade e aumentando o nível de maturidade dos dados no Global LEI System.
Verificação de registros duplicados
Para evitar registros de dados duplicados, códigos de LEI recém-solicitados e dados de referência correspondentes são comparados a todos os outros registros no Repositório de LEIs Global bem como aos registros de LEI que foram enviados ao instrumento de verificação de registros duplicados por outros emissores de LEI, mas que ainda não foram emitidos. Portanto, mesmo que dois emissores de LEI separados tenham sido abordados pela mesma entidade jurídica, os emissores de LEI identificarão potenciais duplicidades e estarão aptos a fazer a coordenação entre eles e com seus clientes. Em última análise, esse procedimento evita a introdução de duplicidades no sistema.
O processo de identificar duplicidades considera vários elementos de ados do registro de LEI e pode ser dividido em pré-processamento, algoritmo central e pós-processamento.
Durante o pré-processamento, os dados são preparados para as etapas seguintes como, por exemplo, os chamados tokens fracos são identificados e solucionados. Um exemplo típico de token fraco é a forma jurídica da entidade jurídica que pode ser parte do nome da entidade jurídica. As formas jurídicas podem então ser normalizadas e harmonizadas para garantir os melhores resultados possíveis nos estágios seguintes do processo.
O mecanismo central do instrumento de verificação de registros duplicados consistem em uma verificação de singularidade e exclusividade, combinando algoritmos estado da arte para a correspondência aproximada de cadeias (por exemplo, distância Levenshtein, similaridade por cosseno, distância Monge-Elkan).
Na etapa de pós-processamento, o instrumento de verificação de registros duplicados reduz o número de falsos positivos com base em verificações adicionais e tratamento especial de elementos de dados secundários (por exemplo, jurisdição legal, categoria da entidade).
Arquivos Relevantes para Download
Baixar em PDF: Dicionário de Verificação de Registros Duplicados v1.2 (Check for Duplicates Dictionary v1.2)