Обеспечение качества данных требует заблаговременных действий
Проактивный контроль
Для содействия организациям, выдающим коды LEI, фонд GLEIF предлагает соответствующие и необходимые процессы вместе с техническим интерфейсом, с помощью которых эти организации могут заблаговременно оценивать качество данных кодов LEI и связанных справочных данных. Это включает в себя специальную проверку для выявления дублирующихся данных. Записи LEI будут проверяться по одной за раз с использованием следующих автоматических API-интерфейсов на основе веб-сервисов: Предварительная проверка управления данными и Проверка на дублирование.
Предварительная проверка управления данными
Организации, выдающие коды LEI, обязаны отправлять все новые и обновленные записи LEI для анализа с использованием функции предварительной проверки GLEIF перед загрузкой этих записей в глобальный репозиторий. Функция предварительной проверки использует те же самые проверки качества данных, которые также проводятся ежедневно для уже опубликованных записей LEI. На основании результатов предварительных проверок организации, выдающие коды LEI, могут устранить возможные проблемы с качеством данных до того, как эти несоответствия попадут в общедоступную базу данных. Вместе с результатами проверки запрашивающая сторона также получит пояснения, что упрощает целенаправленное и быстрое устранение выявленной проблемы.
Обязательное использование функции проверки организациями, выдающими коды LEI, обеспечивает процесс постоянного усовершенствования, повышая планку для уровня качества данных в Глобальной системе LEI.
Проверка на дублирование
Чтобы не допустить дублирования записей данных, новые запрошенные коды LEI и соответствующие справочные данные сопоставляются с другими записями в Глобальном репозитории LEI, а также с записями LEI, которые были предоставлены для анализа с использованием функции проверки на дублирование другими выдающими коды LEI организациями, но пока еще не были выданы. Таким образом, если одно и то же юридическое лицо обратится к двум разным организациям, выдающим коды LEI, эти организации выявят потенциальные дублирующиеся записи и смогут скоординировать свои действия с клиентами и одна с другой. В конечном счете эта процедура предотвращает добавление дублирующихся записей в систему.
Процесс выявления дублирующихся записей учитывает несколько элементов данных в записи LEI и может быть разделен на этапы предварительной обработки, основного вычисления и завершающей обработки.
Во время предварительной обработки данные подготавливаются к последующим этапам — например, выявляются и устраняются так называемые ненадежные маркеры. Типичным примером ненадежного маркера является организационно-правовая форма юридического лица, которая может быть частью имени этого лица. Затем организационно-правовые формы могут быть согласованы и стандартизированы для обеспечения наилучших результатов на следующих этапах процесса.
Основным элементом функции проверки на дублирование является проверка уникальности и исключительности, сочетающая в себе самые современные алгоритмы для неполного сопоставления строк (например, расстояние Левенштейна, косинусный коэффициент, расстояние Монжа-Элкана).
На этапе завершающей обработки функция проверки на дублирование исключает количество ложных результатов на основании дополнительных проверок и специального анализа второстепенных элементов данных (таких как правовая юрисдикция или категория юридического лица).
Связанные файлы для загрузки
Загрузить в формате PDF: Словарь проверки на дублирование (версия 1.2) (Check for Duplicates Dictionary v1.2)