Контролировать можно лишь то, что можно измерить
Проверки качества данных
В тесном сотрудничестве с Регулятивно-надзорным комитетом LEI (ROC) и выдающими коды LEI организациями фонд GLEIF определил ряд поддающихся измерению критериев качества, чтобы разъяснить концепцию качества данных применительно к базе данных LEI. С этой целью были использованы стандарты, разработанные Международной организацией по стандартизации. Внедрив набор определенных критериев качества, фонд GLEIF установил понятный и объективный стандарт для оценки уровня качества данных в Глобальной системе LEI.
Используемые фондом GLEIF проверки качества данных обеспечивают соответствие предоставленных справочных данных текущим правилам изменения состояния и проверки в Глобальной системе LEI. Эти проверки разработаны на основании форматов Файла общих данных (CDF).
Для каждой проверки качества данных указываются уровень качества, критерий качества, назначение и формальное описание, содержащее предварительное и конечное условие.
Этот набор проверок представляет так называемое Определение правил проверки качества. Каждая проверка проводится по формуле «Если X, тогда Y», в которой X — это предварительное условие проверки, а Y — конечное условие проверки. Если либо запись, либо информация о взаимозависимости или исключении не соответствует предварительному условию проверки, для этой проверки указывается «неприменимо». Если эта информация проходит предварительную проверку и переводится на этап конечной проверки, а полученное значение не соответствует условию Y, такая проверка получает статус «не пройдена»; в противном же случае ей присваивается статус «пройдена».
Определение правил GLEIF
- Назначение
Назначение указывается простым языком и содержит общее описание цели конкретной проверки качества данных. - Предварительное условие
Не каждая проверка качества данных может использоваться для всех записей LEI. Например, проверки качества данных применимы только для юридических лиц-подразделений или действующих юридических лиц. Предварительное условие каждой проверки позволяет отфильтровать те записи LEI, которые не соответствуют требованиям для отдельно взятой проверки. - Конечное условие
Для каждой проверки качества данных предусмотрены определенные четкие условия, при которых она не считается пройденной. Это условие применяется только к тем записям LEI, которые соответствуют предварительному условию для отдельно взятой проверки качества данных.
Категории проверок
Проверки качества данных также могут разделяться на категории в зависимости от их характера и типа измеряемых показателей. Например, при проведении метапроверок основное внимание уделяется таким критериям, как охватываемый период, актуальность и доступность, тогда как проверки формата в основном проводятся с использованием Единых форматов файлов данных и встроенной схемы XML. Проверки на уровне записей применяются к элементам в обязательных и дополнительных полях и включают в себя проверки формата и достоверности (например, диапазоны значений).
Модель уровня качества
Для определения общего качества данных в Глобальной системе LEI фонд GLEIF использует специальную модель, позволяющую оценить установленные критерии качества. В зависимости от типа проверок, относящихся к разным категориям, каждая проверка связывается с одним уровнем качества. Уровни качества «Отличный» и «Ожидаемый» могут быть достигнуты только в том случае, если полностью удовлетворены требования для всех более низких уровней качества.
1 - Необходимый:
Этот уровень качества отражает повторяемый успех и включает в себя следующее:
- Проверки формата
- Все проверки обязательных элементов
2 - Ожидаемый:
Этот уровень качества отражает контролируемый успех и включает в себя следующее:
- Проверки достоверности
- Общие проверки
- Проверки целостности взаимозависимости
- Все проверки необязательных элементов
3 - Отличный:
Третий уровень качества — это оптимизированный успех и включает в себя следующее:
- Проверки представительности
- Проверки охватываемого периода
- Все проверки жизненного цикла кода LEI и устаревших записей
Критерии качества данных
Внедрив набор определенных критериев качества, фонд GLEIF установил понятный и объективный стандарт для оценки уровня качества данных в Глобальной системе LEI.
Критерий качества | Определение |
---|---|
Точность | Степень, до которой в данных отсутствуют поддающиеся обнаружению ошибки; степень до которой элемент данных или набор данных соответствует данным, имеющимся в авторитетном источнике и считающимся верными; а также степень, в которой данные дают верное представление о предмете из реального мира |
Доступность | Степень, до которой можно просто и без нарушения закона получить элементы данных, обладающие надежными средствами защиты и контроля, предусмотренными в процессе |
Полнота | Мера наличия всех необходимых данных |
Всесторонний характер | Присутствуют все требуемые элементы данных; этот критерий гарантирует, что собран весь объем данных, а умышленные ограничения задокументированы |
Согласованность | Степень, до которой каждая уникальная часть данных сохраняет одно и то же значение в разных наборах данных |
Актуальность | Степень, до которой данные соответствуют действительности (значение данных является действительным, если оно актуально для определенного момента времени, и считается устаревшим, если оно было актуальным ранее, но не соответствует действительности в более позднее время) |
Целостность | Степень соответствия установленным правилам в отношении связи между данными (например, непротиворечивости ссылок на первичные или вторичные ключи) |
Происхождение | История или источник значения свойства |
Представительность | Характеристика качества данных, касающаяся формата, шаблона, удобочитаемости, а также пригодности данных для использования в намеченных целях |
Охватываемый период | Степень, до которой данные доступны, когда они необходимы, или концепция качества данных, что включает в себя информацию о том, являются ли данные обновленными и доступными в пределах соответствующих временных рамок; охватываемый период определяется целью и контекстом использования данных |
Уникальность | Характеристика элемента данных, все отдельные значения которого появляются только один раз |
Действительность | Мера того, насколько значение данных соответствует его области значений (то есть набору допустимых значений или диапазона значений) |
Связанные файлы для загрузки
- Загрузить в формате PDF: Определение правил проверки качества данных (версия 3.4) (Data Quality Rule Setting v3.4)
- Загрузить в формате XLS: Определение правил проверки качества данных (версия 3.4) (Data Quality Rule Setting v3.4)
- Загрузить в формате PDF: Правила изменения состояния и проверки (версия 2.8.3) (State Transition and Validation Rules v2.8.3)
Определение правил проверки качества данных GLEIF
Фонд GLEIF стремится обеспечить максимальную прозрачность и поэтому публикует каждое определение проверки качества данных
ПодробнееОтчеты о качестве данных
Фонд GLEIF ежемесячно публикует отчеты о качестве глобальных данных LEI и о качестве данных организаций, выдающих коды LEI
ПодробнееКонтроль качества данных
Фонд GLEIF использует самые современные инструменты и технологии для обеспечения постоянного контроля качества
Подробнее