您只能管理您所衡量的内容
数据质量检查
通过与 LEI 监督管理委员会 (ROC) 和 LEI 发放组织进行密切对话,GLEIF 定义了一套可衡量的质量标准,以此说明与 LEI 群组相关的数据质量概念。为此,其已采用由国际标准化组织所制定的标准。GLEIF 通过制定一套明确的质量标准,建立了透明客观的基准,以对全球 LEI 体系内的数据质量级别展开评估。
GLEIF 的数据质量检查确保所提供的参考数据符合全球 LEI 体系中现行的状态转换和验证规则。其已根据通用数据文件 (CDF) 格式对这些检查进行定义。
每项数据质量检查都以成熟度级别、质量标准、意图以及包含前提条件和条件的正式描述为特征。
这套检查构成了所谓的规则设置。每项检查都属于“如果 X 那么 Y”的类型,其中 X 被描述为检查前提条件,而 Y 是检查条件。如果某项记录、某种关系或某个例外情况不符合检查的前提条件,那么此项检查就 "不适用"。如果它通过了前提条件,开始检查条件,并且值未满足 Y,则该检查被认为“未通过”,否则该检查会被视为“通过”。
GLEIF 的规则制定
- 意图
该意图以简明的语言描写,并对特定数据质量检查的目的进行了总结。 - 前提条件
并非每项数据质量检查都适用于所有 LEI 记录。例如,一些数据质量检查仅适用于基金机构或活跃的机构。每项检查的前提条件会把那些不适用于某个特定检查的 LEI 记录过滤掉。 - 条件
进行每项数据质量检查时,都会有某些明确的未通过条件。该条件仅适用于已通过特定数据质量检查的前提条件的 LEI 记录。
检查类别
此外,还可以根据其性质和衡量类型对数据质量检查进行分类。例如,元检查专注于及时性、数据更新和可及性标准,而格式检查大多通过通用数据文件格式和嵌入式 XML 模式实现。记录级别的检查适用于强制性和可选的字段元素,并涵盖格式和可信度检查(例如值范围)。
成熟度级别模型
为了确定全球 LEI 体系的整体数据质量,GLEIF 使用了对定义的质量标准进行评估的成熟度模型。根据与不同类别相关的检查类型,每项检查都会被分配到一个成熟度级别。只有在所有较低的级别都得到完全保证时,才能达到优秀和期望的成熟度级别。
1 - 规定:
本级别反映了可重复的成功,由以下部分组成:
- 格式检查
- 关于强制性元素的所有检查
2 - 期望:
本级别显示了管理的成功,由以下部分组成:
- 可信度检查
- 业务规则检查
- 关系完整性检查
- 关于可选元素的所有检查
3 - 优秀:
第三个级别是优化成功的级别,由以下部分组成:
- 代表性检查
- 及时性检查
- 关于 LEI 生命周期和旧记录的所有检查
数据质量标准
通过设立一套定义的质量标准,GLEIF 已建立起透明客观的基准来评估全球 LEI 体系内的数据质量水平。
质量标准 | 定义 |
---|---|
准确性 | 数据中不存在可识别错误的程度/数据元素或数据集与被视为正确的权威数据来源之间的一致程度,或者数据正确表示实际对象真实状况的程度 |
可及性 | 数据项易于获取、可合法访问,在流程中建立强劲的保护和控制机制的程度 |
完成度 | 所有要求出现数据的填充程度 |
综合度 | 所有要求的数据项均已包含在内,这确保了整个数据的收集范围,并记录了有意的限制 |
一致性 | 一条独特数据在多个数据集中,保有相同数据值的比例 |
数据更新 | 数据更新的程度(如果一个数据值在特定时间点是更新的,那么该数据值就是最新的,而如果一个数据值在之前的时间是更新的,但是在后续时间已经不正确了,那么该数据值就是过期的) |
完整性 | 与定义的数据关系规则的符合程度(如基础/外部关键参照完整度) |
来源出处 | 一个属性值的历史记录或谱系来源 |
代表性 | 可以体现既定用途数据格式、样式、可识别性和有效性的数据质量特性 |
及时性 | 数据在需要时的可用程度/数据质量的概念,涉及到数据是否最新,是否在有用的时间范围内可用;及时性由使用数据的方式和背景决定 |
唯一性 | 某个数据元素的所有特有值仅出现一次的程度 |
有效性 | 衡量数据值与其域值集符合程度的方法(即一系列允许的值或值的范围) |
可供下载的相关文件
- 下载 PDF 文件: 数据质量规则制定 3.4 版本 (Data Quality Rule Setting v3.4)
- 下载 XLS 文件: 数据质量规则制定 3.4 版本 (Data Quality Rule Setting v3.4)
- 下载 PDF 文件:状态转换和验证规则 2.8.3 版本 (State Transition and Validation Rules v2.8.3)