データ品質にはプロアクティブな行動が必要
プロアクティブ管理
LEI発行組織を支援するため、GLEIFは、LEIおよび関連する参照データのデータ品質をプロアクティブに評価できるようにするために、適切かつ必須のプロセスと技術インターフェイスをLEI発行者に提供しています。これには、二重付番のエントリーに対する専用チェックも含まれています。LEI記録は、自動ウェブサービスのAPIを使用して、一度に一つずつチェックされます: データガバナンスの事前チェック機能 と 二重付番のチェック。
データガバナンスの事前チェック
LEI発行者は、すべての新規発行および更新されたLEI記録をGLEIFの事前チェック機能に送信してから、グローバルリポジトリーにこれらをアップロードします。事前チェック機能は、同様に既に公表済みのLEI記録に対しても毎日実施される データ品質の確認 にも適用されます。事前チェックの結果に基づき、LEI発行者は、これらの不一致が公開されたデータプールに入ってしまう前に、潜在的なデータ品質問題の修正を行えます。こうしたチェックの結果に加えて、要請すれば説明も受けられるため、報告済みの問題に対して集中的かつスピーディーに修正を行えます。
発行組織に義務付けられたこの機能の利用が継続的な改善プロセスを支えており、それによってグローバルLEIシステム内の品質のレベルが上がり、成熟度も上昇しています。
二重付番のチェック
二重付番のデータ記録を防ぐために、新規に要求されたLEIコードとそれに対応する参照データは、グローバルLEIリポジトリに存在する他のすべての記録、ならびにまだ発行済みではないものの他のLEI発行者が二重付番のチェックに送信したLEI記録と比較されます。したがって、2つの別のLEI発行体が同じ取引主体から申し入れがあった場合でも、LEI発行者は、二重付番の可能性を特定して、その顧客および互いに調整が可能です。最終的には、こうした手続きによって、当システムでの二重付番の発生を防いでいます。
二重付番を特定するプロセスでは、LEI記録の複数のデータ要素を検討し、前処理、コアアルゴリズム、後処理に分割できます。
前処理の期間では、データは、いわゆる脆弱なトークンを特定してそれに対応するなどのように、予定される手順に対して対応できるように準備されます。脆弱なトークンの典型的な例は、取引主体の法人形態が取引主体の名称の部分に成りえる場合です。法人形態はその後、次に続くプロセス段階で最良の結果になるように正規化されて整合されることになります。
二重付番のチェック機能のコアエンジンは、一意性と排他性のチェックで構成され、ファジー文字例のマッチに対して、最先端のアルゴリズム(レーベンシュタイン距離、コサイン類似度、Monge-Elkan距離など)を組み合わせます。
後処理の段階では、二重付番のチェック機能で、二次データ要素(法定管轄区域、取引主体のカテゴリーなど)の追加チェックと特殊処理のもとになる誤検出の数を減らします。
ダウンロード可能な関連ファイル
PDFをダウンロード:二重付番のチェック・ディレクトリ v1.2 (Check for Duplicates Dictionary v1.2)