データ品質の概要
データ品質には、組織で使用されるデータの精度、適時性、完全性、および一貫性が使用目的に適していることの確認が伴います。Spectrum™ Technology Platformは、以下の機能を提供することによってデータ品質イニシアチブをサポートします。
パーシング
パーシングは、フィールド内にある連続した入力文字を解析して複数のフィールドに分割する処理です。例えば、Name というフィールドに "John A.Smith" という値が格納されている場合、この値を分割して、FirstName フィールドに "John"、MiddleName フィールドに "A"、LastName フィールドに "Smith" を格納することができます。
正規化
正規化機能は、同じタイプのデータを受け取って、同じ形式に格納します。正規化できるデータのタイプとしては、電話番号、日付、名前、住所、ID 番号などがあります。例えば、電話番号は、かっこ、ピリオド、ダッシュなどの数字以外の文字を除去して書式設定できます。
正規化されたデータは書式に一貫性のないデータより正確にマッチングされるので、マッチングまたは重複除去アクティビティを実行する前に、データを正規化する必要があります。
マッチング
マッチングは、目的にとって重要な何らかの方法で相互に関連付けられるレコードを識別するプロセスです。例えば、顧客データから冗長な情報を除去しようとする場合、同じ顧客に対する重複レコードを特定できます。または、マーケティング資料が同じ住所に重複して送られないようにする場合は、同じ世帯に住む顧客のレコードを特定できます。
重複除去
重複除去機能は、1 つのエンティティを表していながら何らかの理由で、場合によっては若干異なるデータで、システムに複数回入力されたレコードを特定します。例えば、異なる部門が同じベンダーに対して異なるベンダー ID を使用してベンダー情報を個別にシステムに入力している場合があります。Spectrum™ Technology Platformを使用すると、このようなレコードをベンダーごとに 1 つのレコードに統合できます。
例外レコードの確認
- 住所検証エラー
- ジオコーディング エラー
- 信頼性の低いマッチング
- マージ/統合の結果
Business Steward モジュールは、例外レコードを特定および解決することのできる機能の集合です。