リファレンス データの概要
Pitney Bowes リファレンス データは、データ品質を保証するためにシステム内の他のデータ フィールドによって使用される許容値の集合を定義します。これによって、データの妥当性、正確性、一貫性が高まります。データからさらなる価値を引き出し、ビッグ データ システムから信頼できるデータを取得することができるようになります。
例えば、Data Normalization モジュールでリファレンス データを使用すると、企業全体にわたって単一の顧客の同一性を確立することができます。顧客情報の適切な定義は、運用効率を改善するための第一歩です。
重要: Validate Address および Validate Address Global ジョブでは、Hadoop クラスタのすべてのデータ ノードにリファレンス データが配置されている必要があります。Validate Address Loqate ジョブでは、リファレンス データが 1 つのノードに配置され、さらにそのデータがその他すべてのデータノードにマウントされている必要があります。
インストール ディレクトリの構造
SDK インストール ディレクトリ下の Utilities/dbloaderディレクトリには、次の子フォルダがあります。
- dataquality
- このフォルダには、以下のモジュールの参照データをインストールするための JAR およびスクリプトが含まれます。
- Data Normalization モジュール
- Universal Name モジュール注: 詳細については、リファレンス データの使用: Data Normalization モジュールおよび Universal Name モジュールを参照してください。
- aq
- 次のファイルが含まれます。
- リファレンス データをインストールするための
scripts/server/installdb_unc.sh
スクリプト。このデータをインストールまたは展開するには、このスクリプトを実行する必要があります。 - Universal Addressing モジュールの Validate Address ジョブのための Acushare サービス セットアップ情報が含まれている
runtime
フォルダ。
注: 詳細については、リファレンス データの使用: Universal Addressing モジュールを参照してください。 - リファレンス データをインストールするための