Présentation des données de référence

Les données de référence de Pitney Bowes définissent un ensemble de valeurs autorisées à utiliser par d'autres champs de données dans votre système afin de garantir la qualité des données. Elles améliorent la cohérence, la précision et la validité des données. Elles vous permettent d'extraire plus de valeur de vos données et d'obtenir des données de confiance du système Big Data.

Par exemple, si vous utilisez les données de référence avec le module Data Normalization, vous pouvez définir une identité client unique au sein de l'entreprise. Des informations client clairement définies constituent la première étape d'amélioration de l'efficacité opérationnelle.

Important : Pour les jobs Validate Address et Vadidate Address Global, les données de référence doivent être placées sur tous les nœuds de données du cluster Hadoop. Pour le job Validate Address Loqate, elles doivent être placées sur un nœud et ce dernier doit ensuite être monté sur tous les autres nœuds de données.

Structure du répertoire d’installation

Dans le répertoire d’installation du SDK, le répertoire Utilities/dbloader contient les dossiers enfants :

dataquality

Contient les fichiers JAR et de script permettant d'installer les données de référence pour :

Module Data Normalization
Module Universal Name
Remarque : Pour plus d'informations, reportez-vous à la section Utilisation de données de référence : modules Data Normalization et Universal Name.

aq

Contient :

Le script scripts/server/installdb_unc.sh permettant d'installer les données de référence. Vous devez exécuter ce script pour installer ou extraire les données.
Le dossier runtime contenant des informations de configuration du service Acushare pour le job Validate Address du module Universal Addressing.

Remarque : Pour plus d'informations, reportez-vous à la section Utilisation de données de référence : module Universal Addressing.