Standardisation des noms de personne

Cette procédure explique comment prendre les données de nom de personne (par exemple, « John P. Smith »), identifie les surnoms courants d'un même nom et crée une version standard du nom qui peut alors être utilisée pour consolider les enregistrements redondants.

Remarque : Avant de commencer, assurez-vous que vos données d'entrée disposent d'un champ appelé « Nom » qui contient le nom complet de la personne.

Si ce n'est pas déjà fait, chargez les tables suivantes sur le serveur Spectrum™ Technology Platform :
- Base Open Parser
- Noms améliorés Open Parser
Utilisez l'utilitaire de chargement de la base de données du module Data Normalization pour charger ces tables. Pour en savoir plus sur le chargement de tables, voir le Guide d'installation.
Dans Enterprise Designer, créez un flux de données.
Faites glisser un stage source sur le canevas.
Double-cliquez sur le stage source et configurez-le. Pour obtenir les instructions sur la configuration des stages source, reportez-vous au Guide du concepteur du flux de données.
Faites glisser un stage Open Name Parser sur le canevas et connectez-le au stage source.

Par exemple, si vous utilisez un stage Read from File, votre flux de données se présente comme suit :
Faites glisser un stage Table Lookup sur le canevas et connectez-le au stage Open Name Parser.

Votre flux de données prend maintenant la forme suivante :
Double-cliquez sur le stage Table Lookup sur le canevas.
Dans le champ Source, sélectionnez Prénom.
Dans le champ Destination, sélectionnez Prénom.

En indiquant le même champ pour la source et la destination, le champ sera mis à jour avec la version standardisée du nom.
Dans le champ Table, sélectionnez NickNames.xml.
Cliquez sur OK.
Cliquez de nouveau sur OK pour fermer la fenêtre Options Table Lookup.
Faites glisser un stage de collecteur de données sur le canevas et connectez-le au stage Table Lookup.

Par exemple, si vous utilisiez un collecteur de données Write To File, votre flux de données se présenterait alors comme suit :
Double-cliquez sur le stage de collecteur de données et configurez-le. Pour obtenir les instructions sur la configuration des stages source, reportez-vous au Guide du concepteur du flux de données.

Vous disposez désormais d'un flux de données qui prend les noms personnels et standardise le prénom, remplaçant les surnoms par la forme standard du nom.