Introduction à la qualité des données

La qualité des données implique la précision, la transmission en temps opportun, l'exhaustivité et la cohérence des données utilisées par une organisation afin que les données conviennent à l'utilisation. Spectrum™ Technology Platform prend en charge les initiatives de qualité des données en fournissant les capacités suivantes.

Parsing

L'analyse est le processus consistant à analyser une séquence de caractères d'entrée dans un champ et à la diviser en plusieurs champs. Par exemple, vous pouvez disposer d'un champ appelé Nom qui contient la valeur « John A. Smith » et, grâce à l'analyse, vous pouvez le diviser afin d'obtenir un champ Prénom contenant « John », un champ Deuxième prénom contenant « A » et un champ Nom de famille contenant « Smith ».

Standardisation

La standardisation prend des données de même type et leur applique le même format. Par exemple, les numéros de téléphone, les dates, les noms, les adresses et les numéros d'identification sont des types de données qui peuvent être standardisés. Par exemple, les numéros de téléphone peuvent être formatés pour éliminer les caractères non numériques, tels que les parenthèses, les points ou les tirets.

Vous devez standardiser vos données avant d'effectuer des activités de mise en correspondance ou de déduplication puisque les données standardisées seront mises en correspondance de manière plus précise que des données au format incohérent.

Correspondance

La mise en correspondance est le processus d'identification des enregistrements liés les uns aux autres, d'une manière significative pour vos besoins. Par exemple, si vous essayez d'éliminer les informations redondantes de vos données client, il serait judicieux d'identifier les enregistrements doublons pour le même client ou, si vous essayez d'éliminer des courriers marketing doublons arrivant à la même adresse, vous souhaiterez peut-être identifier les enregistrements des clients vivant dans le même foyer.

Déduplication

La déduplication identifie les enregistrements qui représentent une entité mais qui, pour une raison quelconque, ont été saisis dans le système plusieurs fois, parfois avec des données légèrement différentes. Par exemple, votre système peut contenir des informations sur les fournisseurs, issues de différents services dans votre organisation qui, chacun, utilisent un ID de fournisseur différent pour le même fournisseur. À l'aide de Spectrum™ Technology Platform, vous pouvez consolider ces enregistrements dans un enregistrement unique pour chaque fournisseur.

Examen des enregistrements d'exception

Dans certains cas, vous pouvez disposer de données qui ne peuvent pas être traitées automatiquement de manière confidentielle et qui doivent être examinées par un data steward fiable. Voici quelques exemples d'enregistrements qui peuvent exiger une vérification manuelle :
  • Échecs de vérification d'adresse
  • Échecs de géocodage
  • Correspondances incertaines
  • Décisions de fusion/consolidation

Le module Business Steward rassemble des fonctions qui vous permettent d'identifier et de résoudre des enregistrements d'exception.