Affichage d'une synthèse des résultats de correspondance

L'outil Analyse des rapprochements peut afficher une synthèse d'informations sur les processus de mise en correspondance dans un flux de données, telles que le nombre de doublons d'enregistrements, le score de correspondance moyen, etc. Vous pouvez afficher les résultats d'un job unique ou vous pouvez comparer les résultats entre plusieurs jobs.

  1. Dans Enterprise Designer, ouvrez le flux de données à analyser.
  2. Pour chaque stage Interflow Match, Intraflow Match ou Transactional Match, dont vous souhaitez analyser les correspondances, double-cliquez sur le stage et cochez la case Générer les données pour analyse.
    Important : L'activation de l'option Générer les données pour analyse réduit les performances. Désactivez cette option lorsque vous avez terminé d'utiliser l'outil Analyse des rapprochements.
  3. Sélectionnez Exécuter > Exécuter le flux actuel
    Remarque : Afin d'obtenir des résultats optimaux, utilisez des données qui produiront au maximum 100 000 enregistrements. Plus vous obtenez de résultats de correspondance, plus les performances de l'outil Analyse des rapprochements sont lentes.
  4. Lorsque le flux de données termine l'exécution, sélectionnez Outils > Analyse des rapprochements.

    La boîte de dialogue Parcourir les résultats du rapprochement affiche une liste des flux de données disposant de résultats de correspondance, que vous pouvez afficher dans l'outil Analyse des rapprochements. Si le job que vous souhaitez analyser n'est pas répertorié, ouvrez le flux de données et assurez-vous que le stage de correspondance présente la case Générer les données pour analyse cochée.

    Conseil : Si vous disposez d'un grand nombre de flux de données et que vous souhaitez les filtrer, sélectionnez une option de filtre dans la liste déroulante Afficher uniquement les jobs où.
  5. Cliquez sur l'icône "+" située en regard du flux de données à afficher pour le développer.
  6. Sous le flux de données se trouve une entrée pour chaque stage de correspondance dans le flux de données. Sélectionnez le stage dont vous souhaitez afficher les résultats et cliquez sur Ajouter.

    L'outil Analyse des rapprochements apparaît dans la partie inférieure de la fenêtre Enterprise Designer.

  7. Pour comparer les résultats de correspondance, côte à côte, avec les résultats d'un autre outil de mise en correspondance, procédez comme suit :
    1. Cliquez sur Ajouter.
    2. Sélectionnez l'outil de mise en correspondance dont vous souhaitez comparer les résultats.
    3. Cliquez sur Ajouter.
    4. Dans la liste de flux de données, sélectionnez l'outil de mise en correspondance que vous venez d'ajouter et cliquez sur Comparer.

L'onglet Résumé répertorie les statistiques de correspondance du job. Selon le type de stage de correspondance utilisé dans le flux de données, vous obtiendrez des informations différentes.

Pour Intraflow Match, vous verrez les informations de synthèse suivantes :

Enregistrements d'entrée
Nombre total des enregistrements traités par le stage de correspondance.
Enregistrements uniques
Enregistrement de référence ou candidat qui ne correspond à aucun autre enregistrement dans un groupe de doublons. S'il est le seul enregistrement dans un groupe de doublons, un enregistrement de référence est automatiquement unique.
Groupes de rapprochements
(Regrouper par) Les enregistrements regroupés soit par une clé de correspondance ou une fenêtre coulissante.
Groupes de doublons
Un groupe de doublons comprend un enregistrement de référence et ses enregistrements doublons regroupés par numéro de groupe. Un groupe de doublons est également appelé une Collection dans Spectrum. Les enregistrements uniques appartiennent toujours au groupe 0.
Rapprochements express
On parle de rapprochement express lorsque les contenus d'un champ donné d'un enregistrement de référence et d'un enregistrement candidat correspondent parfaitement. Il s'agit généralement d'une clé de rapprochement express fournie par le Match Key Generator. Lorsqu'un rapprochement express est trouvé, aucune autre opération de traitement n'est conduite et l'enregistrement de référence et l'enregistrement candidat sont considérés comme doublons.
Score moyen
Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.

Pour Interflow Match, vous verrez les informations de synthèse suivantes :

Groupes de doublons
Un groupe de doublons comprend un enregistrement de référence et ses enregistrements doublons regroupés par numéro de groupe. Un groupe de doublons est également appelé une Collection dans Spectrum. Les enregistrements uniques appartiennent toujours au groupe 0.
Rapprochements express
On parle de rapprochement express lorsque les contenus d'un champ donné d'un enregistrement de référence et d'un enregistrement candidat correspondent parfaitement. Il s'agit généralement d'une clé de rapprochement express fournie par le Match Key Generator. Lorsqu'un rapprochement express est trouvé, aucune autre opération de traitement n'est conduite et l'enregistrement de référence et l'enregistrement candidat sont considérés comme doublons.
Score moyen
Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
Suspects d'entrée
Nombre d'enregistrements dans le flux d'entrée que l'outil de mise en correspondance a tenté de rapprocher d'autres enregistrements
Suspects contenant des doublons
Nombre de suspects d'entrée mis en correspondance avec au moins un enregistrement candidat.
Suspects uniques
Nombre de suspects d'entrée qui n'ont été mis en correspondance avec aucun enregistrement candidat.
Suspects contenant des candidats
Nombre de suspects d'entrée qui disposaient d'au moins un enregistrement candidat dans leur groupe de correspondance et qui donc présentaient au moins une tentative de correspondance.
Suspects sans candidats
Nombre de suspects d'entrée qui ne disposaient d'aucun enregistrement candidat dans leur groupe de correspondance et qui donc ne présentaient aucune tentative de correspondance.

Pour Transactional Match, vous verrez les informations de synthèse suivantes :

Score moyen
Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
Suspects d'entrée
Nombre d'enregistrements dans le flux d'entrée que l'outil de mise en correspondance a tenté de rapprocher d'autres enregistrements
Suspects contenant des doublons
Nombre de suspects d'entrée mis en correspondance avec au moins un enregistrement candidat.
Suspects uniques
Nombre de suspects d'entrée qui n'ont été mis en correspondance avec aucun enregistrement candidat.
Suspects contenant des candidats
Nombre de suspects d'entrée qui disposaient d'au moins un enregistrement candidat dans leur groupe de correspondance et qui donc présentaient au moins une tentative de correspondance.
Suspects sans candidats
Nombre de suspects d'entrée qui ne disposaient d'aucun enregistrement candidat dans leur groupe de correspondance et qui donc ne présentaient aucune tentative de correspondance.

L'onglet Gain/Perte de l'outil Analyse des rapprochements affiche le nombre de doublons et d'enregistrements uniques dans un histogramme pour la base de référence sélectionnée, ainsi que les résultats de comparaison éventuellement. L'Augmentation correspond à la augmentation du nombre d'enregistrements doublons. La perte correspond à la réduction du nombre d'enregistrements doublons. Les enregistrements uniques apparaissent en jaune et les enregistrements doublons en vert.

Si un seul job de base de référence est sélectionné, le graphique affichera les résultats de ce job unique :



Si un job de base de référence et un job de comparaison sont sélectionnés, le graphique affiche les jobs de base de référence et de comparaison côte à côte :



L'onglet Règles de correspondance de l'outil Analyse des rapprochements affiche les règles de correspondance utilisées pour un seul résultat de correspondance ou pour les modifications apportées aux règles de correspondance lors de la comparaison de deux résultats de correspondance.

Les règles de rapprochement sont affichées sous la forme d'une structure hiérarchique similaire à la façon dont elles apparaissent dans le stage dans lequel elles sont créées. La hiérarchie de règle contient deux noeuds : Options et Règles. Le nœud Options montre les paramètres de stage pour le résultat de rapprochement sélectionné. Le nœud Règles montre les règles de rapprochement pour le résultat de rapprochement sélectionné.

Pour visualiser une règle en détails, sélectionnez un nœud dans la hiérarchie.



Si vous comparez des règles de correspondance entre plusieurs jobs, les différences entre les résultats de correspondance de base de référence et de comparaison sont codées par couleur, comme suit :

Bleu
Indique que la règle de rapprochement du résultat de rapprochement comparatif a été modifiée.
Vert
Indique que la règle de rapprochement du résultat de rapprochement comparatif a été ajoutée.
Rouge
Indique que la règle de rapprochement du résultat de rapprochement comparatif a été omise.

Par exemple :