Affichage d'une synthèse des résultats de correspondance
L'outil Analyse des rapprochements peut afficher une synthèse d'informations sur les processus de mise en correspondance dans un dataflow, telles que le nombre de doublons d'enregistrements, le score de correspondance moyen, etc. Vous pouvez afficher les résultats d'un job unique ou vous pouvez comparer les résultats entre plusieurs jobs.
L'onglet Résumé répertorie les statistiques de correspondance du job. Selon le type de stage de correspondance utilisé dans le dataflow, vous obtiendrez des informations différentes.
Pour Intraflow Match, vous verrez les informations de synthèse suivantes :
- Enregistrements d'entrée
- Nombre total des enregistrements traités par le stage de correspondance.
- Enregistrements uniques
- Enregistrement de référence ou candidat qui ne correspond à aucun autre enregistrement dans un groupe de doublons. S'il est le seul enregistrement dans un groupe de doublons, un enregistrement de référence est automatiquement unique.
- Groupes de rapprochements
- (Regrouper par) Les enregistrements regroupés soit par une clé de correspondance ou une fenêtre coulissante.
- Groupes de doublons
- Un groupe de doublons comprend un enregistrement de référence et ses enregistrements doublons regroupés par numéro de groupe. Un groupe de doublons est également appelé une Collection dans Spectrum. Les enregistrements uniques appartiennent toujours au groupe 0.
- Rapprochements express
- On parle de rapprochement express lorsque les contenus d'un champ donné d'un enregistrement de référence et d'un enregistrement candidat correspondent parfaitement. Il s'agit généralement d'une clé de rapprochement express fournie par le Match Key Generator. Lorsqu'un rapprochement express est trouvé, aucune autre opération de traitement n'est conduite et l'enregistrement de référence et l'enregistrement candidat sont considérés comme doublons.
- Score moyen
- Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
Pour Interflow Match, vous verrez les informations de synthèse suivantes :
- Groupes de doublons
- Un groupe de doublons comprend un enregistrement de référence et ses enregistrements doublons regroupés par numéro de groupe. Un groupe de doublons est également appelé une Collection dans Spectrum. Les enregistrements uniques appartiennent toujours au groupe 0.
- Rapprochements express
- On parle de rapprochement express lorsque les contenus d'un champ donné d'un enregistrement de référence et d'un enregistrement candidat correspondent parfaitement. Il s'agit généralement d'une clé de rapprochement express fournie par le Match Key Generator. Lorsqu'un rapprochement express est trouvé, aucune autre opération de traitement n'est conduite et l'enregistrement de référence et l'enregistrement candidat sont considérés comme doublons.
- Score moyen
- Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
- Suspects d'entrée
- Nombre d'enregistrements dans le flux d'entrée que l'outil de mise en correspondance a tenté de rapprocher d'autres enregistrements
- Suspects contenant des doublons
- Nombre de suspects d'entrée mis en correspondance avec au moins un enregistrement candidat.
- Suspects uniques
- Nombre de suspects d'entrée qui n'ont été mis en correspondance avec aucun enregistrement candidat.
- Suspects contenant des candidats
- Nombre de suspects d'entrée qui disposaient d'au moins un enregistrement candidat dans leur groupe de correspondance et qui donc présentaient au moins une tentative de correspondance.
- Suspects sans candidats
- Nombre de suspects d'entrée qui ne disposaient d'aucun enregistrement candidat dans leur groupe de correspondance et qui donc ne présentaient aucune tentative de correspondance.
Pour Transactional Match, vous verrez les informations de synthèse suivantes :
- Score moyen
- Score de correspondance moyen de tous les doublons. Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
- Suspects d'entrée
- Nombre d'enregistrements dans le flux d'entrée que l'outil de mise en correspondance a tenté de rapprocher d'autres enregistrements
- Suspects contenant des doublons
- Nombre de suspects d'entrée mis en correspondance avec au moins un enregistrement candidat.
- Suspects uniques
- Nombre de suspects d'entrée qui n'ont été mis en correspondance avec aucun enregistrement candidat.
- Suspects contenant des candidats
- Nombre de suspects d'entrée qui disposaient d'au moins un enregistrement candidat dans leur groupe de correspondance et qui donc présentaient au moins une tentative de correspondance.
- Suspects sans candidats
- Nombre de suspects d'entrée qui ne disposaient d'aucun enregistrement candidat dans leur groupe de correspondance et qui donc ne présentaient aucune tentative de correspondance.
L'onglet Gain/Perte de l'outil Analyse des rapprochements affiche le nombre de doublons et d'enregistrements uniques dans un histogramme pour la base de référence sélectionnée, ainsi que les résultats de comparaison éventuellement. L'Augmentation correspond à la augmentation du nombre d'enregistrements doublons. La perte correspond à la réduction du nombre d'enregistrements doublons. Les enregistrements uniques apparaissent en jaune et les enregistrements doublons en vert.
Si un seul job de base de référence est sélectionné, le graphique affichera les résultats de ce job unique :
Si un job de base de référence et un job de comparaison sont sélectionnés, le graphique affiche les jobs de base de référence et de comparaison côte à côte :
L'onglet Règles de correspondance de l'outil Analyse des rapprochements affiche les règles de correspondance utilisées pour un seul résultat de correspondance ou pour les modifications apportées aux règles de correspondance lors de la comparaison de deux résultats de correspondance.
Les règles de rapprochement sont affichées sous la forme d'une structure hiérarchique similaire à la façon dont elles apparaissent dans le stage dans lequel elles sont créées. La hiérarchie de règle contient deux noeuds : Options et Règles. Le nœud Options montre les paramètres de stage pour le résultat de rapprochement sélectionné. Le nœud Règles montre les règles de rapprochement pour le résultat de rapprochement sélectionné.
Pour visualiser une règle en détails, sélectionnez un nœud dans la hiérarchie.
Si vous comparez des règles de correspondance entre plusieurs jobs, les différences entre les résultats de correspondance de base de référence et de comparaison sont codées par couleur, comme suit :
- Bleu
- Indique que la règle de rapprochement du résultat de rapprochement comparatif a été modifiée.
- Vert
- Indique que la règle de rapprochement du résultat de rapprochement comparatif a été ajoutée.
- Rouge
- Indique que la règle de rapprochement du résultat de rapprochement comparatif a été omise.
Par exemple :