Intraflow Match
Intraflow Match identifie des rapprochements entre des enregistrements de données similaires à l'intérieur d'un seul flux d'entrée. Vous pouvez créer des règles hiérarchiques basées sur des champs que vous avez définis ou créés dans d'autres stages du flux de données.
Reporting
Le job Intraflow Match vous permet de surveiller les résultats du job. Les compteurs disponibles sont les suivants :- INPUT_RECORDS
- Nombre d'enregistrements dans le stage de correspondance avant que le tri de correspondance soit effectué.
- DUPLICATE_RECORDS
- Nombre d'enregistrements en double dans un groupe de correspondance, ce qui peut être soit un suspect ou un enregistrement candidat.
- UNIQUE_RECORDS
- Nombre d'enregistrement suspect ou candidat qui ne correspond à aucun autre enregistrement dans leur groupe de correspondance respectif.
S'il est le seul enregistrement dans un groupe de doublons, un enregistrement de référence est automatiquement unique.
- MATCH_GROUPS
- (Grouper par) Les enregistrements regroupés par une Match Key.
- DUPLICATE_COLLECTIONS
- Nombre de collections de doublons comprenant un enregistrement suspect et ses enregistrements doublons regroupés par numéro de collection.
- EXPRESS_MATCHES
- Nombre de rapprochement express effectués dans une collection.
On parle de rapprochement express lorsque les contenus d'un champ donné d''un enregistrement suspect et d'un candidat correspondent parfaitement. Il s'agit généralement d'une ExpressMatchKey fournie par Match Key Generator. Lorsqu'un rapprochement express est trouvé, aucune autre opération de traitement n'est conduite afin de déterminer si l'enregistrement suspect et l'enregistrement candidat sont considérés comme doublons.
- AVERAGE_SCORE
- Score de correspondance moyen de tous les doublons.
Les valeurs possibles sont 0-100, où 0 indique une faible correspondance et 100 indique une correspondance exacte.
- TOTAL_DUPLICATES
- Nombre total de doublons trouvés.
- TOTAL_SCORE
- Score de correspondance total de tous les doublons.