Scénarios spéciaux
Enregistrements avec une colonne Group-By vide
Tous les enregistrements avec une valeur Group-By vide sont marqués comme des enregistrements non conformes et placés dans des fichiers séparés dans le dossier HDFS de sortie.Ces fichiers non conformes sont nommés comme suit :
Compteurs d'enregistrements non conformes- Enregistrements non conformes dans des fichiers candidats
- Les enregistrements de fichiers candidats avec une colonne Group-By vide sont rejetés comme des enregistrements non conformes et insérés dans des fichiers suivant la convention de nommage de fichiers malformedRecordsCandidate-m-<5 digit numeral>.
Par exemple, malformedRecordsCandidate-m-00000,malformedRecordsCandidate-m-00001.
Cela s'applique aux jobs Interflow Match.
- Enregistrements non conformes dans des fichiers suspects
- Les enregistrements de fichiers suspects avec une colonne Group-By vide sont rejetés comme des enregistrements non conformes et insérés dans des fichiers suivant la convention de nommage de fichiers malformedRecordsSuspect-m-<5 digit numeral>.
Par exemple, malformedRecordsSuspect-m-00000,malformedRecordsSuspect-m-00001.
Cela s'applique aux jobs Interflow Match.
- Enregistrements non conformes dans des fichiers d'entrée
- Les enregistrements de fichiers d'entrée avec une colonne Group-By vide sont rejetés comme des enregistrements non conformes et insérés dans des fichiers suivant la convention de nommage de fichiers malformedRecords-m-<5 digit numeral>.
Par exemple,malformedRecords-m-00000,malformedRecords-m-00001.
Cela s'applique aux jobs Intraflow Match, Transactional Match, Best of Breed, Duplicate Synchronization et Filter.
Le nombre d'enregistrements non conformes d'un job exécuté est stocké dans les compteurs :
- MALFORMED_CANDIDATE_RECORDS
- MALFORMED_SUSPECT_RECORDS
- MALFORMED_RECORDS
Remarque : Les valeurs de ces compteurs sont accessibles via l'appel de la méthode
getCounters()
de l'instance AdvanceMatchFactory
.