Situaciones especiales
Registros con la columna Agrupar por en blanco
Todos los registros cuya columna Agrupar por esté en blanco se marcan como registros malformados y se vuelcan en archivos diferentes en la carpeta de salida de HDFS.Estos archivos malformados se denominan de la siguiente manera:
Contadores de registros malformados- Registros malformados en los archivos candidatos
- Los registros de los archivos candidatos con la columna Agrupar por en blanco se eliminan como registros malformados y se insertan en archivos que tengan la convención de nombre malformedRecordsCandidate-m-<5 digit numeral>.
Por ejemplo, malformedRecordsCandidate-m-00000,malformedRecordsCandidate-m-00001.
Esto se aplica a los trabajos de Interflow Match.
- Registros malformados en archivos sospechosos
- Los registros de archivos sospechosos con la columna Agrupar por en blanco se eliminan como registros malformados y se insertan en archivos que tengan la convención de nombre malformedRecordsSuspect-m-<5 digit numeral>.
Por ejemplo,malformedRecordsSuspect-m-00000,malformedRecordsSuspect-m-00001.
Esto se aplica a los trabajos de Interflow Match.
- Registros malformados en archivos de entrada
- Los registros de archivos de entrada con la columna Agrupar por en blanco se eliminan como registros malformados y se insertan en archivos que tengan la convención de nombre malformedRecords-m-<5 digit numeral>.
Por ejemplo,malformedRecords-m-00000,malformedRecords-m-00001.
Esto se aplica a los trabajos de Intraflow Match, Transactional Match, Best of Breed, Duplicate Synchronization y Filter.
La cantidad de registros malformados en una ejecución de trabajo se almacena en los contadores:
- MALFORMED_CANDIDATE_RECORDS
- MALFORMED_SUSPECT_RECORDS
- MALFORMED_RECORDS
Nota: Puede acceder a los valores de estos contadores invocando el método
getCounters()
de la instancia AdvanceMatchFactory
.