Componentes de la API de Java de SDK
Los componentes clave para usar un trabajo Big Data Quality SDK con la API de Java son:
- Archivos JAR
-
- Archivos JAR de Hadoop
- Los archivos JAR del módulo al que pertenece el trabajo Big Data Quality SDK deseado, como se indica en la tabla:
Módulo Trabajo Archivo JAR Módulo Advanced Matching Todos los trabajos AMM amm.core-12.0.jar Módulo Data Normalization Todos los trabajos DNM dnm.core-12.0.jar Módulo Universal Addressing Validate Address uam-universaladdress.core-12.0.jar Módulo Universal Addressing Validate Address Global uam-global.core-12.0.jar Módulo Universal Addressing Validate Address Loqate uam-loqate.core-12.0.jar Módulo Universal Name Todos los trabajos UNM unm.core-12.0.jar
- Archivos de configuración
- Archivos en formato XML que contienen todos los parámetros y valores necesarios para ejecutar un trabajo, como reglas de cruce, detalles de archivo de entrada, detalles de archivo de salida, detalles de configuración de MapReduce o Spark y otros datos similares.
Los archivos de configuración XML se colocan en la ubicación <Big Data Quality bundle>\samples\configuration.
- Aplicación de cliente Java
- Aplicación de Java para usar la API a fin de crear y ejecutar el trabajo Big Data Quality SDK requerido provisto por su API de Java.
- Plataforma Hadoop
- El trabajo creado accede a la plataforma configurada de Hadoop para acceder a los datos de entrada y volcar los datos de salida en un archivo.