Composants de l'API Java du SDK
Les composants clés pour utiliser un job SDK qualité des Big Data via l'API Java sont les suivants :
- Fichiers JAR
-
- Fichiers JAR Hadoop.
- Fichiers JAR du module auquel appartient le job SDK qualité des Big Data souhaité, comme indiqué dans le tableau :
Module Job Fichier JAR Module Advanced Matching Tous les jobs AMM amm.core-12.0.jar Module Data Normalization Tous les jobs DNM dnm.core-12.0.jar Module Universal Addressing Validate Address uam-universaladdress.core-12.0.jar Module Universal Addressing Validate Address Global uam-global.core-12.0.jar Module Universal Addressing Validate Address Loqate uam-loqate.core-12.0.jar Module Universal Name Tous les jobs UNM unm.core-12.0.jar
- Fichiers de configuration
- Fichiers au format XML contenant tous les paramètres et toutes les valeurs nécessaires pour exécuter un job, y compris les règles de correspondance, les détails du fichier d'entrée, les détails du fichier de sortie, les détails de configuration MapReduce ou Spark, etc.
Des exemples de fichiers de configuration XML se trouvent sous <Big Data Quality bundle>\samples\configuration.
- Application Java client
- Application Java pour utiliser l'API pour créer et exécuter le job SDK qualité des Big Data souhaité fourni par son API Java.
- Plate-forme Hadoop
- Le job créé accède à la plate-forme Hadoop configurée pour accéder aux données d'entrée et placer les données de sortie dans un fichier.