Assurez-vous que SDK qualité des Big Data est installé sur votre ordinateur.
-
Créez un projet Java pour utiliser le SDK nécessaire à l’aide de l’une de ces méthodes :
-
Créez un projet Java spécifique pour exécuter l'opération de qualité des données requise.
À l'aide de cette méthode, vous devez créer des projets Java distincts pour chaque job de qualité des données que vous voulez lancer.
-
Créez un projet Java courant pour exécuter l'une des opérations Data Quality souhaitées en utilisant les arguments de l'exécution correspondante.
À l'aide de cette méthode, vous ne créez qu'un seul projet Java qui accepte des arguments d'exécution correspondant à l'opération de qualité des données de votre choix.
-
Importez le fichier JAR spécifique au module SDK qualité des Big Data dans votre projet pour utiliser le SDK. Pour obtenir une liste des fichiers JAR propres au module, reportez-vous à la section Composants de l'API Java du SDK.
-
Importez les fichiers JAR Hadoop requis dans votre projet.
-
Créez votre application pour exécuter les jobs de qualité des données de votre choix, avec les configurations appropriées.
-
Générez votre projet, à l'aide de n'importe quel outil intégré comme Maven ou Ant.
Un fichier JAR de votre projet est créé en conséquence.
Par exemple,MatchKeyGeneratorClient-with-dependencies.jar
est créé.
-
Placez le fichier JAR de votre projet sur la plate-forme Hadoop.
-
Sur la plate-forme Hadoop, dans une invite de commande, remplacez le répertoire vers le chemin d'accès où vous avez placé votre fichier JAR.
-
Exécutez le fichier JAR de votre projet à l'aide de la commande :
hadoop jar <name of the JAR of your client project> <fully qualified name of the main class>
Par exemple :
hadoop jar MatchKeyGeneratorClient-with-dependencies.jar com.company.bdq.amm.mr.MatchKeyGeneratorJob
Le job de votre choix est créé et exécuté sur la plate-forme Hadoop. Votre application Java accède aux données d'entrée à partir du chemin d'accès spécifié sur la plate-forme Hadoop et crée et exécute le job sur la plate-forme Hadoop. La sortie du job est exportée dans un fichier sur le chemin d'accès de sortie spécifié sur la plate-forme Hadoop.