Création d'une application Java

Assurez-vous que SDK qualité des Big Data est installé sur votre ordinateur.

Pour utiliser le SDK :

  1. Créez un projet Java pour utiliser le SDK nécessaire à l’aide de l’une de ces méthodes :
    1. Créez un projet Java spécifique pour exécuter l'opération de qualité des données requise.
      À l'aide de cette méthode, vous devez créer des projets Java distincts pour chaque job de qualité des données que vous voulez lancer.
    2. Créez un projet Java courant pour exécuter l'une des opérations Data Quality souhaitées en utilisant les arguments de l'exécution correspondante.
      À l'aide de cette méthode, vous ne créez qu'un seul projet Java qui accepte des arguments d'exécution correspondant à l'opération de qualité des données de votre choix.
  2. Importez le fichier JAR spécifique au module SDK qualité des Big Data dans votre projet pour utiliser le SDK. Pour obtenir une liste des fichiers JAR propres au module, reportez-vous à la section Composants de l'API Java du SDK.
  3. Importez les fichiers JAR Hadoop requis dans votre projet.
  4. Créez votre application pour exécuter les jobs de qualité des données de votre choix, avec les configurations appropriées.
  5. Générez votre projet, à l'aide de n'importe quel outil intégré comme Maven ou Ant.
    Un fichier JAR de votre projet est créé en conséquence.

    Par exemple,MatchKeyGeneratorClient-with-dependencies.jar est créé.

  6. Placez le fichier JAR de votre projet sur la plate-forme Hadoop.
  7. Sur la plate-forme Hadoop, dans une invite de commande, remplacez le répertoire vers le chemin d'accès où vous avez placé votre fichier JAR.
  8. Exécutez le fichier JAR de votre projet à l'aide de la commande :
    hadoop jar <name of the JAR of your client project> <fully qualified name of the main class>
    Par exemple :
    hadoop jar MatchKeyGeneratorClient-with-dependencies.jar com.company.bdq.amm.mr.MatchKeyGeneratorJob
Le job de votre choix est créé et exécuté sur la plate-forme Hadoop.

Votre application Java accède aux données d'entrée à partir du chemin d'accès spécifié sur la plate-forme Hadoop et crée et exécute le job sur la plate-forme Hadoop. La sortie du job est exportée dans un fichier sur le chemin d'accès de sortie spécifié sur la plate-forme Hadoop.