Utilisation d'un job Match Key Generator MapReduce

  1. Créez une instance de AdvanceMatchFactory à l'aide de sa méthode statique getInstance().
  2. Fournissez les détails d'entrée et de sortie du job Match Key Generator en créant une instance de MatchKeyGeneratorDetail définissant ProcessType. L’instance doit utiliser le type MRProcessType.
    1. Spécifiez les paramètres de clé de correspondance pour effectuer la mise en correspondance en créant et en configurant une instance de MatchKeySettings. Pour plus d'informations, reportez-vous à l'échantillon de code correspondant.
    2. Créez une instance de MatchKeyGeneratorDetail en transmettant une instance de type JobConfig et l'instance MatchKeySettings créée comme arguments à son constructeur.
      Le paramètre JobConfig doit être une instance de type MRJobConfig.
    3. Définissez les détails du fichier d'entrée à l'aide du champ inputPath de l'instance MatchKeyGeneratorDetail.
      Pour un fichier d'entrée texte, créez une instance de FilePath avec les détails pertinents du fichier d'entrée en appelant le constructeur approprié. Pour un fichier d'entrée ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier d'entrée ORC comme argument.
    4. Définissez les détails du fichier de sortie à l'aide du champ outputPath de l'instance MatchKeyGeneratorDetail.
      Pour un fichier de sortie texte, créez une instance de FilePath avec les détails pertinents du fichier de sortie en appelant le constructeur approprié. Pour un fichier de sortie ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier de sortie ORC comme argument.
    5. Définissez le nom du job à l'aide du champ jobName de l'instance MatchKeyGeneratorDetail.
  3. Pour créer un job MapReduce, utilisez l'instance de AdvanceMatchFactory précédemment créée pour appeler sa méthode createJob(). Dans ce cas, transmettez l'instance ci-dessus de MatchKeyGeneratorDetail comme argument.
    La méthode createJob() crée le job et renvoie une List d’instances de ControlledJob.
  4. Exécutez le job créé à l’aide d’une instance de JobControl.