Utilisation d’un job Validate Address Global MapReduce

  1. Créez une instance de GlobalAddressingFactory à l'aide de sa méthode statique getInstance().
  2. Fournissez les détails d'entrée et de sortie du job Validate Address Global en créant une instance de GlobalAddressingDetail définissant ProcessType. L’instance doit utiliser le type MRProcessType. Pour ce faire, les étapes sont les suivantes :
    1. Configurez les paramètres d’initialisation JVM en créant une instance de GlobalAddressingGeneralConfiguration.
    2. Définissez les détails du chemin d'accès aux données de référence en créant une instance de LocalReferenceDataPath.
    3. Configurez les paramètres de base de données nécessaires en créant une instance de GlobalAddressingEngineConfiguration en transmettant l'instance LocalReferenceDataPath ci-dessus comme argument.
      1. Définissez le type de préchargement dans cette instance à l’aide de l’énumération Énumération PreloadingType.
      2. Définissez le type de base de données à l’aide de Énumération DatabaseType.
      3. Définissez les pays pris en charge à l’aide de Énumération CountryCodes.
      4. Si tous les pays sont pris en charge, définissez l'attribut isAllCountries sur true. Sinon, indiquez la liste séparée par des virgules des valeurs Énumération CountryCodes de la valeur de chaîne supportedCountries.
    4. Configurez les paramètres d’entrée en créant une instance de GlobalAddressingInputConfiguration.
    5. Définissez la clé de déverrouillage des données sous forme de valeur String dans une List.
    6. Créez une instance de GlobalAddressingDetail, en transmettant une instance de type JobConfig, la List des valeurs de code de déverrouillage, l'instance GlobalAddressingEngineConfiguration et l'instance GlobalAddressingInputConfiguration créée précédemment comme arguments à son constructeur.
      Le paramètre JobConfig doit être une instance de type MRJobConfig.
      1. Définissez les configurations d'initialisation JVM en définissant le champ generalConfiguration de l'instance GlobalAddressingDetail sur l'instance GlobalAddressingGeneralConfiguration créée ci-dessus.
      2. Définissez les détails du fichier d'entrée à l'aide du champ inputPath de l'instance GlobalAddressingDetail.

        Pour un fichier d'entrée texte, créez une instance de FilePath avec les détails pertinents du fichier d'entrée en appelant le constructeur approprié. Pour un fichier d'entrée ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier d'entrée ORC comme argument.

      3. Définissez les détails du fichier de sortie à l'aide du champ outputPath de l'instance GlobalAddressingDetail.

        Pour un fichier de sortie texte, créez une instance de FilePath avec les détails pertinents du fichier de sortie en appelant le constructeur approprié. Pour un fichier de sortie ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier de sortie ORC comme argument.

      4. Définissez le nom du job à l'aide du champ jobName de l'instance GlobalAddressingDetail.
  3. Pour créer un job MapReduce, utilisez l'instance de GlobalAddressingFactory précédemment créée pour appeler sa méthode createJob(). Dans ce cas, transmettez l'instance ci-dessus de GlobalAddressingDetail comme argument.
    La méthode createJob() renvoie une List d'instances de ControlledJob.
  4. Exécutez le job créé à l’aide d’une instance de JobControl.
  5. Pour afficher les compteurs de reporting suite à l'exécution correcte d'un job MapReduce, utilisez l'instance précédemment créée GlobalAddressingFactory pour appeler sa méthode getCounters(), en transmettant le job créé comme argument.