Utilisation d’un job Validate Address Loqate Spark

  1. Créez une instance de LoqateAddressingFactory à l'aide de sa méthode statique getInstance().
  2. Fournissez les détails d'entrée et de sortie du job Validate Address Loqate en créant une instance de LoqateAddressingDetail définissant ProcessType. L’instance doit utiliser le type SparkProcessType. Pour ce faire, les étapes sont les suivantes :
    1. Configurez les paramètres d’initialisation JVM en créant une instance de LoqateAddressingGeneralConfiguration.
      Utilisez l’énumération Énumération ExhaustedAction.
    2. Configurez les paramètres de base de données nécessaires en créant une instance de LoqateAddressingEngineConfiguration et définissez les différents champs.
    3. Configurez les paramètres de validation d'adresse en créant une instance de LoqateAddressingValidateConfiguration.
      Pour définir les valeurs des différents champs de cette instance, utilisez les énumérations Énumération AcceptanceLevel, Énumération CountryCodes, Énumération OutputCasing, Énumération CountryFormat et Énumération ScriptAlphabet.
    4. Définissez les détails du chemin d'accès aux données de référence en créant une instance de LocalReferenceDataPath.
    5. Créez une instance de LoqateAddressingDetail en transmettant une instance de type JobConfig, l'instance LocalReferenceDataPath et l'instance LoqateAddressingValidateConfiguration créée ci-dessus comme arguments à son constructeur.
      Le paramètre JobConfig doit être une instance de type SparkJobConfig.
      1. Définissez les détails du fichier d'entrée à l'aide du champ inputPath de l'instance LoqateAddressingDetail.

        Pour un fichier d'entrée texte, créez une instance de FilePath avec les détails pertinents du fichier d'entrée en appelant le constructeur approprié. Pour un fichier d'entrée ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier d'entrée ORC comme argument.

      2. Définissez les détails du fichier de sortie à l'aide du champ outputPath de l'instance LoqateAddressingDetail.

        Pour un fichier de sortie texte, créez une instance de FilePath avec les détails pertinents du fichier de sortie en appelant le constructeur approprié. Pour un fichier de sortie ORC, créez une instance de OrcFilePath avec le chemin d’accès au fichier de sortie ORC comme argument.

      3. Définissez le nom du job à l'aide du champ jobName de l'instance LoqateAddressingDetail.
  3. Pour créer et exécuter le job Spark, utilisez l'instance de LoqateAddressingFactory précédemment créée pour appeler sa méthode runSparkJob(). Dans ce cas, transmettez l'instance ci-dessus de LoqateAddressingDetail comme argument.
    La méthode runSparkJob() exécute le job et renvoie une Map des compteurs de reporting du job.
  4. Affichez les compteurs pour voir les statistiques de reporting du job.