Uso de un trabajo Spark de Validate Address Loqate

  1. Cree una instancia de LoqateAddressingFactory con su método estático getInstance().
  2. Proporcione los detalles de entrada y salida del trabajo Validate Address Global mediante la creación de una instancia de LoqateAddressingDetail que especifique el ProcessType. La instancia debe usar el tipo SparkProcessType. Para lograrlo, los pasos son:
    1. Configure los parámetros de entrada mediante la creación de una instancia de LoqateAddressingGeneralConfiguration.
      Use the enum Enum ExhaustedAction.
    2. Configure the necessary database settings by creating an instance ofLoqateAddressingEngineConfiguration and set the various fields.
    3. Configure los parámetros de entrada mediante la creación de una instancia de LoqateAddressingValidateConfiguration.
      Para establecer los valores de los diversos campos de esta instancia, use los enums Enum AcceptanceLevel, Enum CountryCodes, Enum OutputCasing, Enum CountryFormat, Enum ScriptAlphabet, , , y según corresponda.
    4. Establezca los detalles de la ruta de los datos de referencia creando una instancia de LocalReferenceDataPath.
    5. Cree una instancia de LoqateAddressingDetail pasando una instancia del tipo JobConfig, la instancia LocalReferenceDataPath creada y la instancia LoqateAddressingValidateConfiguration creada anteriormente como los argumentos para su constructor.
      El parámetro JobConfig debe ser una instancia de tipo SparkJobConfig.
      1. Establezca los detalles del archivo de entrada mediante el campo inputPath de la instancia LoqateAddressingDetail.

        Para un archivo de entrada de texto, cree una instancia de FilePath con los detalles relevantes del archivo de entrada mediante la invocación del constructor apropiado. Para un archivo de entrada ORC, cree una instancia de OrcFilePath con la ruta del archivo de entrada ORC como argumento.

      2. Establezca los detalles del archivo de salida mediante el campo outputPath de la instancia LoqateAddressingDetail.

        Para un archivo de salida de texto, cree una instancia de FilePath con los detalles relevantes del archivo de salida mediante la invocación del constructor apropiado. Para un archivo de salida ORC, cree una instancia de OrcFilePath con la ruta del archivo de salida ORC como argumento.

      3. Establezca el nombre del trabajo mediante el campo jobName de la instancia LoqateAddressingDetail.
  3. Para crear y ejecutar el trabajo Spark, utilice la instancia anteriormente creada deLoqateAddressingFactory para invocar este métodorunSparkJob(). Aquí, pase la instancia anterior de LoqateAddressingDetail como un argumento.
    El método runSparkJob() ejecuta el trabajo y devuelve unMap de los contadores de informes del trabajo.
  4. Muestre los contadores para ver las estadísticas de generación de informes para el trabajo.