Uso de un trabajo Spark de Validate Address Global
-
Cree una instancia de
GlobalAddressingFactory
con su método estáticogetInstance()
. -
Proporcione los detalles de entrada y salida del trabajo Validate Address Global mediante la creación de una instancia de
GlobalAddressingDetail
que especifique elProcessType
. La instancia debe usar el tipo SparkProcessType. Para lograrlo, los pasos son:-
Configure los parámetros de entrada mediante la creación de una instancia de
GlobalAddressingGeneralConfiguration
. -
Establezca los detalles de la ruta de los datos de referencia creando una instancia de
LocalReferenceDataPath
. -
Configure los parámetros de la base de datos necesaria mediante la creación de una instancia de
GlobalAddressingEngineConfiguration
y mediante el paso de la instanciaLocalReferenceDataPath
anterior como argumento.- Establezca el tipo de carga previa en esta instancia mediante el uso del enum Enum PreloadingType.
- Establezca el tipo de base de datos usando Enum DatabaseType.
- Set the supported countries using the Enum CountryCodes.
- Si todos los países son compatibles, establezca el atributo
isAllCountries
en verdadero. Además, especifique la lista de valores Enum CountryCodes separados por coma en el valor de cadenasupportedCountries
.
-
Configure los parámetros de entrada mediante la creación de una instancia de
GlobalAddressingInputConfiguration
.Para establecer los valores de los diversos campos de esta instancia, use los enums Enum CountryCodes, EnumStateProvinceType, Enum CountryType, Enum PreferredScript, Enum PreferredLanguage, Enum Casing, Enum OptimizationLevel, Enum Mode y Enum MatchingScope según corresponda. -
Configure la clave de desbloqueo para los datos como valor de
String
en unaList
. -
Cree una instancia de
GlobalAddressingDetail
mediante el paso de una instancia de tipoJobConfig
y laList
de valores de código de desbloqueo, la instanciaGlobalAddressingEngineConfiguration
y la instanciaGlobalAddressingInputConfiguration
creada anteriormente como los argumentos para su constructor.El parámetroJobConfig
debe ser una instancia de tipo SparkJobConfig.- Configure los parámetros de la base de datos mediante el establecimiento del campo
generalConfiguration
de la instanciaGlobalAddressingDetail
para la instanciaGlobalAddressingGeneralConfiguration
creada anteriormente. - Establezca los detalles del archivo de entrada mediante el campo
inputPath
de la instanciaGlobalAddressingDetail
.Para un archivo de entrada de texto, cree una instancia de
FilePath
con los detalles relevantes del archivo de entrada mediante la invocación del constructor apropiado. Para un archivo de entrada ORC, cree una instancia deOrcFilePath
con la ruta del archivo de entrada ORC como argumento. - Establezca los detalles del archivo de salida mediante el campo
outputPath
de la instanciaGlobalAddressingDetail
.Para un archivo de salida de texto, cree una instancia de
FilePath
con los detalles relevantes del archivo de salida mediante la invocación del constructor apropiado. Para un archivo de salida ORC, cree una instancia deOrcFilePath
con la ruta del archivo de salida ORC como argumento. - Establezca el nombre del trabajo mediante el campo
jobName
de la instanciaGlobalAddressingDetail
.
- Configure los parámetros de la base de datos mediante el establecimiento del campo
-
Configure los parámetros de entrada mediante la creación de una instancia de
-
Para crear y ejecutar el trabajo Spark, utilice la instancia anteriormente creada de
GlobalAddressingFactory
para invocar este métodorunSparkJob()
. Aquí, pase la instancia anterior deGlobalAddressingDetail
como un argumento.El métodorunSparkJob()
ejecuta el trabajo y devuelve unMap
de los contadores de informes del trabajo. - Muestre los contadores para ver las estadísticas de generación de informes para el trabajo.