Uso de un trabajo Spark de Open Name Parser
-
Cree una instancia de
UniversalNameFactory
con su método estáticogetInstance()
. -
Proporcione los detalles de entrada y salida del trabajo Open Name Parser mediante la creación de una instancia de
OpenNameParserDetail
que especifique elProcessType
. La instancia debe usar el tipo SparkProcessType.-
Configure las reglas de Open Name Parser mediante la creación de una instancia de
OpenNameParserConfiguration
. -
Establezca los detalles de la ruta de los datos de referencia y el tipo de ubicación creando una instancia de
ReferenceDataPath
. Consulte Enum ReferenceDataPathLocation. -
Cree una instancia de
OpenNameParserDetail
, mediante el paso de una instancia de tipoJobConfig
y laOpenNameParserConfiguration
y las instanciasReferenceDataPath
creadas con anterioridad como los argumentos para su constructor.El parámetroJobConfig
debe ser una instancia de tipo SparkJobConfig. -
Establezca los detalles del archivo de entrada mediante el campo
inputPath
de la instanciaOpenNameParserDetail
.Para un archivo de entrada de texto, cree una instancia deFilePath
con los detalles relevantes del archivo de entrada mediante la invocación del constructor apropiado. Para un archivo de entrada ORC, cree una instancia deOrcFilePath
con la ruta del archivo de entrada ORC como argumento. -
Establezca los detalles del archivo de salida mediante el campo
outputPath
de la instanciaOpenNameParserDetail
.Para un archivo de salida de texto, cree una instancia deFilePath
con los detalles relevantes del archivo de salida mediante la invocación del constructor apropiado. Para un archivo de salida ORC, cree una instancia deOrcFilePath
con la ruta del archivo de salida ORC como argumento. -
Establezca el nombre del trabajo mediante el campo
jobName
de la instanciaOpenNameParserDetail
.
-
Configure las reglas de Open Name Parser mediante la creación de una instancia de
-
Para crear y ejecutar el trabajo Spark, utilice la instancia anteriormente creada de
UniversalNameFactory
para invocar este métodorunSparkJob()
. Aquí, pase la instancia anterior deOpenNameParserDetail
como un argumento.El métodorunSparkJob()
ejecuta el trabajo y devuelve unMap
de los contadores de informes del trabajo. - Muestre los contadores para ver las estadísticas de generación de informes para el trabajo.