Uso de un trabajo Spark de Match Key Generator

  1. Cree una instancia de AdvanceMatchFactory con su método estático getInstance().
  2. Proporcione los detalles de entrada y salida del trabajo Match Key Generator creando una instancia de MatchKeyGeneratorDetail que especifique el ProcessType. La instancia debe usar el tipo SparkProcessType.
    1. Especifique las configuraciones de la clave de cruce para realizar el cruce creando y configurando una instancia de MatchKeySettings. Para obtener más información, consulte el código de muestra correspondiente.
    2. Cree una instancia de MatchKeyGeneratorDetail pasando una instancia del tipo JobConfig y la instancia MatchKeySettings creada como los argumentos para su constructor.
      El parámetro JobConfig debe ser una instancia de tipo SparkJobConfig.
    3. Establezca los detalles del archivo de entrada mediante el campo inputPath de la instancia MatchKeyGeneratorDetail.
      Para un archivo de entrada de texto, cree una instancia de FilePath con los detalles relevantes del archivo de entrada mediante la invocación del constructor apropiado. Para un archivo de entrada ORC, cree una instancia de OrcFilePath con la ruta del archivo de entrada ORC como argumento.
    4. Establezca los detalles del archivo de salida mediante el campo outputPath de la instancia MatchKeyGeneratorDetail.
      Para un archivo de salida de texto, cree una instancia de FilePath con los detalles relevantes del archivo de salida mediante la invocación del constructor apropiado. Para un archivo de salida ORC, cree una instancia de OrcFilePath con la ruta del archivo de salida ORC como argumento.
    5. Establezca el nombre del trabajo mediante el campo jobName de la instancia MatchKeyGeneratorDetail.
  3. Para crear y ejecutar el trabajo Spark, utilice la instancia anteriormente creada deAdvanceMatchFactory para invocar este métodorunSparkJob(). Aquí, pase la instancia anterior de MatchKeyGeneratorDetail como un argumento.
    El método runSparkJob() ejecuta el trabajo y devuelve unMap de los contadores de informes del trabajo.