Opción Agrupar por |
Especifique el campo mediante el cual se creará un único registro Best of Breed combinando un grupo de registros similares. Se crea un registro Best of Breed para cada grupo de registros.
Para un trabajo MapReduce, use los siguientes argumentos:
- Columna Agrupar por
- El nombre de la columna con la que agrupará los registros.
- Cantidad de tareas del reductor
- La cantidad de tareas del reductor requeridas para agrupar los registros.
For a Spark job, pass the arguments:
- Columna Agrupar por
- El nombre de la columna con la que agrupará los registros.
|
Configuración de Best of Breed |
Defina las reglas de la consolidación y de la plantilla con las que se creará el registro Best of Breed para cada grupo de registros similares. |
Archivo de entrada |
For text files:
- Ruta de acceso al archivo
- La ruta del archivo de entrada en la plataforma Hadoop.
- Separador de registro
- El separador de registro que se usa en el archivo de entrada.
- Separador de campo
- El separador que se usa entre dos campos consecutivos de un registro en el archivo de entrada.
- Calificador de texto
- El carácter que se utiliza para demarcar los valores de texto en un archivo delimitado.
- Campos de la fila del encabezado
- Una serie de campos del encabezado del archivo de entrada.
- Omitir la primera fila
- Bandera para indicar si se debe omitir la primera fila mientras se leen los registros del archivo de entrada.
Debe configurarse como verdadero en caso de que la primera fila sea una fila del encabezado.
Atención: Invoke the appropriate constructor ofFilePath .
For ORC format files:
- ORC File Path
- La ruta del archivo de entrada en la plataforma Hadoop.
Common parameters:
- Asignaciones de campos
- A map of key value pairs, with the existing column names as the keys and the desired output column names as the values.
|
Archivo de salida |
For text files:
- Ruta de acceso al archivo
- La ruta del archivo de entrada en la plataforma Hadoop.
- Separador de campo
- El separador que se usa entre dos campos consecutivos de un registro en el archivo de entrada.
Atención: Invoke the appropriate constructor ofFilePath .
For ORC format files:
- ORC File Path
- The path of the output ORC format file on the Hadoop platform.
Common parameters:
- Sobrescribir
- Bandera para indicar si el archivo de salida debe sobrescribir el archivo existente del mismo nombre.
- Crear encabezado de salida
- Bandera para indicar si el archivo del encabezado se debe crear en el servidor Hadoop o no.
|
Nombre de trabajo |
El nombre del trabajo. |
Configuraciones de trabajo |
Las configuraciones de Hadoop para el trabajo. Para un trabajo MapReduce, la instancia debe ser del tipo MRJobConfig. Para un trabajo Spark, la instancia debe ser del tipo SparkJobConfig.
|
Comprimir el resultado |
Bandera para indicar si el resultado se debe comprimir. Configure en verdadero para comprimir el resultado.
|