Parámetros de entrada

Parámetro Descripción
Configuración del motor de Validate Address Global To set configurations for performing the validations:
  1. Verbose
  2. Tool Info
  3. Output Address Format
  4. Log Input
  5. {"output": [{
  6. Log File Name
  7. Match Score Absolute Threshold
  8. Match Score Threshold Factor
  9. Postal Code Max Results
  10. Strict Reference Match
Validate Address Loqate Validate Configuration Para configurar estos parámetros para la entrada:
  1. Include Standard Address
  2. Incluir elementos de dirección cruzados
  3. Incluir elementos de dirección de entrada estandarizados
  4. Obtener bloques de datos de dirección
  5. Mayúsculas y minúsculas de salida
  6. Incluir códigos de resultado para campos individuales
  7. Obtener múltiples direcciones
  8. Failed On Multi Match Found
  9. Multiple Address Count
  10. Formato de país
  11. País predeterminado
  12. Secuencia de comandos/Alfabeto:
  13. Devolver campos de dirección geocodificados
  14. Nivel de aceptación
  15. Puntuación mínima de coincidencia
  16. Dar formato a datos mediante convenciones de AMAS
  17. Is Duplicate Handling
  18. Single Field Duplicate Handling
  19. Multi Field Duplicate Handling
  20. Non Standard Field Duplicate Handling
  21. Output Field Duplicate Handling
Configuración general de Validate Address Global To set JVM configurations:
  1. Maximum Idle Objects
  2. Minimum Idle Objects
  3. Maximum Active Objects
  4. Maximum Wait Time
  5. Action When Exhausted
  6. Test on Borrow
  7. Test on Return
  8. Test While Idle
  9. Time Between Eviction Runs in Milliseconds
  10. Number of Tests Per Eviction Run
  11. Min Evictable Idle Time in Milliseconds
Ruta de acceso de datos de referencia Para especificar los detalles de la ruta de acceso de Datos de referencia.
Nota: Para los trabajos de UAM, los datos de referencia deben estar colocados solo en nodos de datos locales en el clúster.
Configuraciones de trabajo Las configuraciones de Hadoop para el trabajo.

Para un trabajo MapReduce, la instancia debe ser del tipo MRJobConfig. Para un trabajo Spark, la instancia debe ser del tipo SparkJobConfig.

Archivo de entrada For text files:
Ruta de acceso al archivo
La ruta del archivo de entrada en la plataforma Hadoop.
Separador de registro
El separador de registro que se usa en el archivo de entrada.
Separador de campo
El separador que se usa entre dos campos consecutivos de un registro en el archivo de entrada.
Calificador de texto
El carácter que se utiliza para demarcar los valores de texto en un archivo delimitado.
Campos de la fila del encabezado
Una serie de campos del encabezado del archivo de entrada.
Omitir la primera fila
Bandera para indicar si se debe omitir la primera fila mientras se leen los registros del archivo de entrada.

Debe configurarse como verdadero en caso de que la primera fila sea una fila del encabezado.

Atención: Invoke the appropriate constructor ofFilePath.
For ORC format files:
ORC File Path
La ruta del archivo de entrada en la plataforma Hadoop.
Common parameters:
Asignaciones de campos
A map of key value pairs, with the existing column names as the keys and the desired output column names as the values.
Archivo de salida For text files:
Ruta de acceso al archivo
La ruta del archivo de entrada en la plataforma Hadoop.
Separador de campo
El separador que se usa entre dos campos consecutivos de un registro en el archivo de entrada.
Atención: Invoke the appropriate constructor ofFilePath.
For ORC format files:
ORC File Path
The path of the output ORC format file on the Hadoop platform.
Common parameters:
Sobrescribir
Bandera para indicar si el archivo de salida debe sobrescribir el archivo existente del mismo nombre.
Crear encabezado de salida
Bandera para indicar si el archivo del encabezado se debe crear en el servidor Hadoop o no.
Nombre de trabajo El nombre del trabajo.