Creación de una conexión de Hive

  1. Abra la actividad Cargar a Hive.
  2. En el campo Nombre de archivo, ingrese el nombre del archivo que se leerá. Haga clic en Examinar [...] para seleccionar el archivo que se leerá.
  3. En el campo Tipo de archivo, seleccione el formato del archivo que se leerá. El formato de archivo predeterminado que está seleccionado es Delimitado.
    Si el Tipo de archivo seleccionado es Delimitado o Secuencia, se muestran los campos Separador de campo y Separador de registro. De lo contrario, estos campos no aparecen.
  4. En el campo Separador de campo, seleccione el carácter que separa cada campo consecutivo de un registro.
  5. Seleccione la conexión para la base de datos Hive que quiere usar en el campo Conexión.
    1. Para agregar, modificar y eliminar conexiones, haga clic en Administrar.
      Se abre la ventana Administrador de conexión de base de datos.
    2. Haga clic en Agregar para crear una nueva conexión o bien en Modificar para editar una conexión ya existente.
      Se abre la ventana Propiedades de conexión.
    3. Ingrese el Nombre de conexión.
    4. En el campo Controlador de base de datos, seleccione un controlador de base de datos Hive para la conexión.
    5. Especifique todos los detalles de la conexión, concretamente usuario, contraseña, host, puerto, e instancia.
    6. Para probar los detalles de la conexión, haga clic en Probar.
    7. Si la prueba de la conexión tiene éxito, haga clic en Aceptar.
      Se cierra la ventana Propiedades de conexión.
    8. Haga clic en Aceptar.
      Se cierra la ventana Administrador de conexión de base de datos.
  6. En el campo Tabla/Vista, seleccione la tabla en la que desea escribir o ingrese el nombre de una nueva tabla para crearla.
    Si crea una tabla nueva en el campo Tabla/Vista, se activa la casilla de verificación Externa. De lo contrario, si selecciona una tabla existente, la casilla de verificación Externa se mantiene desactivada.
  7. Para crear una tabla externa a la base de datos Hive, marque la casilla de verificación Externa.
    Importante: En caso de tablas externas:
    1. No es posible sobrescribir los registros existentes ni agregar registros nuevos. Solo se permite crear nuevas tablas externas y llenarlas con registros.
    2. Si selecciona un archivo ubicado en una carpeta específica, se seleccionan automáticamente todos los archivos de esa carpeta. Por lo tanto, debe asegurarse de que todos los archivos ubicados en la carpeta especificada tengan el mismo formato.
    Obtenga más información sobre las tablas externas Hive aquí.
  8. Para sobrescribir todos los registros existentes de la tabla, marque la casilla de verificación Sobrescribir. Esto elimina los registros existentes de la tabla seleccionada y traslada los registros leídos desde el archivo hasta la tabla.
  9. La cuadrícula muestra los nombres y tipos de datos de las columnas de la tabla seleccionada.
    Si especificó una nueva tabla en el campo Tabla/Vista, use los botones Agregar, Modificar y Eliminar junto a la cuadrícula para agregar columnas que permitan definir la tabla y especificar sus respectivos tipos de datos. Use los botones Subir y Bajar para especificar la secuencia de las columnas de la tabla.
    Nota: Los botones Agregar, Modificar, Eliminar, Subir y Bajar quedan desactivados si selecciona una tabla existente en el campo Tabla/Vista.
    Importante:
    1. Asegúrese de que los tipos de datos de todos los campos del archivo coincidan con los tipos de datos de las respectivas columnas de la tabla, a menos que todos los tipos de datos sean en cadena. De lo contrario, la carga puede generar datos incongruentes.
    2. Asegúrese de que el número de campos del archivo coincida con el número de columnas de la tabla. De lo contrario, se eliminarán los datos en los campos adicionales del archivo.
    3. Hive acepta nombres de tablas y columnas solo en letra minúscula. Si ingresa los nombres usando Bloq Mayús, Hive las convierte a minúscula. El esquema resultante muestra todos los nombres en letra minúscula.
  10. Haga clic en Aceptar.
Nota: Si decide crear una nueva tabla y definir sus columnas, se crea en tiempo de ejecución. La actividad Cargar a Hive es solo para diseñar la estructura de la tabla. En tiempo de ejecución, se crea la tabla designada y se escriben en ella los datos leídos del archivo.