Cargar a Hive
Apache Hive es una infraestructura de almacén de datos construida sobre Hadoop para proporcionar resumen, consultas y análisis de datos. Si desea consultar la fuente de datos subyacente a través de Hive, utilice su propio lenguaje de consulta, HiveQL.
Hive admite los siguientes formatos de archivo Hadoop:
- TEXTFILE
- SEQUENCE FILE
- ORC
- RCFILE
- PARQUET
- AVRONota: El formato de archivo AVRO se admite en la versión 0.14 y superiores de Hive.
La actividad Cargar a Hive le permite cargar datos a una tabla de Hive por medio de una conexión JDBC. Mediante esta conexión, los datos se leen desde un archivo Hadoop específico y se cargan a una tabla existente o a una tabla nueva en una conexión seleccionada.
Para cargar los datos a una tabla nueva, se debe definir el esquema de la tabla.
Nota: Spectrum no admite datos jerárquicos, aunque Hive sí lo haga.