Read from Hive File

Der Schritt Read From Hive File liest Daten aus der ausgewählten Datei, die in einem der folgenden Formate vorliegen kann: ORC, RC, Parquet und Avro.
Verwandte Aufgabe:

Verbinden mit Hadoop: Um den Schritt Read From Hive File verwenden zu können, müssen Sie eine Verbindung zum Hadoop-Dateiserver herstellen. Sobald Sie dies tun, wird der Name, unter dem Sie die Verbindung speichern, als Servername angezeigt.

Registerkarte Dateieigenschaften

Felder Beschreibung
Server Dies gibt an, dass die im Feld Dateiname ausgewählte Datei sich auf dem Hadoop-System befindet.
Anmerkung: Sie müssen eine Verbindung zum Hadoop-Dateiserver herstellen, bevor Sie sie hier verwenden können. Weitere Informationen zum Herstellen einer Verbindung finden Sie unter Verbinden mit Hadoop.
Wenn Sie eine Datei auf dem Hadoop-System auswählen, ist der Servername der Name, den Sie beim Erstellen eines Dateiservers angegeben haben.
Dateiname Gibt den Pfad zur Datei an. Klicken Sie auf die Ellipsenschaltfläche (...), um die gewünschte Datei zu lokalisieren.
Anmerkung: Das Schema einer Eingabedatei wird importiert, sobald Sie zum korrekten Speicherort navigieren und die Datei auswählen. Dieses importierte Schema kann nicht bearbeitet werden.

Sie können die Spalten des Schemas jedoch falls erforderlich umbenennen.

Die ersten 50 Datensätze der Datei werden im Raster Vorschau bei Auswahl der Datei abgerufen.
Dateityp Wählen Sie den Typ der zu lesenden Datei aus:
  • ORC
  • RC
  • Parquet
  • Avro
Anmerkung: Um die Vorschau bei RC-Dateien zu generieren, definieren Sie das Schema auf der Registerkarte Felder und klicken Sie dann auf Vorschau auf der Registerkarte Dateieigenschaften.

Registerkarte Felder

Auf der Registerkarte Felder werden die Namen, Datentypen, Positionen der Felder definiert, wie sie in der Eingabedatei vorliegen. Zudem werden die benutzerdefinierten Namen der Felder definiert. Weitere Informationen finden Sie unter Definieren von Feldern zum Lesen aus einer Hive-Datei.