Erstellen einer Hive-Verbindung

  1. Öffnen Sie die Aktivität „In Hive laden“.
  2. Geben Sie im Feld Feldname den Namen der Datei ein, die gelesen werden soll. Klicken Sie auf „Durchsuchen“ ([...]), um die zu lesende Datei auszuwählen.
  3. Wählen Sie im Feld Dateityp das Format der zu lesenden Datei aus. Das ausgewählte Standarddateiformat lautet Mit Begrenzungszeichen.
    Wenn der ausgewählte Dateityp Mit Begrenzungszeichen oder Sequenz lautet, werden die Felder Feldtrennzeichen und Datensatz-Trennzeichen angezeigt. Andernfalls werden sie nicht angezeigt.
  4. Wählen Sie im Feld Feldtrennzeichen das Zeichen aus, mit dem die aufeinanderfolgenden Felder eines Datensatzes voneinander getrennt werden.
  5. Wählen Sie die im Feld Verbindung die Verbindung für die Hive-Datenbank aus, die Sie verwenden möchten.
    1. Klicken Sie auf Verwalten, um Verbindungen hinzuzufügen, zu ändern und zu löschen.
      Das Fenster „Datenbankverbindungs-Manager“ wird geöffnet.
    2. Klicken Sie auf Hinzufügen, um eine neue Verbindung zu erstellen, oder auf Ändern, um eine vorhandene Verbindung zu bearbeiten.
      Das Fenster „Verbindungseigenschaften“ wird geöffnet.
    3. Geben Sie den Verbindungsnamen ein.
    4. Wählen Sie im Feld Datenbanktreiber einen Hive-Datenbanktreiber für die Verbindung aus.
    5. Geben Sie alle Details der Verbindung an, sprich Benutzer, Kennwort, Host, Port und Instanz.
    6. Klicken Sie auf Testen, um die Verbindungsdetails zu testen.
    7. Klicken Sie auf OK, wenn der Verbindungstest erfolgreich war.
      Das Fenster „Verbindungseigenschaften“ wird geschlossen.
    8. Klicken Sie auf OK.
      Das Fenster „Datenbankverbindungs-Manager“ wird geschlossen.
  6. Wählen Sie im Feld Tabelle/Ansicht die Tabelle aus, in die Sie schreiben möchten, oder geben Sie den Namen einer neuen Tabelle ein, die erstellt werden soll.
    Wenn Sie im Feld Tabelle/Ansicht eine neue Tabelle erstellen, wird das Kästchen Extern aktiviert. Andernfalls, wenn Sie eine vorhandene Tabelle auswählen, bleibt das Kästchen Extern deaktiviert.
  7. Aktivieren Sie das Kästchen Extern, um die neue externe Tabelle der Hive-Datenbank zu erstellen.
    Wichtig: Bei externen Tabellen:
    1. Vorhandene Datensätze können nicht überschrieben werden, und neue Datensätze können nicht hinzugefügt werden. Sie können nur neue externe Tabellen erstellen und diese mit Datensätzen auffüllen.
    2. Wenn Sie eine Datei aus einem bestimmten Ordner auswählen, werden automatisch alle Dateien aus diesem Ordner ausgewählt. Stellen Sie daher sicher, dass alle Dateien in diesem bestimmten Ordner das richtige Format haben.
    Weitere Informationen zu externen Hive-Tabellen finden Sie hier.
  8. Aktivieren Sie das Kästchen Überschreiben, um alle vorhandenen Datensätze der Tabelle zu überschreiben. Dadurch werden vorhandene Datensätze der ausgewählten Tabelle gelöscht und die aus der Datei gelesenen Datensätze zur Tabelle hinzugefügt.
  9. Im Raster werden die Namen und Datentypen der Spalten der ausgewählten Tabelle angezeigt.
    Wenn Sie im Feld Tabelle/Ansicht eine neue Tabelle angegeben haben, verwenden Sie die Schaltflächen Hinzufügen, Ändern und Entfernen neben dem Raster, um Spalten zum Definieren der Tabelle hinzuzufügen, und geben Sie die entsprechenden Datentypen an. Verwenden Sie die Schaltflächen Nach oben und Nach unten, um die Reihenfolge der Tabellenspalten anzugeben.
    Anmerkung: Die Schaltflächen Hinzufügen, Ändern, Entfernen, Nach oben und Nach unten bleiben deaktiviert, wenn Sie im Feld Tabelle/Ansicht eine vorhandene Tabelle auswählen.
    Wichtig:
    1. Stellen Sie sicher, dass die Datentypen aller Felder in der Datei den Datentypen in den entsprechenden Tabellenspalten entsprechen, sofern nicht alle Datentypen vom Typ „Zeichenfolge“ sind. Andernfalls kann das Laden von Daten dazu führen, dass die Daten inkonsistent sind.
    2. Stellen Sie sicher, dass die Anzahl der Felder in der Datei der Anzahl der Tabellenspalten entspricht. Andernfalls werden die Daten in den zusätzlichen Feldern in der Datei gelöscht.
    3. Hive akzeptiert nur kleingeschriebene Tabellen- und Spaltennamen. Wenn Sie die Namen in Druckbuchstaben schreiben, wandelt Hive diese in Kleinbuchstaben um. Im resultierenden Schema werden alle Namen in Kleinbuchstaben angezeigt.
  10. Klicken Sie auf OK.
Anmerkung: Wenn Sie sich für die Erstellung einer neuen Tabelle entschieden haben und die zugehörigen Spalten definieren, wird die gleiche Tabelle zur Laufzeit erstellt. Die Aktivität In Hive laden dient nur zum Entwerfen der Tabellenstruktur. Zur Laufzeit wird die entworfene Tabelle erstellt und die aus der Datei gelesenen Daten werden in die Tabelle geschrieben.