Definieren von Feldern zum Schreiben in eine Hive-Datei

Auf der Registerkarte Felder des Schrittes Write to Hive File werden die Schemanamen und Datentypen der Felder in den Eingabedaten des Schrittes aufgelistet.

  1. Um die gewünschten Felder der Eingabedaten oder eine vorhandene Datei auszuwählen, klicken Sie auf Schnell hinzufügen.
    1. Wählen Sie die jeweiligen Felder der Eingabedaten aus.
    2. Klicken Sie auf OK.
  2. Klicken Sie zum Hinzufügen neuer Felder auf Hinzufügen.
    1. Geben Sie den Namen des Feldes ein.
    2. Geben Sie den Typ des Feldes ein. Der Schritt unterstützt die folgenden Datentypen:
      boolean
      Ein logischer Typ mit zwei Werten: wahr und falsch.
      date
      Ein Datentyp, der einen Monat, einen Tag und ein Jahr enthält. Beispiel: 2012-01-30 oder 30. Januar 2012. Sie können ein standardmäßiges Datumsformat in der Management Console angeben.
      datetime
      Ein Datentyp, der Tag, Monat, Jahr und Stunden, Minuten und Sekunden enthält. Beispiel: 30.01.2012 18:15:00.
      Anmerkung: In Parquet-Dateien werden die Datentypen datetime und time als String zugeordnet. In RC-Dateien wird der Datentyp datetime als timestamp zugeordnet.
      double
      Ein numerischer Datentyp, der sowohl negative als auch positive Zahlen mit doppelter Genauigkeit zwischen 2-1074 und (2-2-52)×21023 enthält. In der E-Notation liegt der Wertebereich bei -1,79769313486232E+308 bis 1,79769313486232E+308.
      float
      Ein numerischer Datentyp, der sowohl negative als auch positive Zahlen mit einzelner Genauigkeit zwischen 2-149 und (2-223)×2127 enthält. In der E-Notation liegt der Wertebereich bei -3,402823E+38 bis 3,402823E+38.
      integer
      Ein numerischer Datentyp, der sowohl positive als auch negative ganze Zahlen zwischen -231 (-2,147,483,648) und 231-1 (2,147,483,647) enthält.
      bigdecimal
      Ein numerischer Datentyp, der eine Genauigkeit von 38 Dezimalstellen unterstützt. Verwenden Sie diesen Datentyp für Daten in mathematischen Berechnungen, die einen hohen Grad von Genauigkeit erfordern, speziell solche mit Finanzdaten. Der Datentyp „bigdecimal“ unterstützt genauere Berechnungen als der Datentyp „double“.
      Anmerkung: Für RC-, Avro- und Parquet-Hive-Dateien wird der Datentyp bigdecimal in den Datentyp decimal mit Genauigkeit 38 und Dezimalstellenzahl 10 konvertiert.
      long
      Ein numerischer Datentyp, der sowohl negative als auch positive ganze Zahlen zwischen -263 (-9.223.372.036.854.775.808) und 263-1 (9.223.372.036.854.775.807) enthält.
      Anmerkung: In RC-Dateien wird der Datentyp long als Datentyp bigint zugeordnet.
      string
      Eine Folge von Zeichen.
    3. Geben Sie in das Feld Position die Position dieses Feldes innerhalb des Datensatzes ein.

      Beispiel: In dieser Eingabedatei ist „AddressLine1“ an Position 1, „City“ an Position 2, „StateProvince“ an Position 3 und „PostalCode“ an Position 4.

      "AddressLine1"|"City"|"StateProvince"|"PostalCode"
      "7200 13TH ST"|"MIAMI"|"FL"|"33144"
      "One Global View"|"Troy"|"NY"|12180
  3. Wenn Sie eine vorhandene Datei überschreiben, klicken Sie auf Erneut generieren, um das Schema aus der vorhandenen Datei zu übernehmen, und ändern Sie es dann.
    Dadurch wird bei ORC- und Parquet-Ausgabedateien das Schema auf Basis der Metadaten der vorhandenen Datei generiert. Bei RC-Ausgabedateien müssen Sie die Felder explizit hinzufügen, um vorhandene Felder zu überschreiben.

    In der Spalte Name werden die Namen der verschiedenen Spalten der Eingabedaten aufgelistet. In der Spalte Typ werden die Datentypen der jeweiligen Felder der Eingabedaten aufgelistet.

    Anmerkung: Beim Dateityp Parquet gibt eine weitere Spalte, NULL zulassen, an, ob im Feld Nullwerte zugelassen sind oder nicht. Sie können dieses Kästchen für ein bestimmtes Feld aktivieren, damit dieses Nullwerte enthalten darf, oder es andernfalls deaktivieren.
  4. Sie können die Namen, Datentypen und die Reihenfolge der ausgewählten Spalten in der Ausgabe mit den Schaltflächen unten ändern:

    Name der Option

    Beschreibung

    Hinzufügen

    Fügt der Ausgabe ein Feld hinzu.

    Ändern

    Ändert den Namen und Datentyp des Feldes.

    Entfernen

    Entfernt das ausgewählte Feld aus der Ausgabe.

    Nach oben/Nach unten

    Ordnet die Position des ausgewählten Feldes in der Ausgabe neu an.

  5. Klicken Sie auf OK.