Sortieren von Datensätzen mithilfe des Sorters

Im Sorter-Schritt können Sie Datensätze mithilfe von angegebenen Feldern sortieren.

  1. Ziehen Sie in den Steuerungsschritten den Sorter auf die Arbeitsfläche, um ihn an einer beliebigen Stelle im Datenfluss zu platzieren.
  2. Doppelklicken Sie auf den Sorter.
  3. Klicken Sie auf Hinzufügen.
  4. Klicken Sie auf den nach unten zeigenden Pfeil in der Spalte Feldname, und wählen Sie das Feld aus, nach dem Sie sortieren möchten.
    Anmerkung: Die Liste der verfügbaren Felder basiert auf den Feldern, die in den vorherigen Schritten im Datenfluss verwendet wurden.
  5. Wählen Sie in der Spalte Sortierung aus, ob Sie in aufsteigender oder absteigender Reihenfolge sortieren möchten.
  6. Wählen Sie in der Spalte Typ den Datentyp des Feldes aus.
    Anmerkung: Wenn Ihre eingehenden Daten nicht im Zeichenfolgenformat sind, wird die Spalte Typ deaktiviert.
    bigdecimal
    Ein numerischer Datentyp, der eine Genauigkeit von 38 Dezimalstellen unterstützt. Verwenden Sie diesen Datentyp für Daten in mathematischen Berechnungen, die einen hohen Grad von Genauigkeit erfordern, speziell solche mit Finanzdaten. Der Datentyp „bigdecimal“ unterstützt genauere Berechnungen als der Datentyp „double“.
    double
    Ein numerischer Datentyp, der sowohl negative als auch positive Zahlen mit doppelter Genauigkeit zwischen 2-1074 und (2-2-52)×21023 enthält. In der E-Notation liegt der Wertebereich bei -1,79769313486232E+308 bis 1,79769313486232E+308.
    float
    Ein numerischer Datentyp, der sowohl negative als auch positive Zahlen mit einzelner Genauigkeit zwischen 2-149 und (2-223)×2127 enthält. In der E-Notation liegt der Wertebereich bei -3,402823E+38 bis 3,402823E+38.
    integer
    Ein numerischer Datentyp, der sowohl positive als auch negative ganze Zahlen zwischen -231 (-2,147,483,648) und 231-1 (2,147,483,647) enthält.
    long
    Ein numerischer Datentyp, der sowohl negative als auch positive ganze Zahlen zwischen -263 (-9.223.372.036.854.775.808) und 263-1 (9.223.372.036.854.775.807) enthält.
    string
    Eine Folge von Zeichen.
  7. Aktivieren Sie das Kästchen in der Spalte Kürzen, um vor dem Sortieren Leerzeichen vor und nach dem Wert zu entfernen. Die Kürzungsoption ändert nicht den Wert des Feldes. Sie kürzt nur den Wert für das Sortieren. Beachten Sie, dass wenn Ihre eingehenden Daten nicht im Zeichenfolgenformat sind, die Spalte Typ deaktiviert wird.
  8. Wählen Sie in der Spalte NULL behandeln als die Optionen Größte oder Kleinste aus, um die Platzierung der Nullwerte in der sortierten Liste anzugeben. Die Platzierung hängt von der Kombination der ausgewählten Optionen in den Feldern Sortierung und NULL behandeln als ab, wie in der unteren Tabelle dargestellt:
    Sortierung NULL behandeln als Platzierung von Nullwerten in der sortieren Liste.
    Aufsteigend Größte Ende der Liste
    Aufsteigend Kleinste Anfang der Liste
    Absteigend Größte Anfang der Liste
    Absteigend Kleinste Ende der Liste
  9. Wiederholen Sie dies, bis Sie alle Felder für die Sortierung hinzugefügt haben.
  10. Mithilfe der Optionen Nach oben oder Nach unten können Sie die Sortierreihenfolge wie gewünscht ändern. Dadurch können Sie zunächst nach einem Feld und die resultierende Sortierung nach einem anderen Feld sortieren.
  11. Wenn Sie die standardmäßigen Sortierleistungsoptionen überschreiben möchten, die von Ihrem Administrator definiert wurden, klicken Sie auf Erweitert, aktivieren Sie das Kästchen Optionen für Sortierleistung außer Kraft setzen und konfigurieren Sie die folgenden Optionen:
    Beschränkung für Datensätze im Arbeitsspeicher
    Gibt die maximale Anzahl von Datenzeilen an, die ein Sorter im Arbeitsspeicher belässt, bevor er sie auf die Festplatte auslagert. Standardmäßig erfolgt eine Sortierung von bis zu 10.000 Datensätze in einem Arbeitsspeicher und eine Sortierung von mehr als 10.000 Datensätzen auf einem Datenträger. Der maximale Wert umfasst 100.000 Datensätze. In der Regel erfolgt eine Sortierung im Arbeitsspeicher deutlich schneller als auf einem Datenträger. Daher sollte hierfür ein Wert festgelegt werden, der hoch genug ist, damit ein Großteil der Sortierungen im Arbeitsspeicher erfolgen kann und nur umfangreiche Datasets auf einen Datenträger geschrieben werden.
    Anmerkung: Vorsicht bei Umgebungen, in denen Aufträge gleichzeitig ausgeführt werden: Durch das Erhöhen der Einstellung Beschränkung für Datensätze im Arbeitsspeicher wird die Wahrscheinlichkeit erhöht, dass nicht mehr genügend Arbeitsspeicher verfügbar ist.
    Maximale Anzahl temporärer Dateien
    Gibt die maximale Anzahl temporärer Dateien an, die von einem Sortiervorgang verwendet werden können. Die Verwendung einer größeren Anzahl temporärer Dateien kann zu einer besseren Leistung führen. Die optimale Anzahl hängt jedoch stark von der Konfiguration des Servers ab, auf dem Spectrum™ Technology Platform ausgeführt wird. Sie sollten mit verschiedenen Einstellungen experimentieren und dabei die Auswirkungen auf die Leistung beobachten, wenn mehr oder weniger temporäre Dateien verwendet werden. Verwenden Sie für die Berechnung der ungefähren Anzahl temporärer Dateien die folgende Gleichung:
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Beachten Sie, dass die maximale Anzahl der temporären Dateien 1.000 nicht überschreiten darf.
    Komprimierung aktivieren
    Gibt an, dass temporäre Dateien komprimiert werden, wenn sie auf die Festplatte geschrieben werden.
    Anmerkung: Welche Einstellungen für die Sortierleistung optimal sind, hängt von der Hardwarekonfiguration Ihres Servers ab. Dennoch wird mit der folgenden Gleichung im Allgemeinen eine gute Sortierleistung erzielt:
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
  12. Klicken Sie auf OK.
    Anmerkung: Sie können die Sortierkriterien wie gewünscht entfernen, indem Sie eine Zeile markieren und auf Entfernen klicken.