Tri des enregistrements avec Sorter

Le stage Sorter vous permet de trier les enregistrements à l'aide des champs que vous indiquez.

  1. Sous Stages de contrôle, glissez Sorter sur le canevas afin de le placer là où vous le souhaitez sur le flux de données.
  2. Double-cliquez sur Sorter.
  3. Cliquez sur Ajouter.
  4. Cliquez sur la flèche Bas dans la colonne Nom du champ et sélectionnez le champ que vous voulez trier.
    Remarque : La liste des champs disponibles repose sur les champs utilisés dans les stages précédents dans le flux de données.
  5. Dans la colonne Classer, déterminez si vous souhaitez effectuer un tri par ordre croissant ou décroissant.
  6. Dans la colonne Type, sélectionnez le type de données du champ.
    Remarque : Si vos données entrantes ne sont pas au format de chaîne, la colonne Type sera désactivée.
    bigdecimal
    Type de données numérique prenant en charge 38 points de précision décimaux. Utilisez ce type de données pour les données utilisées dans les calculs mathématiques requérant un haut niveau de précision, en particulier ceux impliquant des données financières. Le type de données bigdecimal prend en charge des calculs plus précis que le type de données double.
    double
    Un type de données numérique qui contient à la fois des nombres en double précision négatifs et positifs entre 2-1074 et (2-2-52)×21023. En notation E, la plage de valeurs est comprise entre -1.79769313486232E+308 et 1.79769313486232E+308.
    flottant
    Un type de données numérique contenant des nombres de précision seuls négatifs et positifs entre 2-149 et (2-223)×2127. En notation E, la plage de valeurs est comprise entre -3.402823E+38 et 3.402823E+38.
    integer
    Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -231 (-2,147,483,648) et 231-1 (2,147,483,647).
    long
    Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -263 (-9,223,372,036,854,775,808) et 263-1 (9,223,372,036,854,775,807).
    chaîne
    Séquence de caractères.
  7. Pour supprimer des espaces vides situés avant et après la valeur avant de trier, cochez la case de la colonne Raccourcir. L'option Raccourcir ne modifie pas la valeur du champ. Elle ne raccourcit la valeur que dans l'objectif du tri. Notez bien que si vos données entrantes ne sont pas au format de chaîne, la colonne Raccourcir sera désactivée.
  8. Dans la colonne Traiter nul comme, sélectionnez Le plus grand ou Le plus petit pour indiquer l’emplacement des valeurs null dans la liste triée. Le placement dépend de la combinaison d’options sélectionnées dans les champs Ordre et Traiter nul comme, comme indiqué dans le tableau ci-dessous :
    Ordre Traiter nul comme Placement des valeurs nulles dans la liste triée
    Ascendant Le plus grand En bas de la liste
    Ascendant Le plus petit En haut de la liste
    Descendant Le plus grand En haut de la liste
    Descendant Le plus petit En bas de la liste
  9. Répétez ces étapes tant que vous n'avez pas ajouté tous les champs à trier.
  10. Réorganisez l'ordre de tri de la manière que vous désirez en cliquant sur Vers le haut ou Vers le bas. Cela vous permet d'effectuer d'abord un tri par un champ, puis de trier le résultat par un autre champ.
  11. Pour remplacer les options de performances de tri par défaut ayant été définies par votre administrateur, cliquez sur Avancé, cochez la case Écraser les options de performance du tri, puis spécifiez les options suivantes :
    Limite du nombre d'enregistrement en mémoire
    Spécifie le nombre maximum de rangées de données qu'un trieur peut contenir en mémoire avant que celui-ci commence à pager sur le disque. Par défaut, un tri de 10 000 enregistrements ou moins sera effectué en mémoire et un tri de plus de 10 000 enregistrements sera effectué sur le disque. La limite maximale est de 100 000 enregistrements. En général, un tri en mémoire est beaucoup plus rapide qu'un tri sur le disque ; donc, il faut définir une valeur assez haute pour que la plupart des tris s'effectuent en mémoire et que seuls les groupes de grande taille soient écrits sur le disque.
    Remarque : Soyez conscient du fait qu'au sein d'environnements où des jobs s'exécutent de manière simultanée, une augmentation du paramètre Dans la limite d'enregistrement mémoire augmente la probabilité de ne plus disposer de suffisamment de mémoire.
    Nombre maximal de fichiers temporaires
    Spécifie le nombre maximal de fichiers temporaires pouvant être employés par un processus de tri. L'utilisation d'un plus grand nombre de fichiers temporaires peut améliorer les performances. Cependant, le nombre optimal dépend très largement de la configuration du le serveur qui exécute Spectrum™ Technology Platform. Nous vous conseillons d'essayer différents paramètres et d'observer l'effet de l'utilisation d'un plus ou moins grand nombre de fichiers temporaires sur les performances. Pour calculer le nombre approximatif de fichiers temporaires nécessaires, utilisez l'équation suivante :
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Notez que le nombre maximal de fichiers temporaires ne peut pas être supérieure à 1 000.
    Activer la compression
    Spécifie si les fichiers temporaires sont compressés lors de leur écriture sur le disque.
    Remarque : Les paramètres de performances de tri optimal dépendent de la configuration matérielle de votre serveur. Néanmoins, l'équation suivante produit généralement de bonnes performances de tri :
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
  12. Cliquez sur OK.
    Remarque : Vous pouvez supprimer les critères de tri à votre convenance en surlignant une rangée et en cliquant sur Supprimer.