Options

Le tableau suivant répertorie les options du stage Filter.

Nom de l'option

Description/Valeurs valides

Grouper par

Indique le champ à utiliser pour créer des groupes d'enregistrements à filtrer. Le stage Filter conservera un ou plusieurs enregistements de chaque groupe, selon la manière dont vous configurez le stage. Si vous avez utilisé un stage de correspondance précédemment dans le flux de données, tel que Interflow Match, Intraflow Match ou Transactional Match, vous devez sélectionner le champ CollectionNumber pour utiliser les collections créées par le stage de correspondance en tant que groupes. Cependant, si vous souhaitez regrouper les enregistrements par un autre champ, choisissez ce dernier ici. Par exemple, si vous souhaitez filtrer tous les enregistrements dotés de la même valeur dans le champ AccountNumber sauf un, vous devez sélectionner AccountNumber.

Trier

Si vous spécifiez un champ dans le champ Grouper par, cochez cette case pour trier les enregistrements par la valeur contenu dans le champ de votre choix. Cette option est activée par défaut.

Avancé

Cliquez sur ce bouton pour indiquer les options de performances du tri. Par défaut, les options de performances du tri spécifiées dans Management Console, qui représentent les options de performances par défaut pour votre système, sont appliquées. Si vous souhaitez remplacer les options de performances par défaut de votre système, cochez la case Écraser les options de performance du tri, puis spécifiez les valeurs que vous souhaitez obtenir dans ces champs :

Limite du nombre d'enregistrement en mémoire
Spécifie le nombre maximum de rangées de données qu'un trieur peut contenir en mémoire avant que celui-ci commence à pager sur le disque. Par défaut, un tri de 10 000 enregistrements ou moins sera effectué en mémoire et un tri de plus de 10 000 enregistrements sera effectué sur le disque. La limite maximale est de 100 000 enregistrements. En général, un tri en mémoire est beaucoup plus rapide qu'un tri sur le disque ; donc, il faut définir une valeur assez haute pour que la plupart des tris s'effectuent en mémoire et que seuls les groupes de grande taille soient écrits sur le disque.
Remarque : Soyez conscient du fait qu'au sein d'environnements où des jobs s'exécutent de manière simultanée, une augmentation du paramètre Dans la limite d'enregistrement mémoire augmente la probabilité de ne plus disposer de suffisamment de mémoire.
Nombre maximal de fichiers temporaires
Spécifie le nombre maximal de fichiers temporaires pouvant être employés par un processus de tri. L'utilisation d'un plus grand nombre de fichiers temporaires peut améliorer les performances. Cependant, le nombre optimal dépend très largement de la configuration du le serveur qui exécute Spectrum™ Technology Platform. Nous vous conseillons d'essayer différents paramètres et d'observer l'effet de l'utilisation d'un plus ou moins grand nombre de fichiers temporaires sur les performances. Pour calculer le nombre approximatif de fichiers temporaires nécessaires, utilisez l'équation suivante :
(NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
Notez que le nombre maximal de fichiers temporaires ne peut pas être supérieure à 1 000.
Activer la compression
Spécifie si les fichiers temporaires sont compressés lors de leur écriture sur le disque.
Remarque : Les paramètres de performances de tri optimal dépendent de la configuration matérielle de votre serveur. Néanmoins, l'équation suivante produit généralement de bonnes performances de tri :
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords

Limiter le nombre d'enregistrements doublons renvoyés

Définit le nombre maximal d'enregistrements renvoyés de chaque groupe. Si vous définissez cette option sur 1, vous pouvez définir des règles de filtre pour déterminer l'enregistrement à renvoyer dans chaque groupe. Si aucune règle n'est définie, le premier enregistrement de chaque collection sera renvoyé et le reste ignoré. Dans ce mode, les règles de filtre définissent l'enregistement qui sera conservé.

Par exemple, si vous définissez une règle dans laquelle l'enregistrement doté du score de correspondance le plus élevé dans un groupe est conservé et que vous définissez cette option sur 1, l'enregistrement doté du score de correspondance le plus élevé dans chaque groupe survivra et les autres enregistrements du groupe seront abandonnés.

Si vous définissez cette option sur une valeur supérieure à un, vous ne pouvez pas spécifier les règles de filtre.

Remarque : Dans l'éventualité où aucun enregistrement de la collection ne répond aux critères de la règle définie, aucun enregistrement du groupe n'est renvoyé.

Supprimer les doublons du groupe

Indique d'utiliser les règles de filtre pour déterminer les enregistrements qui sont enlevés de la collection. Les enregistrements restants dans la collection sont conservés. Quand cette option est sélectionnée, vous devez définir une règle.

Remarque : Si un groupe ne contient qu'un enregistrement, les règles de filtre sont ignorées et l'enregistrement est conservé.

Options de règle

Les règles de filtre déterminent les enregistrements d'un groupe à conserver ou à enlever. Si vous sélectionnez l'option Limiter le nombre d'enregistrements doublons renvoyés, les règles déterminent les enregistrements qui survivent au filtre. Si vous sélectionnez loption Supprimer les doublons du groupe, les règles déterminent les enregistrements qui sont enlevés du flux de données.

Pour ajouter une règle, sélectionnez Règles dans la hiérarchie des règles et cliquez sur Ajouter une règle

Si vous spécifiez plusieurs règles, vous devrez sélectionner un opérateur logique à utiliser entre chaque règle. Choisissez Et si vous souhaitez que la nouvelle règle et la règle précédente soient toutes les deux respectées pour que la condition soit remplie. Sélectionnez Ou isi vous souhaitez que la règle précédente ou la nouvelle règle soit respectée pour que la condition soit remplie.

Remarque : Vous ne pouvez disposer que d'une condition dans un stage Filter. Quand vous sélectionnez Condition dans la hiérarchie de règles, les boutons sont grisés.
Option Description

Nom du champ

Indique le nom du champ de flux de données dont vous souhaitez évaluer la valeur afin de déterminer si l'enregistrement doit être filtré.

Type de champ

Indique le type de données dans le champ. L'un des éléments suivants :

Non-numérique
Choisissez cette option si le champ contient des données non numériques (par exemple, des données de chaîne).
numériques
Choisissez cette option si le champ contient des données numériques (par exemple, double, flottantes, etc.).

Opérateur

Indique le type de comparaison à utiliser pour évaluer le champ. L'un des éléments suivants :

Contient
Détermine si le champ contient la valeur indiquée. Par exemple, « bateau à voile » contient la valeur « bateau ».
Est égal à
Détermine si le champ contient la valeur exacte indiquée.
Est supérieur à
Détermine si la valeur du champ est supérieure à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Supérieur ou Egal à
Détermine si la valeur du champ est supérieure ou égale à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Le plus haut
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus élevée dans le champ. Par exemple, si les champs dans ce groupe contiennent les valeurs 10, 20, 30, et 100, l'enregistrement qui dispose de la valeur 100 est sélectionné. Cette opération ne fonctionne que sur les champs numériques. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Est vide
Détermine si le champ ne contient aucune valeur.
N'est pas vide
Détermine si le champ contient une valeur.
Inférieur à
Détermine si la valeur du champ est inférieure à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Inférieur ou Egal à
Détermine si la valeur du champ est inférieure ou égale à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Le plus long
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus longue (en octets) dans le champ. Par exemple, si le groupe contient les valeurs « Mike » et « Michael », l'enregistrement possédant la valeur « Michael » est choisi. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Le plus bas
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus basse dans le champ. Par exemple, si les champs dans ce groupe contiennent les valeurs 10, 20, 30, et 100, l'enregistrement qui dispose de la valeur 10 est sélectionné. Cette opération ne fonctionne que sur les champs numériques. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Le plus commun
Détermine si la valeur de champ contient la valeur qui se produit le plus fréquemment dans ce champ parmi les enregistrements dans ce groupe. Si deux valeurs, ou plus, sont les plus courantes, aucun action ne sera réalisée.
N'est pas égal
Détermine si la valeur du champ n'est pas égale à la valeur spécifiée.

Type de valeur

Indique le type de valeur à comparer avec la valeur du champ. L'un des éléments suivants :

Remarque : Cette option n'est pas disponible si vous sélectionnez l'opérateur Highest, Lowest ou Longest.
Champ
Choisissez cette option si vous souhaitez comparer une autre valeur du champ de flux de données avec le champ.
Chaîne
Choisissez cette option si vous souhaitez comparer le champ avec une valeur spécifique.
Valeur

Indique la valeur à comparer avec la valeur du champ. Si vous avez sélectionnez Champ dans le champ Type de champ, sélectionnez un champ de flux de données. Si vous avez sélectionné Chaîne dans le champ Type de valeur, tapez la valeur à utiliser dans la comparaison.

Remarque : Cette option n'est pas disponible si vous sélectionnez l'opérateur Highest, Lowest ou Longest.

Exemple de règle de filtre

Cette règle conserve l'enregistrement dans chaque groupe doté de la valeur la plus élevée dans le champ MatchScore. Notez que les options Valeur et Type de valeur ne s'appliquent pas quand l'opérateur est le plus haut ou le plus bas.

Nom du champ = MatchScore
Type de champ = Numérique
Opérateur = Le plus haut

Cette règle conserve l'enregistrement pour lequel la valeur dans AccountNumber est "12345".

Nom du champ = AccountNumber
Type de champ = Numérique
Opérateur = Est égal à
Type de valeur = Chaîne
Valeur = 12345