Options

Le tableau répertorie les options du stage Duplicate Synchronization.

Nom de l'option

Description/Valeurs valides

Grouper par

Indique le champ à utiliser pour créer des groupes d'enregistrements à synchroniser. Si vous avez utilisé un stage de correspondance précédemment dans le flux de données, tel que Interflow Match, Intraflow Match ou Transactional Match, vous devez sélectionner le champ CollectionNumber pour utiliser les collections créées par le stage de correspondance en tant que groupes. Cependant, si vous souhaitez regrouper les enregistrements par un autre champ, choisissez ce dernier ici. Par exemple, si vous souhaitez synchroniser les enregistrements dotés de la même valeur dans le champ AccountNumber, vous devez sélectionner AccountNumber.

Trier

Si vous spécifiez un champ dans le champ Grouper par, cochez cette case pour trier les enregistrements par la valeur contenu dans le champ de votre choix. Cette option est activée par défaut.

Avancé

Cliquez sur ce bouton pour indiquer les options de performances du tri. Par défaut, les options de performances du tri spécifiées dans Management Console, qui représentent les options de performances par défaut pour votre système, sont appliquées. Si vous souhaitez remplacer les options de performances par défaut de votre système, cochez la case Écraser les options de performance du tri, puis spécifiez les valeurs que vous souhaitez obtenir dans ces champs :

Limite du nombre d'enregistrement en mémoire
Spécifie le nombre maximum de rangées de données qu'un trieur peut contenir en mémoire avant que celui-ci commence à pager sur le disque. Par défaut, un tri de 10 000 enregistrements ou moins sera effectué en mémoire et un tri de plus de 10 000 enregistrements sera effectué sur le disque. La limite maximale est de 100 000 enregistrements. En général, un tri en mémoire est beaucoup plus rapide qu'un tri sur le disque ; donc, il faut définir une valeur assez haute pour que la plupart des tris s'effectuent en mémoire et que seuls les groupes de grande taille soient écrits sur le disque.
Remarque : Soyez conscient du fait qu'au sein d'environnements où des jobs s'exécutent de manière simultanée, une augmentation du paramètre Dans la limite d'enregistrement mémoire augmente la probabilité de ne plus disposer de suffisamment de mémoire.
Nombre maximal de fichiers temporaires
Spécifie le nombre maximal de fichiers temporaires pouvant être employés par un processus de tri. L'utilisation d'un plus grand nombre de fichiers temporaires peut améliorer les performances. Cependant, le nombre optimal dépend très largement de la configuration du le serveur qui exécute Spectrum™ Technology Platform. Nous vous conseillons d'essayer différents paramètres et d'observer l'effet de l'utilisation d'un plus ou moins grand nombre de fichiers temporaires sur les performances. Pour calculer le nombre approximatif de fichiers temporaires nécessaires, utilisez l'équation suivante :
(NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
Notez que le nombre maximal de fichiers temporaires ne peut pas être supérieure à 1 000.
Activer la compression
Spécifie si les fichiers temporaires sont compressés lors de leur écriture sur le disque.
Remarque : Les paramètres de performances de tri optimal dépendent de la configuration matérielle de votre serveur. Néanmoins, l'équation suivante produit généralement de bonnes performances de tri :
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords

Règles

Les règles Duplicate Synchronization déterminent les enregistrements dont les données doivent être copiées dans tous les autres enregistrements de la collection.

Pour ajouter une règle, sélectionnez Règles dans la hiérarchie des règles et cliquez sur Ajouter une règle

Si vous spécifiez plusieurs règles, vous devrez sélectionner un opérateur logique à utiliser entre chaque règle. Choisissez Et si vous souhaitez que la nouvelle règle et la règle précédente soient toutes les deux respectées pour que la condition soit remplie. Sélectionnez Ou isi vous souhaitez que la règle précédente ou la nouvelle règle soit respectée pour que la condition soit remplie.

Option Description

Nom de champ

Indique le nom du champ de flux de données dont vous souhaitez évaluer la valeur afin de déterminer si l'enregistrement doit être filtré.

Type de champ

Indique le type de données dans le champ. L'un des éléments suivants :

Non-numérique
Choisissez cette option si le champ contient des données non numériques (par exemple, des données de chaîne).
numériques
Choisissez cette option si le champ contient des données numériques (par exemple, double, flottantes, etc.).

Opérateur

Indique le type de comparaison à utiliser pour évaluer le champ. L'un des éléments suivants :

Contient
Détermine si le champ contient la valeur indiquée. Par exemple, « bateau à voile » contient la valeur « bateau ».
Est égal à
Détermine si le champ contient la valeur exacte indiquée.
Est supérieur à
Détermine si la valeur du champ est supérieure à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Supérieur ou Egal à
Détermine si la valeur du champ est supérieure ou égale à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Le plus haut
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus élevée dans le champ. Par exemple, si les champs dans ce groupe contiennent les valeurs 10, 20, 30, et 100, l'enregistrement qui dispose de la valeur 100 est sélectionné. Cette opération ne fonctionne que sur les champs numériques. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Est vide
Détermine si le champ ne contient aucune valeur.
N'est pas vide
Détermine si le champ contient une valeur.
Inférieur à
Détermine si la valeur du champ est inférieure à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Inférieur ou Egal à
Détermine si la valeur du champ est inférieure ou égale à la valeur spécifiée. Cette opération ne fonctionne que sur les champs numériques.
Le plus long
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus longue (en octets) dans le champ. Par exemple, si le groupe contient les valeurs « Mike » et « Michael », l'enregistrement possédant la valeur « Michael » est choisi. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Le plus bas
Compare la valeur du champ pour tout le groupe d'enregistrements et identifie l'enregistrement qui possède la valeur la plus basse dans le champ. Par exemple, si les champs dans ce groupe contiennent les valeurs 10, 20, 30, et 100, l'enregistrement qui dispose de la valeur 10 est sélectionné. Cette opération ne fonctionne que sur les champs numériques. Si plusieurs enregistrements sont à égalité pour la valeur la plus longue, un enregistrement est sélectionné.
Le plus commun
Détermine si la valeur de champ contient la valeur qui se produit le plus fréquemment dans ce champ parmi les enregistrements dans ce groupe. Si deux valeurs, ou plus, sont les plus courantes, aucun action ne sera réalisée.
N'est pas égal
Détermine si la valeur du champ n'est pas égale à la valeur spécifiée.

Type de valeur

Indique le type de valeur à comparer avec la valeur du champ. L'un des éléments suivants :

Remarque : Cette option n'est pas disponible si vous sélectionnez l'opérateur Highest, Lowest ou Longest.
Champ
Choisissez cette option si vous souhaitez comparer une autre valeur du champ de flux de données avec le champ.
Chaîne
Choisissez cette option si vous souhaitez comparer le champ avec une valeur spécifique.
Valeur

Indique la valeur à comparer avec la valeur du champ. Si vous avez sélectionnez Champ dans le champ Type de champ, sélectionnez un champ de flux de données. Si vous avez sélectionné Chaîne dans le champ Type de valeur, tapez la valeur à utiliser dans la comparaison.

Remarque : Cette option n'est pas disponible si vous sélectionnez l'opérateur Highest, Lowest ou Longest.

Actions

Les actions déterminent le champ à copier dans les autres enregistrements du groupe. Pour ajouter une action, sélectionnez Actions dans l'aborescence de la condition Duplicate Synchronization, puis cliquez sur Ajouter une action. Utilisez les options suivantes pour définir l'action.

Option Description

Type de la source

Spécifie le type de données à copier dans les autres enregistrements du groupe. Un des éléments suivants.

Champ
Choisissez cette option si vous souhaitez copier une valeur d'un champ dans d'autres enregistrements du groupe.
Chaîne
Choisissez cette option si vous souhaitez copier une valeur constante dans les autres enregistrements du groupe.

Données sources

Spécifie les données à copier dans les autres enregistrements du groupe. Si le type de source est Champ, sélectionnez le champ dont vous souhaitez copier la valeur dans les autres enregistrements du groupe. Si le type source est Chaîne, indiquez une valeur constante à copier dans les autres enregistrements du groupe.
Remarque : Dans le cas où les données sources ont une valeur null, elles ne sont pas copiées dans les autres enregistrements du groupe. Les autres enregistrements conservent leurs valeurs d'origine.

Cible

Spécifie le champ des autres enregistrements dans lequel vous souhaitez copier les données indiquées dans le champ Données source. Par exemple, si vous souhaitez copier les données dans le champ AccountBalance de tous les autres enregistrements du groupe, vous devez indiquer AccountBalance.

Exemple de règle et d'action Duplicate Synchronization

Cette règle et action Duplicate Synchronization sélectionne l'enregistrement doté d'un score de correspondance de 100 et copie le champ AccountNumber de numéro de compte dans tous les autres enregistrements du groupe.

Règle
Nom du champ : MatchScore
Type de champ : Numérique
Opérateur : Est égal
Type de valeur : Chaîne
Valeur : 100

Action
Type de source : Champ
Données source : AccountNumber
Destination : NewAccountNumber