Options

  1. Dans le champ Charger une règle de rapprochement, sélectionnez une des règles de correspondance prédéfinies que vous pouvez utiliser tel quel ou modifier pour répondre à vos besoins. Si vous souhaitez créer une nouvelle règle de correspondance sans utiliser une des règles de correspondance prédéfinies comme point de départ, cliquez sur Nouveau. Vous ne pouvez disposer que d'une règle personnalisée dans un flux de données.
    Remarque : La fonction Options de flux de données dans Enterprise Designer permet d'afficher la règle de correspondance pour la configuration au moment de l'exécution.
  2. Cliquez sur Grouper par pour sélectionner un champ à utiliser pour grouper les champs dans la file de correspondance. La Correspondance intra-flux n'essaie de faire correspondre que les enregistrements de la même file de correspondance.
  3. Cochez la case Trier pour réaliser un tri de pré-rapprochement de votre entrée en fonction du champ sélectionné dans le champ Grouper par.
  4. Cliquez sur Avancé pour indiquer d'autres options de performances du tri.
    Limite du nombre d'enregistrement en mémoire
    Spécifie le nombre maximum de rangées de données qu'un trieur peut contenir en mémoire avant que celui-ci commence à pager sur le disque. Par défaut, un tri de 10 000 enregistrements ou moins sera effectué en mémoire et un tri de plus de 10 000 enregistrements sera effectué sur le disque. La limite maximale est de 100 000 enregistrements. En général, un tri en mémoire est beaucoup plus rapide qu'un tri sur le disque ; donc, il faut définir une valeur assez haute pour que la plupart des tris s'effectuent en mémoire et que seuls les groupes de grande taille soient écrits sur le disque.
    Remarque : Soyez conscient du fait qu'au sein d'environnements où des jobs s'exécutent de manière simultanée, une augmentation du paramètre Dans la limite d'enregistrement mémoire augmente la probabilité de ne plus disposer de suffisamment de mémoire.
    Nombre maximal de fichiers temporaires
    Spécifie le nombre maximal de fichiers temporaires pouvant être employés par un processus de tri. L'utilisation d'un plus grand nombre de fichiers temporaires peut améliorer les performances. Cependant, le nombre optimal dépend très largement de la configuration du le serveur qui exécute Spectrum™ Technology Platform. Nous vous conseillons d'essayer différents paramètres et d'observer l'effet de l'utilisation d'un plus ou moins grand nombre de fichiers temporaires sur les performances. Pour calculer le nombre approximatif de fichiers temporaires nécessaires, utilisez l'équation suivante :
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Notez que le nombre maximal de fichiers temporaires ne peut pas être supérieure à 1 000.
    Activer la compression
    Spécifie si les fichiers temporaires sont compressés lors de leur écriture sur le disque.
    Remarque : Les paramètres de performances de tri optimal dépendent de la configuration matérielle de votre serveur. Néanmoins, l'équation suivante produit généralement de bonnes performances de tri :
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
  5. Cliquez sur Rapprochement express sur pour effectuer une comparaison initiale des valeurs de clé express pour déterminer si les deux enregistrements sont considérés comme correspondants.
    Vous pouvez créer une clé express en créant une clé de correspondance dans le MatchKeyGenerator. Pour plus d'informations, reportez-vous à la section Match Key Generator.
  6. Dans la zone de texte Numéro de collection initial, indiquez le numéro de départ à assigner au champ du numéro de collection pour les enregistrements doublons.

    Le numéro de collection identifie chaque enregistrement doublon dans une file de correspondance. Les enregistrements uniques se voient assigner un numéro de collection de 0. Chaque enregistrement doublon se voit assigner un numéro de collection débutant pas la valeur indiquée dans l'encadré Numéro de collection initial.

  7. Cliquez sur Fenêtre coulissante pour activer cette méthode de correspondance. Pour plus d'informations sur la fenêtre coulissante, voir Méthode de correspondance de fenêtre coulissante
  8. Cliquez sur Générer des données pour l'analyse pour générer des résultats de correspondance. Pour plus d'informations, voir Analyse des résultats de correspondance.
  9. L'option Affecter le numéro de collection 0 aux enregistrements uniques, sélectionnée par défaut, affectera le numéro de collection 0 aux enregistrements uniques. Désélectionnez cette option pour générer des numéros de collection autre que zéro pour les enregistrements uniques. Les numéros de collection d'enregistrement unique suivront tout autre numéro de collection. Par exemple, si votre flux de données de correspondance trouve cinq enregistrements et que les trois premiers sont uniques, les numéros de collection seront assignés comme indiqué dans le premier groupe ci-dessous. Si votre flux de données de correspondance trouve cinq enregistrements et que les deux derniers sont uniques, les numéros de collection seront assignés comme indiqué dans le second groupe ci-dessous.
    Option Description
    Numéro du groupe Type d'enregistrement
    1 Unique
    2 Unique
    3 Unique
    4 Doublon/Suspect
    4 Doublon/Suspect
       
    Numéro du groupe Type d'enregistrement
    1 Doublon/Suspect
    1 Doublon/Suspect
    2 Unique
    3 Unique
    4 Unique
    Si vous laissez cette case cochée, tout enregistrement unique trouvé dans votre flux de données sera affecté à un numéro de collection de zéro par défaut.
  10. Pour plus d'informations sur la modification des autres options, voir Création d'une règle de correspondance.
  11. Cliquez sur Évaluer pour évaluer le score d'un enregistrement suspect par rapport aux enregistrements du candidat. Pour plus d'informations, voir Interflow Match.