Rapprochement d'enregistrements à l'aide de plusieurs règles de rapprochement

Si vous disposez d'enregistrements que vous souhaitez rapprocher et que vous décidez d'utiliser plusieurs opérations de rapprochement, vous pouvez créer un flux de données utilisant plusieurs match keys, puis combiner les résultats pour effectuer un rapprochement efficace en fonction de plusieurs critères distincts. Par exemple, imaginons que vous souhaitiez créer un flux de données rapprochant des enregistrements où :

Le nom et l'adresse correspondent
OR
La date de naissance et l'ID de gouvernement correspondent.

Pour procéder au rapprochement à l'aide de cette logique, vous créez un flux de données qui rapproche le nom et l'adresse dans un stage, et la date de naissance et l'ID de gouvernement dans un autre stage, puis vous combinez les enregistrements correspondants en une seule collection.

Cette rubrique explique la procédure générale pour configurer un flux de données dans lequel le rapprochement s'effectue sur deux stages de rapprochement. À des fins d'illustration, cette procédure utilise des stages Intraflow Match. Mais vous pouvez également utiliser cette technique avec des stages Interflow Match.

  1. Dans Enterprise Designer, créez un flux de données.
  2. Faites glisser un stage source sur le canevas.
  3. Double-cliquez sur le stage source et configurez-le. Pour obtenir les instructions sur la configuration des stages source, reportez-vous au Guide du concepteur du flux de données.
  4. Définissez le premier rapprochement. Les résultats de ce premier rapprochement est constitué de collections d'enregistrements rapprochés en fonction de votre premier jeu de critères de rapprochement, par exemple, des enregistrements rapprochés en fonction du nom et de l'adresse.
    1. Glissez un stage Match Key Generator et un stage Intraflow Match jusqu'au canevas et reliez-les de sorte à disposer d'un flux de données comme suit :
    1. Dans le stage Match Key Generator, définissez la match key à utiliser pour le premier rapprochement.

      Par exemple, si vous souhaitez que le premier rapprochement s'effectue sur le nom et l'adresse, vous pouvez créer une match key basée sur les champs contenant le nom de famille et le code postal.

    2. Dans le stage Intraflow Match, définissez les règles de rapprochement à appliquer par le premier rapprochement.

      Par exemple, vous pouvez configurer ce stage de rapprochement pour que le rapprochement s'effectue sur le nom et l'adresse.

  5. Enregistrez les numéros de la collection du premier rapprochement dans un autre champ. Cette opération est nécessaire, car le champ CollectionNumber est écrasé lors du deuxième rapprochement. Il convient de renommer le champ CollectionNumber afin de préserver les résultats du premier rapprochement.
    1. Glissez un stage Transformer jusqu'au canevas et reliez-le au stage Intraflow Match de sorte à disposer d'un flux de données comme suit :


    2. Configurez le stage Transformer pour renommer le champ CollectionNumber en CollectionNumberPass1.
  6. Définissez le deuxième rapprochement. Les résultats de ce deuxième rapprochement est constitué de collections d'enregistrements rapprochés en fonction de votre deuxième jeu de critères, par exemple, des enregistrements rapprochés en fonction de la date de naissance et de l'ID de gouvernement.
    1. Glissez un stage Match Key Generator et un stage Intraflow Match jusqu'au canevas et reliez-les de sorte à disposer d'un flux de données comme suit :
    2. Dans le deuxième stage Match Key Generator, définissez la match key à utiliser pour le deuxième rapprochement.

      Par exemple, si vous souhaitez que le deuxième rapprochement s'effectue sur la date de naissance et l'ID de gouvernement, vous pouvez créer une match key basée sur les champs contenant la date de naissance et l'ID de gouvernement.

    3. Dans le deuxième stage Intraflow Match, définissez la règle de rapprochement à utiliser pour le deuxième rapprochement.

      Par exemple, vous pouvez configurer ce stage de rapprochement pour que le rapprochement s'effectue sur la date de naissance et l'ID de gouvernement.

  7. Déterminez si certains des enregistrements doublons identifiés par le deuxième rapprochement ont été également identifiés comme doublons lors du premier rapprochement.
    1. Créez l'extrait de code de flux de données illustré ci-dessous après le deuxième stage Intraflow Match :
    2. Configurez le stage Conditional Router de sorte que les enregistrements dans lesquels le champ CollectionNumber n'est pas égal à 0 soient routés vers le stage Duplicate Synchronization.

      Cette opération dirige les doublons du deuxième rapprochement vers le stage Duplicate Synchronization.

    3. Configurez le stage Duplicate Synchronization de sorte qu'il regroupe les enregistrements en fonction du champ CollectionNumber (il s'agit du numéro de collection) du deuxième rapprochement). Ensuite, au sein de chaque collection, déterminez si certains des enregistrements de la collection ont également été identifiés comme doublons lors du premier rapprochement. Si c'est le cas, copiez le numéro de collection du premier rapprochement dans un nouveau champ nommé CollectionNumberConsolidated. Pour ce faire, configurez le stage Duplicate Synchronization comme suit :
    4. Dans le stage Transformer qui suit le stage Duplicate Synchronization, créez une transformation personnalisée à l'aide du script suivant :
      if (data['CollectionNumberConsolidated'] == null) {
       data['CollectionNumberConsolidated'] = data['CollectionNumber']
      }
    5. Dans le Transformer qui suit immédiatement le Conditional Router, (Transformer 2 dans l'échantillon de flux de données), configurez une transformation copiant CollectionNumberPass1 dans CollectionNumberConsolidated.

      Cette opération récupère les enregistrements uniques du deuxième rapprochement et copie CollectionNumberPass1 dans CollectionNumberConsolidated.

  8. Après le Stream Combiner, vous disposez de collections d'enregistrements rapprochés lors de l'un ou l'autre des rapprochements. Le champ CollectionNumberConsolidated indique les enregistrements correspondants. Vous pouvez ajouter un récepteur ou tout autre traitement supplémentaire de votre choix après le stage Stream Combiner.