Configuration des options

Vous devez créer une règle pour définir les options d'Advanced Transformer. Vous pouvez créer plusieurs règles puis spécifier l'ordre dans lequel ces règles seront appliquées. Pour créer une règle, procédez comme suit :

  1. Faites un double-clic sur l'instance Advanced Transformer du canevas. Le dialogue Options d'Advanced Transformer s'affiche.
  2. Sélectionnez le nombre d'instances d'exécution, puis cliquez sur OK. Utilisez l'option Instances d'exécution pour paramétrer un flux de données afin de mener plusieurs exécutions parallèles d'un stage afin d'augmenter potentiellement les performances.
  3. Cliquez sur le bouton Ajouter. Le dialogue Options d'Advanced Transformer s'affiche.
    Remarque : Si vous ajoutez plusieurs règles de transformateur, vous pouvez utiliser les boutons Monter et Descendre pour modifier l'ordre dans lequel les règles s'appliquent.
  4. Sélectionnez le type d'action de transformation que vous souhaitez effectuer, puis cliquez sur OK. Les options sont répertoriées dans le tableau ci-dessous.
Tableau 1. Options d'Advanced Transformer

Option

Description

Source

Définit le champ de source d'entrée à évaluer pour être scanné et divisé.

Extraire en utilisant

Choisir Données de tableau ou Expressions régulières.

Choisissez Données de tableau si vous souhaitez scanner et diviser en utilisant les tableaux XML se trouvant dans <Drive>:\Program Files\Pitney Bowes\Spectrum\server\modules\advancedtransformer\data. Consulter les Options de données de tableau ci-dessous pour en savoir plus sur chaque option.

Choisir Expressions régulières si vous souhaitez scanner et diviser en utilisant des expressions régulières. Les expressions régulières offrent plusieurs options supplémentaires permettant de diviser les données. Vous pouvez utiliser les expressions régulières préemballées en choisissant une depuis la liste. Vous pouvez également en construire une en utilisant la syntaxe RegEx.

Vous pouvez par exemple diviser les données lorsque la première valeur numérique est trouvée, comme dans « John Smith 123 Main St. » où le texte « John Smith » peut être assigné à un champ et « 123 Main St. » à un autre champ. Consulter les options d'Expressions régulières ci-dessous pour en savoir plus sur chaque option.

Options Données de table

 

Non-extracted Data

Indique le champ de sortie qui devrait contenir les données transformées. Si vous souhaitez remplacer la valeur initiale, indiquer le même champ dans le dossier de Destination que dans la liste déroulante Source.

Vous pouvez également saisir un nouveau nom de champ dans le champ Destionation. Si vous saisissez un nouveau nom de champ, ce nom de champ sera disponible dans les stages de votre flux de données découlant d'Advanced Transformer.

Extracted Data

Indique le champ de sortie où vous voulez placer les données extraites.

Vous pouvez également saisir un nouveau nom de champ dans le champ Données extraites. Si vous saisissez un nouveau nom de champ, ce nom de champ sera disponible dans les stages de votre flux de données découlant d'Advanced Transformer.

Caractère de séparation

Indique tout caractère spécial que vous souhaitez tokeniser. La tokenisation est un processus qui consiste à séparer des termes. Par exemple, s’il y a un champ avec les données « Smith, John », vous devriez insérer une virgule. Vous obtiendrez les termes :

  • Smith
  • ,
  • John

Maintenant que les termes sont séparés, les données peuvent être divisées en scannant et en extrayant à la hauteur de la virgule afin que « Smith » et « John » soient identifiés de manière propre comme étant les données à standardiser.

Table

Définit le tableau contenant les termes sur lesquels la division du champ se base. Pour une liste des tableaux, voir Tables Advanced Transformer. Pour obtenir des informations sur la création ou la modification des tableaux, voir Présentation des tables de recherche.

Recherche de termes contenant plusieurs mots

Cochez cette case pour activer les recherches de plusieurs mots dans une chaîne donnée. Par exemple :

Chaîne d'entrée = « Cedar Rapids 52401 » Règle d'entreprise = Identifier « Celar Rapids » dans les chaînes basées sur un tableau contenant l'entrée ; Cedar Rapids = Sortie Etats-Unis = Identifie la présence de « Cedar Rapids » et place les termes dans un nouveau champ, par exemple, Ville.

Pour des recherches avec plusieurs mots, la recherche est interrompue après qu'une première mise en correspondance soit établie.

Remarque : En choisissant cette option, il est possible que les performances en soient affectées de manière négative.

Extraire

Indique le type d'extraction à effectuer. L'un des éléments suivants :

Extraire le terme
Extrait le terme identifié par le tableau sélectionné
Extraire N mots à droite du terme
Extrait des mots à droite du terme. Vous indiquez le nombre de mots à extraire. Par exemple, si vous souhaitez extraire les deux mots à droite du terme identifié, choisissez 2.
Extraire N mots à gauche du terme
Extrait des mots à gauche du terme. Vous indiquez le nombre de mots à extraire. Par exemple, si vous souhaitez extraire les deux mots à gauche du terme identifié, choisissez 2.

Si vous choisissez d'extraire des mots à droite ou à gauche du terme, vous pouvez indiquer si vous souhaitez également inclure le terme en question dans les données de destination ou les données extraites. Par exemple, dans le champ :

2300 BIRCH RD STE 100

vous désirez extraire « STE 100 » et le placer dans le champ indiqué dans les données extraites, vous choisiriez d'inclure le terme dans le champ de données extrait, comprenant ainsi l'abréviation « STE » et le mot « 100 ».

Si vous ne choisissez ni Données de destination ni Données extraites, le terme ne sera pas inclus et sera éliminé.

Options Expressions régulières

 

Expressions régulières

Choisissez une expression régulière préemballée depuis la liste, ou assemblez-en une depuis la zone de texte. L'Advanced Transformer prend en charge la syntaxe RegEx standard.

La plateforme Java 2 contient un paquet nommé java.util.regex permettant l'utilisation d'expressions régulières. Pour plus d'informations, rendez-vous sur : java.sun.com/docs/books/tutorial/essential/regex/index.html.

Bouton Ellipse

Cliquez sur ce bouton pour ajouter ou supprimer une nouvelle expression régulière.

Remplissage des groupes

Après avoir choisi une nouvelle expression RegEx prédéfinie ou après en avoir saisie une, cliquez sur Peupler le groupe afin d'extraire tous groupes Regex et de placer l'expression complète ainsi que tous groupes Regex trouvé dans la liste de Groupes.

Groupes

Cette colonne montre les expressions régulières du groupe d'Expressions régulières sélectionné.

Par exemple, si vous sélectionnez l'expression Date Regex, l’expression suivante s'affiche sur la zone de texte : (1[012]{1,2}|0?[1-9])[-/.]([12][0-9]|3[01]{1,2}|0?[1-9])[-/.](([0-9]{4})). Cette expression Regex est divisée en trois et l'ensemble de l’expression et chacune des trois parties peuvent être envoyées à des champs de sortie différents. L'ensemble de l'expression est recherchée dans le champ texte, et si une mise en correspondance à lieu dans le champ de source, les parties associées seront déplacées jusqu'au champ de sortie assigné. Si le champ de source est « Le 12/14/2006 » et que vous lui appliquez l'expression Date et assignez toute la date (par exemple, «12/14/2006 ») devant être placée dans le champ DATE, le « 12 » devra être placé dans le champ MOIS, le « 14 » dans le champ JOUR et « 2006 » dans le champ Année La recherche de date sera donc effectuée et les informations adéquates trouvées (le cas échéant) seront déplacée jusqu'au champ de sortie adéquat.

Champ source : "On 12/14/2006" DATE: "12/14/2006" MONTH: "12" DAY: "14" YEAR: "2006"

Champ Champ de sortie

Faites dérouler la liste du menu pour choisir un champ de sortie.