Configuration des options
Vous devez créer une règle pour définir les options d'Advanced Transformer. Vous pouvez créer plusieurs règles puis spécifier l'ordre dans lequel ces règles seront appliquées. Pour créer une règle, procédez comme suit :
- Faites un double-clic sur l'instance Advanced Transformer du canevas. Le dialogue Options d'Advanced Transformer s'affiche.
- Sélectionnez le nombre d'instances d'exécution, puis cliquez sur OK. Utilisez l'option Instances d'exécution pour paramétrer un flux de données afin de mener plusieurs exécutions parallèles d'un stage afin d'augmenter potentiellement les performances.
- Cliquez sur le bouton Ajouter. Le dialogue Options d'Advanced Transformer s'affiche. Remarque : Si vous ajoutez plusieurs règles de transformateur, vous pouvez utiliser les boutons Monter et Descendre pour modifier l'ordre dans lequel les règles s'appliquent.
- Sélectionnez le type d'action de transformation que vous souhaitez effectuer, puis cliquez sur OK. Les options sont répertoriées dans le tableau ci-dessous.
Option |
Description |
---|---|
Source |
Définit le champ de source d'entrée à évaluer pour être scanné et divisé. |
Extraire en utilisant |
Choisir Données de tableau ou Expressions régulières. Choisissez Données de tableau si vous souhaitez scanner et diviser en utilisant les tableaux XML se trouvant dans <Drive>:\Program Files\Pitney Bowes\Spectrum\server\modules\advancedtransformer\data. Consulter les Options de données de tableau ci-dessous pour en savoir plus sur chaque option. Choisir Expressions régulières si vous souhaitez scanner et diviser en utilisant des expressions régulières. Les expressions régulières offrent plusieurs options supplémentaires permettant de diviser les données. Vous pouvez utiliser les expressions régulières préemballées en choisissant une depuis la liste. Vous pouvez également en construire une en utilisant la syntaxe RegEx. Vous pouvez par exemple diviser les données lorsque la première valeur numérique est trouvée, comme dans « John Smith 123 Main St. » où le texte « John Smith » peut être assigné à un champ et « 123 Main St. » à un autre champ. Consulter les options d'Expressions régulières ci-dessous pour en savoir plus sur chaque option. |
Options Données de table |
|
Non-extracted Data |
Indique le champ de sortie qui devrait contenir les données transformées. Si vous souhaitez remplacer la valeur initiale, indiquer le même champ dans le dossier de Destination que dans la liste déroulante Source. Vous pouvez également saisir un nouveau nom de champ dans le champ Destionation. Si vous saisissez un nouveau nom de champ, ce nom de champ sera disponible dans les stages de votre flux de données découlant d'Advanced Transformer. |
Extracted Data |
Indique le champ de sortie où vous voulez placer les données extraites. Vous pouvez également saisir un nouveau nom de champ dans le champ Données extraites. Si vous saisissez un nouveau nom de champ, ce nom de champ sera disponible dans les stages de votre flux de données découlant d'Advanced Transformer. |
Caractère de séparation |
Indique tout caractère spécial que vous souhaitez tokeniser. La tokenisation est un processus qui consiste à séparer des termes. Par exemple, s’il y a un champ avec les données « Smith, John », vous devriez insérer une virgule. Vous obtiendrez les termes :
Maintenant que les termes sont séparés, les données peuvent être divisées en scannant et en extrayant à la hauteur de la virgule afin que « Smith » et « John » soient identifiés de manière propre comme étant les données à standardiser. |
Table |
Définit le tableau contenant les termes sur lesquels la division du champ se base. Pour une liste des tableaux, voir Tables Advanced Transformer. Pour obtenir des informations sur la création ou la modification des tableaux, voir Présentation des tables de recherche. |
Recherche de termes contenant plusieurs mots |
Cochez cette case pour activer les recherches de plusieurs mots dans une chaîne donnée. Par exemple : Chaîne d'entrée = « Cedar Rapids 52401 » Règle d'entreprise = Identifier « Celar Rapids » dans les chaînes basées sur un tableau contenant l'entrée ; Cedar Rapids = Sortie Etats-Unis = Identifie la présence de « Cedar Rapids » et place les termes dans un nouveau champ, par exemple, Ville. Pour des recherches avec plusieurs mots, la recherche est interrompue après qu'une première mise en correspondance soit établie. Remarque : En choisissant cette option, il est possible que les performances en soient affectées de manière négative.
|
Extraire |
Indique le type d'extraction à effectuer. L'un des éléments suivants :
Si vous choisissez d'extraire des mots à droite ou à gauche du terme, vous pouvez indiquer si vous souhaitez également inclure le terme en question dans les données de destination ou les données extraites. Par exemple, dans le champ : 2300 BIRCH RD STE 100 vous désirez extraire « STE 100 » et le placer dans le champ indiqué dans les données extraites, vous choisiriez d'inclure le terme dans le champ de données extrait, comprenant ainsi l'abréviation « STE » et le mot « 100 ». Si vous ne choisissez ni Données de destination ni Données extraites, le terme ne sera pas inclus et sera éliminé. |
Options Expressions régulières |
|
Expressions régulières |
Choisissez une expression régulière préemballée depuis la liste, ou assemblez-en une depuis la zone de texte. L'Advanced Transformer prend en charge la syntaxe RegEx standard. La plateforme Java 2 contient un paquet nommé java.util.regex permettant l'utilisation d'expressions régulières. Pour plus d'informations, rendez-vous sur : java.sun.com/docs/books/tutorial/essential/regex/index.html. |
Bouton Ellipse |
Cliquez sur ce bouton pour ajouter ou supprimer une nouvelle expression régulière. |
Remplissage des groupes |
Après avoir choisi une nouvelle expression RegEx prédéfinie ou après en avoir saisie une, cliquez sur Peupler le groupe afin d'extraire tous groupes Regex et de placer l'expression complète ainsi que tous groupes Regex trouvé dans la liste de Groupes. |
Groupes |
Cette colonne montre les expressions régulières du groupe d'Expressions régulières sélectionné. Par exemple, si vous sélectionnez l'expression Date Regex, l’expression suivante s'affiche sur la zone de texte : (1[012]{1,2}|0?[1-9])[-/.]([12][0-9]|3[01]{1,2}|0?[1-9])[-/.](([0-9]{4})). Cette expression Regex est divisée en trois et l'ensemble de l’expression et chacune des trois parties peuvent être envoyées à des champs de sortie différents. L'ensemble de l'expression est recherchée dans le champ texte, et si une mise en correspondance à lieu dans le champ de source, les parties associées seront déplacées jusqu'au champ de sortie assigné. Si le champ de source est « Le 12/14/2006 » et que vous lui appliquez l'expression Date et assignez toute la date (par exemple, «12/14/2006 ») devant être placée dans le champ DATE, le « 12 » devra être placé dans le champ MOIS, le « 14 » dans le champ JOUR et « 2006 » dans le champ Année La recherche de date sera donc effectuée et les informations adéquates trouvées (le cas échéant) seront déplacée jusqu'au champ de sortie adéquat. Champ source : "On 12/14/2006" DATE: "12/14/2006" MONTH: "12" DAY: "14" YEAR: "2006" |
Champ Champ de sortie |
Faites dérouler la liste du menu pour choisir un champ de sortie. |