Configuration des options d'exécution de flux de données

Vous pouvez configurer des flux de données pour que les options des stages soient exposées pour la configuration lors de l'exécution du flux de données. Cela signifie que les stages peuvent utiliser différents paramètres à chaque exécution du flux de données. Les options des stages peuvent être définies lors de l'appel du job via un processflow ou via l'outil de ligne de commande Job Executor. Par exemple, vous pouvez choisir d'autoriser la spécification de la casse de la sortie au moment de l'exécution, ce qui vous permet de choisir la casse lors de l'exécution plutôt que de devoir séparer des flux de données, chacun avec un paramètre de casse différent.

Cette procédure explique comment configurer un flux de données pour prendre en charge les options d'exécution.

  1. Ouvrez le flux de données dans Enterprise Designer.
  2. Pour configurer les options d'exécution d'un stage dans un flux de données intégré, ouvrez ce dernier.
  3. Cliquez sur l'icône Options de flux de données de la barre d'outils ou sur Édition > Options de flux de données. La boîte de dialogue Options de flux de données apparaît.
  4. Cliquez sur Ajouter. La boîte de dialogue Définir l'option de flux des données apparaît.
  5. Dans le champ Option name, indiquez le nom à utiliser pour cette option. Il s'agit du nom de l'option qui devra être spécifié lors de l'exécution afin de définir cette option.
  6. Dans le champ Label, vous pouvez spécifier un autre libellé ou conserver le même en tant que nom d'option.
  7. Saisissez une description de l'option dans le champ Description.
  8. Dans le champ Target, déterminez si cette option doit être appliquée à tous les stages dans le flux de données ou à certains stages uniquement.
    Stage(s) sélectionné(s)
    Sélectionnez cette option pour qu'elle ne soit appliquée qu'aux stages que vous spécifiez.
    Tous les stages
    Sélectionnez cette option pour qu'elle soit appliquée à tous les stages dans le flux de données.
    Inclut les transformations
    Sélectionnez cette option pour que l'option d'exécution soit mise à disposition pour les transformations personnalisées dans les stages Transformer dans le flux de données. Si vous choisissez cette option, vous pouvez accéder à la valeur indiquée lors de l'exécution dans le script Groovy d'une transformation personnalisée à l'aide de la syntaxe suivante :
    options.get("optionName")
    Par exemple, pour accéder à une option nommée casing, vous devez inclure cela dans votre script de transformation personnalisée :
    options.get("casing")
  9. Si vous choisissez Selected stage(s) dans le champ Target, la table Map dataflow options to stages affiche la liste des stages contenus dans le flux de données. Sélectionnez l'option à exposer en tant qu'option de flux de données. Vous verrez les champs Valeur par défaut et Valeurs conformes se remplir de données lorsque vous sélectionnez votre premier élément.
    Remarque : Vous pouvez sélectionner plusieurs options de telle sorte que l'option de flux de données contrôle plusieurs options de stages. Si vous faites cela, chaque option que vous sélectionnez doit partager des valeurs conformes. Par exemple, une option présente des valeurs de Y et N, chacune des options supplémentaires doit disposer de Y ou de N dans son ensemble de valeurs, et vous ne pouvez autoriser la valeur en commun à être disponible qu'au moment de l'exécution. Ainsi, si vous sélectionnez une option avec les valeurs Y et N, vous ne pouvez pas sélectionner une option dotée des valeurs E, T, M et L, mais vous pouvez sélectionner une option avec les valeurs P, S et N car les deux options partagent la valeur « N ». Cependant, seule cette valeur « N » est disponible pour cette option, pas « Y », « P » ou « S ».
  10. Si vous voulez limiter les valeurs qu'un utilisateur peut définir lors de l'exécution, modifiez les options du champ Valeurs conformes en cliquant sur l'icône située directement à droite du champ.
  11. Pour modifier la valeur par défaut, indiquez une valeur différente dans le champ Valeur par défaut.
  12. Cliquez sur OK.
  13. Continuez d'ajouter les options souhaitées.
  14. Cliquez sur OK dans la boîte de dialogue des Options du flux de données lorsque vous avez terminé d'ajouter vos options.
  15. Si vous ajoutez une option d'exécution à un flux de données intégré, vous devez définir le flux de données parent de l'option d'exécution, ainsi que tous les flux de de données ancêtres, pour que les options soient disponibles lors de l'exécution. Pour ce faire, ouvrez le flux de données contenant le flux de données intégré et exposez l'option que vous venez de créer. Si nécessaire, ouvrez le parent de ce flux de données et définissez-y l'option, etc., jusqu'à ce que l'option de flux de données soit définie pour tous les ancêtres.

    Par exemple, imaginons que vous disposiez d'un flux de données nommé « A » contenant un flux de données intégré nommé « B », contenant à son tour un flux de données intégré nommé « C », de sorte que votre hiérarchie de flux de données intégrés ressemble à : A > B > C. Si vous souhaitez exposer une option nommée Casing dans un stage dans le flux de données intégré « C », vous devez ouvrir le flux de données intégré « C » et y définir l'option. Ensuite, vous devez ouvrir le flux de données intégré « B » et y définir l'option. Pour finir, vous devez ouvrir le flux de données « A » et y définir l'option, pour qu'elle soit disponible lors de l'exécution.

Le flux de données est désormais configuré pour permettre la spécification des options lors de l'exécution. Vous pouvez désormais spécifier les paramètres lors de l'exécution des manières suivantes :

  • Pour les jobs, les options peuvent être spécifiées à l'aide d'un fichier de propriétés d'options de flux de données et de l'argument -o de Job Executor.
  • Pour les services, les options deviennent disponibles en tant qu'options API.
  • Pour les services exposés en tant que service Web, les options deviennent disponibles en tant que paramètres de service Web.
  • Pour les sous-flux, les options sont héritées du flux de données parent et exposées via l'une des méthodes ci-dessus, selon le type de flux de données parent (job, service ou service exposé en tant que service Web).