Définir des balises RegEx de culture

Cette rubrique explique comment définir des balises RegEx de culture lors de la définition d'une grammaire d'analyse propre à la culture.

  1. Dans Enterprise Designer, accédez à Outils > Open Parser Domain Editor.
  2. Cliquez sur l'onglet Cultures. L'onglet Cultures affiche une liste des cultures prises en charge. Afin d'obtenir la liste complète des cultures prises en charge, voir Affectation d'une culture d'analyse à un enregistrement.
  3. Choisissez une culture depuis la liste puis cliquez sur Propriétés. La boîte de dialogue Propriétés de culture s'affiche.
  4. Cliquez sur l'onglet Balises Regex. Les informations affichées comprennent les noms des balises RegEx définies pour la culture sélectionnée et la culture source associée, la valeur de la balise RegEx ainsi que la description.
  5. Cliquez sur Ajouter ou Modifier.
  6. Saisissez un nom dans la zone de texte Nom pour la balise RegEx.

    Si vous saisissez un nom existant déjà pour la culture sélectionnée, une icône d'avertissement se met à clignoter. Saisissez un nom différent ou fermez la boîte de dialogue, supprimez la balise RegEx existante puis cliquez à nouveau sur Ajouter.

  7. Saisissez la description de l'onglet RegEx dans la zone de texte Description.
  8. Saisissez une valeur dans la zone de texte Valeur pour la balise RegEx.

    Cette valeur peut être toute expression régulière valable mais ne peut pas être mise en correspondance avec une chaîne vide.

    Domain Editor comprend plusieurs balises RegEx prédéfinies que vous pouvez utiliser pour définir des propriétés de culture. Vous pouvez également utiliser ces balises RegEx pour définir des caractères de jetonisation dans votre grammaire de parsing.

    Vous pouvez modifier les balises RegEx prédéfinies ou les copier afin de créer vos propres variantes. Vous pouvez également désactiver les propriétés pour créer des balises RegEx spécialisées pour des langues spécifiques.

    • Lettre : toute lettre de n'importe quelle langue. Cette balise RegEx comprend des neutralisateurs pour plusieurs langues à cause des différences dans les scripts utilisés, tels que les scripts cyrilliques, les scripts de langues asiatiques et le script thaïlandais.
    • Minuscule : lettre minuscule ayant une variante majuscule.
    • Numérique : tout caractère numérique dans n'importe quel script.
    • Ponctuation : tout caractère de ponctuation.
    • Majuscule : toute lettre majuscule ayant une variante minuscule.
    • Espace : tout espace blanc ou séparateur invisible.
  9. Cliquez sur OK.