Options d'Index de recherche avancées

Tableau 1. Options de Candidate Finder

Nom de l'option

Description/Valeurs valides

Type de Finder

Sélectionnez l'index de recherche.

Nom

Sélectionnez l'index approprié ayant été créé via le stage Write to Search Index sous les stages déployés Advanced Matching dans Enterprise Designer.

Enregistrement de départ

Saisissez le numéro d'enregistrement à partir duquel doivent commencer les résultats de recherche. La valeur par défaut est 1.

Nombre maximal de résultats

Saisissez le nombre maximal de réponses que l'index de recherche doit renvoyer. La valeur par défaut est 10.

Renvoyer le nombre total de correspondances

Renvoie le nombre total de correspondances effectuées. Par exemple, si vous utilisez la valeur par défaut « 10 » pour le champ Nombre maximal de résultats ci-dessus, seuls 10 résultats seront renvoyés. En revanche, si vous cochez cette case, le champ de sortie TotalMatchCount vous indique le nombre de correspondances effectuées lors du traitement.

Type de recherche d'index Détermine le type de recherche d'index que vous souhaitez effectuer. Sélectionnez recherche avancée.

Bouton Ajouter un parent

Accédez aux options parent.

Options parents : nom

Saisissez le nom de le parent.

Options parents : Méthode de recherche

Définissez comment déterminer si un parent est une correspondance ou non. L'un des éléments suivants :

Toutes vraies : un parent est considéré comme une correspondance si tous les enfants sont déterminés correspondre. Cette méthode crée un connecteur « ET » entre les enfants.

Au moins une : un parent est considéré comme une correspondance si au moins un enfant est déterminé correspondre. Cette méthode crée un connecteur « OU » entre les enfants.

Aucun vrai : un parent est considéré comme une correspondance si aucun des enfants n'est déterminé correspondre. Cette méthode crée un connecteur "NOT" entre les enfants.

Bouton Ajouter un enfant

Accédez aux options enfant.

Options enfant : champ Index

Sélectionnez le champ dans lequel vous souhaitez créer un index de recherche.

Options enfant : type de recherche

Indique les critères de recherche/mise en correspondance qui déterminent si les données d'entrée sont recherchées/mises en correspondance avec les données indexées. Toutes les recherches sont sensibles à la casse.

Tout terme/expression commence par Détermine si le texte contenu dans le champ d'index de recherche commence par le texte contenu dans le champ d'entrée.

Par exemple, le texte dans le champ d'entrée “tech” serait considéré comme une correspondance pour les champs d'index de recherche contenant “Technical”, “Technology”, “Technologies”, “Technician” ou même "National University of Technical Sciences". De même, une expression dans le champ d'entrée « DEF  Sof » sera considérée comme une correspondance pour les champs d'index de recherche contenant « ABC DEF Software », « DEF Software » et « DEF Software India », mais ce ne serait pas une correspondance pour les champs d'index de recherche contenant « Software DEF » ou « DEF ABC Software ».

Contient Détermine si le champ de l'index de recherche contient les données du champ d'entrée. Ce type de recherche prend en considération la séquence de mots dans le champ d'entrée tout en recherchant le champ d'index de recherche. Par exemple, les données de champ d'entrée « Pitney » et « Pitney Bowes » seraient contenues dans un champ d'index de recherche de « Pitney Bowes Software Inc ».
Contient tout Détermine si tous les mots alphanumériques du champ d'entrée sont contenus dans le champ d'index de recherche. Ce type de recherche ne prend pas en considération la séquence de mots dans le champ d'entrée lors de la recherche du champ d'index de recherche.
Contient n'importe quel Détermine si l'un des mots alphanumériques du champ d'entrée est contenu dans le champ d'index de recherche.
Ne contient aucun Détermine si aucun des mots alphanumériques du champ d'entrée n'est contenu dans le champ Index de recherche.
Correspondance approximative Détermine la similitude entre deux mots alphanumériques en fonction du nombre de suppressions, d'insertions ou de substitutions requises pour transformer un mot en un autre.
Utilisez le paramètre Nombre maximal de modifications pour définir une limite du nombre de modifications autorisées pour être considéré comme une correspondance réussie :
  • 0 : n'autorise aucune suppression, insertion, ni substitution. Les données du champ d'entrée et celles du champ d'index de recherche doivent être identiques.
  • 1 : n'autorise pas plus d'une suppression, insertion ou substitution. Par exemple, un champ d'entrée contenant "Barton" sera mis en correspondance avec un champ d'index de recherche contenant "Carton".
  • 2 : n'autorise pas plus de deux suppressions, insertions ou substitutions. Par exemple, un champ d'entrée contenant "Barton" sera mis en correspondance avec un champ d'index de recherche contenant "Martin".

Le type de recherche Correspondance approximative n'est utilisé que pour les recherches de mots uniques. Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index. Par exemple, si le champ d'index indique "Pitney" et que le champ d'entrée indique "Pitney Bowes", ils ne sont pas considérés comme une correspondance à cause de "Bowes". Cependant, si vous cochez cette case, "Bowes" sera ignoré et dans la mesure où "Pitney" est le premier mot, les deux mots seraient considérés comme une correspondance.

numériques Détermine si tous les mots alphanumériques du champ d'entrée sont contenus dans le champ d'index de recherche.

Le type de recherche Caractère générique n'est utilisé que pour les recherches de mots uniques.

Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index.
Modèle Détermine si le modèle de texte du champ d'entrée correspond au modèle de texte des critères de recherche. Vous pouvez encore affiner le modèle de texte dans le champ Chaîne de modèles. Par exemple, si le champ d'entrée contient “nlm” et que le modèle défini est “a*b?c”, il sera mis en correspondance avec les mots suivants “Neelam”, “nelam”, “neelum”, “nilam”, etc.

Le type de recherche Modèle n'est utilisé que pour les recherches de mots uniques. Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index.

Proximité Détermine si les mots dans les champs d'entrée se situent à une certaine distance l'un de l'autre.
  • Définissez l'entrée Champ de première entrée et Champ de deuxième entrée à rechercher dans l'index.
  • Utilisez le paramètre Distance pour déterminer la distance maximale autorisée entre les mots indiqués dans le champ Premier et le champ Second afin d'être considéré comme une correspondance.

Par exemple, vous pouvez utiliser ce type de recherche pour rechercher le premier champ "Spectrum" et le second champ "Pitney" à dix mots d'intervalle, dans un champ d'index de recherche contenant la phrase “Spectrum Technology Platform est un produit de Pitney Bowes Software Inc.”

Le type de recherche Proximité n'est utilisé que pour les recherches de mots uniques. Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index.

Plage Effectue une recherche inclusive de termes dans une plage spécifiée à l'aide d'un champ de limite inférieure (terme de départ) et un champ de limite supérieure (terme de fin). Tous les mots alphanumériques sont organisés de manière lexicographique dans le champ d'index de recherche.
  • Utilisez le paramètre Champ de limite inférieure pour sélectionner le champ à utiliser en tant que terme de départ.
  • Utilisez le paramètre Champ de limite supérieure pour sélectionner le champ à utiliser en tant que terme de fin.

Par exemple, si vous avez recherché des codes postaux à partir de 20001 (défini dans le champ de limite inférieure) à 20009 (défini dans le champ de limite supérieure), la recherche renverra toutes les adresses contenant des codes postaux compris dans cette plage.

Le type de recherche Plage n'est utilisé que pour les recherches de mots uniques. Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index.

Caractère générique Recherches utilisant des caractères génériques uniques ou multiples :

Sélectionnez la position dans votre fichier d'entrée dans lequel vous insérez le caractère générique.

Le type de recherche Caractère générique n'est utilisé que pour les recherches de mots uniques. Cliquez sur Ignorer les mots en trop pour que Candidate Finder ne considère que le premier mot dans le champ lors de la comparaison du champ d'entrée avec le champ d'index.

Options enfant : facteur de pertinence

Contrôlez la pertinence d'un champ enfant en saisissant ici un nombre jusqu'à 100. Plus le facteur de pertinence sera élevé, plus le champ sera pertinent. Par exemple, si vous souhaitez que les résultats du champ Nom de la société soient plus pertinents que ceux des autres champs, sélectionnez Nom de la société dans Nom du champ d'index et saisissez "5".
Remarque : Les nombres saisis ici doivent être positifs, mais peuvent être inférieurs à "1" ; par exemple, "0,05" serait valide.

Ignorer les vides

Décochez cette case si vous souhaitez que la requête prenne en compte les champs de fichier d’entrée vides.
Remarque : Par défaut, la requête ignore les champs vides.

Onglet Champs de sortie

Cochez la case Inclure pour sélectionner les champs à inclure dans la sortie.
Remarque : Si le champ d'entrée provient d'un stage précédent dans le flux de données et qu'il porte le même nom que le le champ enregistré de l'index de recherche, les valeurs du champ d'entrée écraseront les valeurs dans le champ de sortie.
L'écran ci-dessous présente un exemple du stage Candidate Finder Options terminé via un index de recherche :
  • Une recherche d'index dont le Nom est « CF_Index »
  • Un Enregistrement de départ 26, ce qui signifie que les résultats de recherche commenceront à l'enregistrement 26
  • Un Nombre maximal de résultats défini sur 10, ce qui signifie que seuls 10 résultats doivent être renvoyés
  • Une option sélectionnée sur Renvoyer le nombre total de correspondances, qui inclut tous les enregistrements, et non pas seulement les 10 enregistrements auxquels nous limitons cette vue
  • Un avancé type de recherche d'Index
  • Un type Parent nommé « State Match »
  • Un type Enfant nommé « StateProvince », basé sur le nom du champ d'index
  • Un type de recherche Correspondance approximative avec un Nombre maximal de modifications de 2, ce qui permet d'obtenir jusqu'à deux modifications dans une correspondance
  • Un Champ d'entrée « StateProvince » utilisé pour la mise en correspondance avec le champ d'index « StateProvince »
  • Un Facteur de pertinence de 2.0 pour augmenter la pertinence des données d'état
  • Une carte de champ indiquant que nous sommes dans la sortie renvoient les champs InputKeyValue, AddressLine1, AddressLine2, StateProvince et PostalCode, mais pas les champs FirmName ou la ville.