Les autres fenêtres en haut de l'écran sont alors à votre disposition pour spécifier encore davantage les conditions de la recherche. Le balisage XML sous-jacent vous permet en effet de spécifier, outre la zone de l'article à explorer (ou champ) :
- si ce que vous recherchez doit concerner des entrées substantives, adverbiales, adjectives, verbales etc. Vous sélectionnez alors votre choix dans la fenêtre 'Catégorie grammaticale'.
- si vous voulez n'opérer que sur certains types d'articles seuls. Utilisez alors la fenêtre 'Types d'article' et sélectionnez celui dans lequel doit apparaître la donnée que vous cherchez.
- si vous vous intéressez au français non-normé. Féraud utilise un signe cabalistique, l'astérisque, lorsqu'il veut spécifier qu'une entrée ou un usage n'est pas authentifié par le bon usage. Allez à la fenêtre 'Avec astérisque' et choisissez où doit se trouver l'astérisque. Attention ! Féraud utilise bien d'autres façon, textualisées, de signifier qu'une entrée ou un usage est non-conventionnel. Le marquage par l'astérisque ne vous donnera certainement pas l'intégralité de ce que vous cherchez. Le reste du marquage d'usage étant largement textualisé, donc d'une formulation non codée, il vous faudra ruser avec Féraud en devinant comment il peut bien indiquer le type de marquage d'usage que vous cherchez. Les lister ici, ce serait un défi auquel nous ne pouvons pas nous hasarder. Vous seul savez au juste ce que vous cherchez.
Un petit exemple pour concrétiser ces indications ? Supposons que je cherche des finales de mot en -âtre, mais que je ne veux que les adjectifs et qu'en plus je veux savoir si certains sont marqués de l'astérisque de l'usage non-authentifié.
- j'entre dans la fenêtre 'Texte à chercher' la chaîne âtre
- je vérifie que la case 'Recherche complexe' est cochée (elle l'est par défaut)
- je sélectionne dans la fenêtre 'Dans quel champ' l'item 'FinVedette'
- je sélectionne dans la fenêtre 'Catégorie grammaticale' l'item 'Adjectif'
- je sélectionne dans la fenêtre 'Avec astérisque' l'item 'Sur la vedette'
- je lance la requête en cliquant sur le bouton 'Chercher'
La recherche n'est possible qu'en utilisant le mode 'Recherche complexe'.
- L'opérateur booléen 'ou' s'exprime par la barre verticale, | . Pour que les chaînes tapées soient autonomes (c'est-à-dire qu'elles constituent des mots graphiques à elles seules), il faut encadrer votre expression d'une paire de parenthèses. (mol|molière|moliere) vous permettra de retrouver pratiquement toutes les mentions et les usages de Molière dans le texte lexicographique.
- Un point d'interrogation rend optionnel le caractère ou l'expression derrière lesquels il est placé. Ainsi 'cr?oupe' génère deux réponses possibles : 'coupe' et 'croupe'.
- L'astérisque signifie que le caractère ou l'expression derrière lesquels il se trouve peut être répété autant de fois que nécessaire ou être absent. Ainsi 'cr*ot*e' permet de retrouver 'cote', 'cotte', voire...'crotte'.
- Le double astérisque signifie la même chose que l'astérisque mais le choix zéro est bloqué. Ce choix peut être fort utile pour récupérer la variation graphique des consonnes doubles que Féraud simplifie souvent dans sa propre graphie. Ainsi '(at**eler|at**elage)' permet de récupérer aussi bien 'atteler, attelage' que 'ateler, atelage' qui en sont les variantes graphiques féraldiennes.
- Un point est un joker qui permet à n'importe quel caractère ou n'importe quelle ponctuation de figurer à l'endroit où on le met : la chaîne 'bou.ier' en recherche complexe dans le champ 'Tout l'article' permettra de retrouver 'boulier', 'bouvier', 'bougier' mais aussi le président 'Bouhier'. De même '.olière' en recherche complexe dans le champ 'Tout l'article' permettra de retrouver 'Molière' ou 'volière'.
- L'expression .? placée dans une requête indique au moteur de recherche qu'il peut y avoir n'importe quoi à cet endroit (c'est le sens du point) ou rien (c'est le sens du point d'interrogation). Ainsi 'lou.?e' permet de récupérer 'loue', 'loupe' et 'louve'.
- Une expression du type [eo] placée en un endroit de la chaîne indique un choix possible entre les deux caractères tapés entre crochets droits. Ainsi 'p[eo]ur' sélectionnera 'pour' et 'peur'.
- L'expression [[:alpha:]] placée à n'importe quel endroit autorise n'importe quel caractère alphabétique, accentué ou pas, à cet endroit. '[[:alpha:]]oue' donnera ainsi 'loue', 'noue', 'roue'.
- L'expression [[:alpha:]]* indique qu'une séquence de caractères alphabétiques, quelle qu'elle soit, peut figurer à cet endroit. C'est donc l'opérateur de troncation le plus adapté. 'proverbi[[:alpha:]]*' permettra de récupérer 'proverbial', 'proverbiale', 'proverbiaux', 'proverbiales' et 'proverbialement'.
- Placé à l'intérieur d'une paire de crochets droits, un accent circonflexe précédant une liste de caractères indique que la place laissée en joker ne peut être remplie par ces caractères. C'est donc un opérateur d'exclusion de type 'sauf'. Ainsi 'ai[^rs]e' en recherche complexe permet de retrouver 'aime', 'aide' et 'aile' mais ni 'aire' ni 'aise'.
- Supposons qu'on veuille une expression de choix facultative. Il faut alors indiquer à la machine deux choses : le choix et son caractère facultatif. Nous avons alors besoin d'une paire de parenthèses et d'un point d'interrogation. Mais il faut impérativement respecter les espaces ici indiqués pour que cette manoeuvre obtienne ses résultats. 'je ((ne|le) )?crois' permettra de retrouver à la fois tous les 'je crois', les 'je ne crois' et les 'je le crois'.
- Supposons que nous voulions spécifier que deux mots peuvent être séparés l'un de l'autre par 0, 1 ou 2 mots graphiques, ou plus. Nous avons alors besoin d'une paire de parenthèses et d'un astérisque d'une part ; d'une paire d'accolades et des chiffres arabes d'autre part. Exemple : 'terme ([[:alpha:]]* ){0,2}propre' doit permettre de récupérer aussi bien 'terme propre' que 'terme plus propre' ou que 'terme est plus propre'. Attention, il faut veiller à ce qu'il y ait un espace entre l'astérisque et la parenthèse fermante.