Les jugements généraux
Dans le Sémiographeä , la plupart des
significations, courantes ou rares, liées à un domaine ou à une population langagière,
sont incorporées dans le dictionnaire de base. Il n’existe aucune restriction de
termes et de significations a priori. Ainsi, le mot " renard " est
entendu a priori par le système aussi bien comme un caniné sauvage que comme une voie
d’eau dans un ouvrage hydraulique, ce dernier sens étant attesté dans plusieurs
dictionnaires.
Une relation 1-N concernant les domaines d’emploi (aéronautique),
les fréquences d’utilisation (rare), les lieux où une expression a cours (Québec),
et d’autres informations de même nature est utilisée pour distinguer les sens
courants des sens fort peu fréquents.
La description sémantique.
Dans le Sémiographeä , la description
sémantique est effectuée à l’aide de liens entre les unités lexico-sémantiques
(mots-sens) et les concepts (constructions arbitraires), d’une part, et entre
certaines unités lexico-sémantiques entre elles, d’autre part.
La première de ces descriptions sémantiques constitue l’axe ontologique de la
description.
La deuxième description constitue l’axe linguistique de la description.
La description ontologique.
La description ontologique comporte des liens entre des unités
lexico-sémantiques et des concepts (de construction arbitraire, et normalement
alinguistique), ainsi que des liens entre concepts.
La classification de ces types de liens peut se faire selon plusieurs
points de vue, selon que l’on s’intéresse à :
- la relation fortuite (l’orage ravage) ou nécessaire (le ravageur ravage)
- la signification de l’appartenance ontologique (graphe componentiel) et son
utilisation par traits sémantiques, avec de nombreuses distinctions comme la nature
ontologique d’un élément (un ravageur est une personne), son action (le ravageur
ravage), son domaine d’intérêt (un fleuriste vend des fleurs)...
- la description et l’utilisation de l’ensemble des liens syntaxiques (tout
animal mange, se reproduit, meurt..., un fleuriste vend des fleurs), pour des
connaissances fortuites ou nécessaires...
Le graphe contient environ 280.000 liens ontologiques, ce qui, puisque
ces liens s’appliquent entre des ensembles importants de mots, correspond à des
milliards d’associations susceptibles d’être utilisées par le système.
La description linguistique
La description linguistique concerne des relations entre des mots ou
expressions d’une même langue ou des relations (de traduction) entre des mots ou
expressions de langues différentes.
La description linguistique entre des mots d’une même langue
La description a pour fonction d’économiser le recours à
l’axe ontologique en autorisant la substitution de termes entre eux sur des critères
syntaxiques simples (paraphrases). Au niveau le plus simple, on trouve une variété de
synonymies (identité, synonymie concernant des termes polysémiques, abréviation...).
Pour ces niveaux, les substitutions se font position à position, sans modification de la
structure syntaxique de la phrase. Aux niveaux supérieurs, on trouve des phénomènes
créant une modification dans la disposition des mots de la phrase (les négociations ont
abouti <---> l’aboutissement des négociations) ou dans le nombre de mots de la
phrase (la forêt gabonaise <---> la forêt du Gabon).
Il y a environ 60.000 relations de ce type dans la graphe.
La description linguistique entre des mots de langues différentes
Il existe un seul type de relation entre des mots de langue
différentes. Cette relation est : " se traduit par ".
La relation " se traduit par " permet de dire que
si le mot Ms de la langue source a le sens S, alors il peut se traduire par le mot Mc de
langue cible.
La relation " se traduit par " est de type N-N,
même si le plus souvent elle est rendue bijective par construction du graphe ontologique.
D’autre part, " se traduit par " ne signifie pas nécessairement
que l’ensemble de la description sémantique du mot de la langue cible se trouve dans
la description sémantique du mot de la langue source. Ici de nombreux effets
linguistiques (étymologie, jeu de mots) et culturels peuvent créer des écarts, même à
propos de choses concrètes. Par exemple, si escargot se traduit bien par
" snail " en anglais, il admet une connotation pour cette langue, ou
plutôt pour un anglais (garden pest : parasite de jardin) qui est moins évidente chez un
français (qui, quant à lui admettra facilement une connotation de plat savoureux).
|