II.3] Les fonctions de phrase du Sémiographe
Les fonctions de phrase fournissent des informations sur les fonctions des mots à l’intérieur d’une phrase syntaxique, ou sur les sens des mots à l’intérieur d’une phrase sémantique.
II.3.1] La fonction morphologique de phrase
public Phrase createSentence ( String stringSentence,
boolean avecAnalyseSyntaxique,
boolean avecAnalyseMorpho )
ex : createSentence ("le chat mange la souris", false, true )
Renvoie une phrase morphologiquement analysée : chaque mot de la phrase récupère l'ensemble des catégories possibles. Par exemple, "souris" est un verbe ou un nom.
II.3.2] La fonction syntaxique de phrase
public Phrase createSentence ( String stringSentence,
boolean avecAnalyseSyntaxique,
boolean avecAnalyseMorpho )
ex : createSentence ("le chat mange la souris", true, true )
Renvoie une phrase syntaxiquement analysée : chaque mot de la phrase récupère sa catégorie grammaticale et syntaxique retenue par le contexte. Par exemple, "souris" est ici un nom.
NB : L'analyse syntaxique est un outil essentiel pour qui veut extraire des connaissances factuelles depuis un corpus et construire automatiquement des bases de connaissances. C'est un des éléments importants du "text mining".
L'analyseur syntaxique fournit avec Le Sémiographe est entièrement paramétrable du point de vue de ses règles (patterns) et des critères d'extraction. Ainsi, l'utilisateur informaticien peut définir les éléments qu'il souhaite extraire depuis une base de données textuelle.
II.3.3] Les fonctions sémantiques de phrase
Ces fonctions ont pour base les fonctions sémantiques de mots reliées avec les fonctions principales de désambiguïsation sémantique : l’activation et la distance.
Activation et Distance ont pour but de donner une " distance " entre un mot-sens et plusieurs autres mots présents dans une phrase.
-
La désambiguïsation par " activation "
public void activation( int scoreMax, int maxActives )
ex : activation( -1, 10 )
Garde dans la phrase tous les mots-sens qui font partie, pour chaque position de mots, des 10 meilleurs résultats d’activation, quelque soit ce score.
-
La désambiguïsation par " distance "
public void distance( int numMot, boolean filtrageLimites )
ex : distance( -1, true )
Evalue pour chaque mot-sens de chaque mot le score d’activation. Pour les sens limités d’un mot (par ex le sens de fleur dans le sens de la fleur du cuir), on ne les conserve dans la phrase que si ce sens a été activé par, au moins, un autres mot-sens de la phrase.
La forme en N, ou dictionnaire inversé, a pour objet de calculer la valeur spécifique d’un terme générique placé en première position de la fonction.
Par exemple, " personne qui vend des fleurs ", a en première position le mot " personne " qui est capable de représenter chaque nom de personne. " Monnaie du Japon " constitue un autre exemple de la forme en N.
Sur le plan informatique, la forme en N est constituée d’un enchaînement de la fonction de mots " Spécifiques " suivi, pour chacun des mots trouvés, d’un calcul de d’activation suivi éventuellement d’un calcul de distance.
public void extendActivated ( int num,
String langues,
boolean filtrageLimites,
int scoreMax,
int maxActives,
int maxReponses,
char origine,
boolean calculDistance )
ex : extendActivated( 1, "F", true, -1, 50, 10, ‘P’, true )
Dans cet exemple, on calcule tous les spécifiques français du mot n°1, puis après avoir filtré les sens limités, on ne garde que les mots-sens qui figurent parmi les 50 premiers résultats d’activation, puis on calcule un score de distance sur ces mots-sens, pour, enfin ne garder que les 10 premiers.
Note : si calculDistance est à false, le paramètre maxReponses est égal à maxActives.
La fonction " Spécifiques activés " effectue les mêmes calculs que la forme en N, mais n’impose pas que le calcul s’effectue uniquement sur le premier mot de la phrase.
Cette fonction permet " d’étendre " dans une phrase les significations possibles d’un terme générique à chacun de ses termes spécifiques, pourvus que ceux-ci soient activés.
ex : extendActivated( 3, "F", true, -1, 50, 10, ‘P’, true )
Même chose que la forme en N, mais appliquée au troisième mot de la phrase.
La fonction " traduire " fournit la traduction d’un mot d’une langue source vers un mot d’une langue cible pour un certain contexte de mots.
public Vector extendTranslation ( int numMot,
String LanguesAutorisees )
ex : extendTranlation( 1, "EDSI")
Cette fonction rajoute dans la phrase, en position 1, les traductions en Anglais, Allemand, Espagnol et Italien des mots-sens du mot situé en position 1.
|