MEMODATA propose des dictionnaires morphologiques pour
cinq langues. Les deux langues les plus couvertes par ces dictionnaires
sont le français et l'anglais. Mais l'espagnol, par exemple, comprend plus de 400.000
formes!
I] Format des dictionnaires
Les dictionnaires morphologiques peuvent être fournis
sous leur forme étendue ou sous leur forme réduite.
I.a] La forme étendue
La forme étendue d'un dictionnaire morphologique est une
table qui associe à un lemme ses flexions.
Pour simplifier l'exploitation dans une base de données de
ces dictionnaires étendus, il est courant de fournir le dictionnaire sous la forme d'une
liste :
"ri";"rire";"V";"10610";"791";"47|";;"RI";"T"
"riaient";"rire";"V";"10610";"791";"12|";;"RIAIENT";"T"
"riais";"rire";"V";"10610";"791";"7|8|";;"RIAIS";"T"
"riait";"rire";"V";"10610";"791";"9|";;"RIAIT";"T"
"riant";"rire";"V";"10610";"791";"46|";;"RIANT";"T"
"rie";"rire";"V";"10610";"791";"25|27|";;"RIE";"T"
"rient";"rire";"V";"10610";"791";"6|30|";;"RIENT";"T"
...
"rires";"rire";"N";"110";"2";"92|";;"RIRES";"T"
...
"rîtes";"rire";"V";"10610";"791";"17|";;"RITES";"T"
Dans cette liste, nous trouvons :
* colonne 1 : la forme fléchie
* colonne 2 : le lemme
* colonne 3 : le type de modèle de flexion. En français, il peut valoir N, V, L ou I
selon qu'il s'agit d'un nominal, d'un verbe, d'une locution ou d'un invariant
* colonne 4 : le numéro de modèle pour ce type
* colonne 5 : la catégorie grammaticale de la forme
* colonne 6 : la forme flexionnelle de la forme (temps, mode, personne...
* colonne 7: ...et toutes informations qui pourraient être utiles sur la forme, comme la
fréquence, l'existence sous forme de locution, l'existence d'une deuxième graphie, un
index majuscule...
[I.b] La forme abrégée
La forme abrégée d'un dictionnaire morphologique contient les
mêmes informations, mais cette fois-ci il faut suivre un algorithme pour calculer les
lemmes ou les flexions. On trouve donc dans les formes abrégées de tables morphologiques
les types modèles et les modèles de lemmatisation et de flexion.
L'un des avantages des tables abrégées est qu'elles occupent en
mémoire de 3 à 30 fois moins de place que leurs équivalents étendus. Cette avantage
tend à disparaître du fait de la mémoire centrale actuellement.
Mais les tables abrégées présentent encore un avantage
important pour la maintenance des dictionnaires, et donc pour l'utilisateur-concepteur de
ceux-ci : elles permettent de substituer des dizaines de lignes où des erreurs sont
toujours possibles par un simple code chiffré, que les interfaces évoluées comme
Lexidiom proposent, pour aide, par ailleurs.
II] Les dictionnaires disponibles
II.a] Par type
Mots simples (rire)
Mots composés (rire jaune)
Tous les mots
II.b] Par langue
De nombreuses langues sont disponibles à la vente. Mais nous ne revendons que les données que nous avons conçues.
Pour obtenir des précisions sur ce point, n'hésitez pas à nous contacter, soit pour obtenir nos tarifs, soit pour que l'on vous communique les coordonnées d'un autre fabricant.
III] Tarifs
De 150 € à 3.000€ selon le type d'utilisateur (université,...), le
conditionnement, le contenu demandé...
La plupart des fichiers sont fournis par défaut en XML avec un contenu unicode utf-8.
D'autres formats sont disponibles à la demande.
|