Copyright (c) Memodata 1998-2005

Web Memodata 

 

LA MORPHOLOGIE OEM

une extraction du DICTIONNAIRE INTÉGRAL


MEMODATA propose des dictionnaires morphologiques pour cinq langues. Les deux langues les plus couvertes par ces dictionnaires sont le français et l'anglais. Mais l'espagnol, par exemple, comprend plus de 400.000 formes!


I] Format des dictionnaires


Les dictionnaires morphologiques peuvent être fournis sous leur forme étendue ou sous leur forme réduite.


I.a] La forme étendue

La forme étendue d'un dictionnaire morphologique est une table qui associe à un lemme ses flexions.
Pour simplifier l'exploitation dans une base de données de ces dictionnaires étendus, il est courant de fournir le dictionnaire sous la forme d'une liste :
"ri";"rire";"V";"10610";"791";"47|";;"RI";"T"
"riaient";"rire";"V";"10610";"791";"12|";;"RIAIENT";"T"
"riais";"rire";"V";"10610";"791";"7|8|";;"RIAIS";"T"
"riait";"rire";"V";"10610";"791";"9|";;"RIAIT";"T"
"riant";"rire";"V";"10610";"791";"46|";;"RIANT";"T"
"rie";"rire";"V";"10610";"791";"25|27|";;"RIE";"T"
"rient";"rire";"V";"10610";"791";"6|30|";;"RIENT";"T"
...
"rires";"rire";"N";"110";"2";"92|";;"RIRES";"T"
...
"rîtes";"rire";"V";"10610";"791";"17|";;"RITES";"T"

Dans cette liste, nous trouvons :
* colonne 1 : la forme fléchie
* colonne 2 : le lemme
* colonne 3 : le type de modèle de flexion. En français, il peut valoir N, V, L ou I selon qu'il s'agit d'un nominal, d'un verbe, d'une locution ou d'un invariant
* colonne 4 : le numéro de modèle pour ce type
* colonne 5 : la catégorie grammaticale de la forme
* colonne 6 : la forme flexionnelle de la forme (temps, mode, personne...
* colonne 7: ...et toutes informations qui pourraient être utiles sur la forme, comme la fréquence, l'existence sous forme de locution, l'existence d'une deuxième graphie, un index majuscule...


[I.b] La forme abrégée

La forme abrégée d'un dictionnaire morphologique contient les mêmes informations, mais cette fois-ci il faut suivre un algorithme pour calculer les lemmes ou les flexions. On trouve donc dans les formes abrégées de tables morphologiques les types modèles et les modèles de lemmatisation et de flexion.
L'un des avantages des tables abrégées est qu'elles occupent en mémoire de 3 à 30 fois moins de place que leurs équivalents étendus. Cette avantage tend à disparaître du fait de la mémoire centrale actuellement.
Mais les tables abrégées présentent encore un avantage important pour la maintenance des dictionnaires, et donc pour l'utilisateur-concepteur de ceux-ci : elles permettent de substituer des dizaines de lignes où des erreurs sont toujours possibles par un simple code chiffré, que les interfaces évoluées comme Lexidiom proposent, pour aide, par ailleurs.


II] Les dictionnaires disponibles


II.a] Par type

Mots simples (rire)
Mots composés (rire jaune)
Tous les mots


II.b] Par langue


De nombreuses langues sont disponibles à la vente. Mais nous ne revendons que les données que nous avons conçues. Pour obtenir des précisions sur ce point, n'hésitez pas à nous contacter, soit pour obtenir nos tarifs, soit pour que l'on vous communique les coordonnées d'un autre fabricant.


III] Tarifs

De 150 € à 3.000€ selon le type d'utilisateur (université,...), le conditionnement, le contenu demandé...
La plupart des fichiers sont fournis par défaut en XML avec un contenu unicode utf-8. D'autres formats sont disponibles à la demande.



   
Copyright (c) Memodata 1998-2004. Alexandria, Le Sémiographe, Dicologique, Bibliotexte et Ideoptima sont des marques déposées de la société Memodata. Voir le dictionnaire Sensagent