Copyright (c) Memodata 1998-2005

Web Memodata 

 
       

 

LA PHONÉTIQUE

Disponible en C ou Java pour le français et l'anglais .

Les API phonétiques présentées servent à la recherche phonétique et à la correction phonétique.

I] Exemples d'utilisation

I.a] L'exemple de l'accès à des noms propres

La première page de l'annuaire téléphonique de CAEN donne par exemple : " AB DER HALDEN J. ", " ABBEILLES taxi ", " ABDALLAH S. et M. ", " ABDERHALDEN J. ", " ABDILLAHI-ADEM M. ", " ABGRALL Y. ", " ABOILARD C. ", " A CASA CORSA ", " ACCARION C. ", " ACCORSI C. ", ... Mille raisons pour éprouver des difficultés à connaître la graphie exacte!

Si vous souhaitez absolument rencontrer Monsieur ABGRALL, sans connaître l'orthographe de son nom, sachant que vous n'êtes pas sûr du son "B", qui vous fait douté du "P", l'usage d'un phonétiseur est pour vous, ou plutôt pour vos applications.

I.b] L'exemple de la recherche d'antériorité de noms de marques

Savez-vous, par exemple, que les noms des nouvelles variétés de plante sont soigneusement contrôlés : entre deux noms de plantes, un ancien et un nouveau, le nouveau nom doit respecter :
- suffisamment de différence graphiques (les lettres sont différentes)
- et phonétiques (l'enchaînement des sons doivent être différents).
Ce genre de contrôle avant enregistrement, au risque et péril du demandeur, peut représenter des heures de travail par un expert d'interrogation de bases de données de marque. Un phonétiseur fournit une économie de temps considérable à l'expert dans ce genre d'application, même quand il est équipé d'une base de données performante.

I.c] Autres exemples

BULLET2.GIF (958 octets) Réalisation d'une application de correction orthographique pour les mots courants du français (environ 400.000) (par exemple proposer 'vraisemblable' à partir de 'vraissemblable')
BULLET2.GIF (958 octets) Recherche des différentes graphies (transcription) utilisées pour désigner un même individu dans une base documentaire (ex: ELTSINE ou IELTSINE)
BULLET2.GIF (958 octets) Construction d'un index phonétique d'une base documentaire ou d'un annuaire pour faciliter (ou rendre possible) son interrogation .

II] Fonctionnement du phonétiseur

II.a] Il faut d'abord savoir phonétiser les mots, noms propres ou non.

Ici, phonétiser les mots, c'est fournir la forme phonétique la plus probable d'un mot nouveau. Voici le résultat pour quelques mots courants et moins courants :

Mot

Avec Accentuation

Sans Accentuation

Alphabet alfab& alfab&
Orthographe >ortograf ortograf
Edmond Rostand &dmo^ r<osta^ &dmo^ rosta^
Couvent kuva^ (n)
kuv (v)
kuva^ (n)
[kuv (n)]*
Superman syp&rman syperman
Shampooing $a^pwi^ $a^pwin
Chuquikanata $ykikanata $ykikanata
Agenda aji^da aji^da
geisha g&j$a g&j$a
varech var&k var&k
vraisemblable vr&sa^blabl vr&sa^blabl
transaction tra^zaksion tra^zaksion
Caesar c&zar c&sar

Résultat de la phonétisation par défaut

II.b] L'étape suivante consiste le plus souvent à conserver dans un index, généralement un index secondaire, le résultat de cette phonétique.
II.c] Puis on interroge cet index sur les différentes possibilités de prononciation possible,

Ici, un autre phonétiseur calcule des solutions moins évidentes.
Voici, au final, les résultat obtenus :
 

Saisie 1, ou Saisie 2, donneront la réponse :
ABDELCADER ABDELKADER ABD EL-KADER
ALEKEM ALEQUEM ALEIKHEM
ACOKA ACOCA ASOKA
BETOVENE BAITOVEN BEETHOVEN
CLITEMESTRE CLITMESTRE CLYTMNESTRE
CROUTCHEF KROUTCHEV KROUCHTCHEV
ESENAUER EISENOER EISENHOWER
EMMEBURGUEUR HAMBURGHER HAMBURGER
NITCHE NIETSHE NIETSCHE
MITRANT MITTERANT MITTERRAND
REMBRANT REMBRAND REMBRANDT
SCHOPENAUHEUR CHOPENOER SCHOPENHAUER

Quelques exemples de correction en environnement multilingue

 

Autres informations sur le phonétiseur - correcteur
Copyright (c) Memodata 1998-2005. Alexandria, Semiograph, Dicologic, Bibliotext, Ideoptima and Memodata are registered trademark of Memodata. See the dictionary Sensagent