Copyright (c) Memodata 1998-2005

Web Memodata 

 

LA PHONÉTIQUE

Disponible en C ou Java pour le français et l'anglais

Les API produisent des représentations phonétiques et permettent d'effecture de la correction phonétique.

I] Exemples d'utilisation

I.a] L'exemple de l'accès à des noms propres

La première page de l'annuaire téléphonique de CAEN donne par exemple : " AB DER HALDEN J. ", " ABBEILLES taxi ", " ABDALLAH S. et M. ", " ABDERHALDEN J. ", " ABDILLAHI-ADEM M. ", " ABGRALL Y. ", " ABOILARD C. ", " A CASA CORSA ", " ACCARION C. ", " ACCORSI C. ", ...
Mille raisons pour éprouver des difficultés à connaître la graphie exacte!

Si vous souhaitez absolument rencontrer Monsieur ABGRALL, sans connaître l'orthographe de son nom, sachant que vous n'êtes pas sûr du son "B", qui vous fait douter du "P", l'usage d'un phonétiseur est pour vous, ou plutôt pour vos applications.

I.b] L'exemple de la recherche d'antériorité de noms de marques

Savez-vous, par exemple, que les noms des nouvelles variétés de plante sont soigneusement contrôlés : entre deux noms de plantes, un ancien et un nouveau, le nouveau nom doit respecter :
- suffisamment de différence graphiques (les lettres sont différentes)
- et phonétiques (l'enchaînement des sons doivent être différents).
Ce genre de contrôle avant enregistrement, au risque et péril du demandeur, peut représenter des heures de travail par un expert d'interrogation de bases de données de marque. Un phonétiseur fournit une économie de temps considérable à l'expert dans ce genre d'application, même quand il est équipé d'une base de données performante.

I.c] Autres exemples

- Réalisation d'une application de correction orthographique pour les mots courants du français (environ 400.000) (par exemple proposer vraisemblable à partir de vraissemblable)

- Recherche des différentes graphies (transcription) utilisées pour désigner un même individu dans une base documentaire (ex: ELTSINE ou IELTSINE)

- Construction d'un index phonétique d'une base documentaire ou d'un annuaire pour faciliter (ou rendre possible) son interrogation .

II] Fonctionnement du phonétiseur

II.a] Phonétiser les mots, noms propres ou non.

C'est fournir la forme phonétique la plus probable d'un mot nouveau. Voici le résultat pour quelques mots courants et moins courants :

Mot

Avec Accentuation

Sans Accentuation

Alphabet alfab& alfab&
Orthographe >ortograf ortograf
Edmond Rostand &dmo^ r<osta^ &dmo^ rosta^
Couvent kuva^ (n)
kuv (v)
kuva^ (n)
[kuv (n)]*
Superman syp&rman syperman
Shampooing $a^pwi^ $a^pwin
Chuquikanata $ykikanata $ykikanata
Agenda aji^da aji^da
geisha g&j$a g&j$a
varech var&k var&k
vraisemblable vr&sa^blabl vr&sa^blabl
transaction tra^zaksion tra^zaksion
Caesar c&zar c&sar

Résultat de la phonétisation par défaut

II.b] L'étape suivante consiste le plus souvent à conserver dans un index, généralement un index secondaire, le résultat de cette phonétique.

II.c] Puis on interroge cet index sur les différentes possibilités de prononciation possible,

Ici, un autre phonétiseur calcule des solutions moins évidentes.
Voici, au final, les résultat obtenus :
 

Saisie 1, ou Saisie 2, donneront la réponse :
ABDELCADER ABDELKADER ABD EL-KADER
ALEKEM ALEQUEM ALEIKHEM
ACOKA ACOCA ASOKA
BETOVENE BAITOVEN BEETHOVEN
CLITEMESTRE CLITMESTRE CLYTMNESTRE
CROUTCHEF KROUTCHEV KROUCHTCHEV
ESENAUER EISENOER EISENHOWER
EMMEBURGUEUR HAMBURGHER HAMBURGER
NITCHE NIETSHE NIETZSCHE
MITRANT MITTERANT MITTERRAND
REMBRANT REMBRAND REMBRANDT
SCHOPENAUHEUR CHOPENOER SCHOPENHAUER

Quelques exemples de correction en environnement multilingue

 

Autres informations sur le phonétiseur - correcteur

Installer Alexandria sur vos sites web.

Double-cliquer sur les mots de cette page pour ouvrir les dictionnaires.

 

 

 

 

 

 >

 >

 >

Copyright (c) Memodata 1998-2004. Alexandria, Le Sémiographe, Dicologique, Bibliotexte et Ideoptima sont des marques déposées de la société Memodata. Voir le dictionnaire Sensagent