LA PHONÉTIQUE
Disponible en C ou Java pour le français et l'anglais
Les API produisent des représentations phonétiques et permettent d'effecture de la correction phonétique.
I] Exemples d'utilisation
I.a] L'exemple de l'accès à des noms propres
La première page de l'annuaire téléphonique de CAEN donne par exemple : " AB DER HALDEN J. ", " ABBEILLES
taxi ", " ABDALLAH S. et M. ", " ABDERHALDEN
J. ", " ABDILLAHI-ADEM M. ", " ABGRALL Y. ", " ABOILARD C. ", " A CASA CORSA ",
" ACCARION C. ", " ACCORSI C. ", ...
Mille raisons pour éprouver des difficultés à connaître la graphie exacte!
Si vous souhaitez absolument rencontrer Monsieur ABGRALL, sans connaître l'orthographe de son nom,
sachant que vous n'êtes pas sûr du son "B", qui vous fait douter du "P", l'usage d'un phonétiseur est pour vous, ou
plutôt pour vos applications.
I.b] L'exemple de la recherche d'antériorité de noms de marques
Savez-vous, par exemple, que les noms des nouvelles variétés de plante sont soigneusement contrôlés :
entre deux noms de plantes, un ancien et un nouveau, le nouveau nom doit respecter :
- suffisamment de différence graphiques (les lettres sont différentes)
- et phonétiques (l'enchaînement des sons doivent être différents).
Ce genre de contrôle avant enregistrement, au risque et péril du demandeur, peut représenter des heures
de travail par un expert d'interrogation
de bases de données de marque. Un
phonétiseur fournit une économie de
temps considérable à l'expert dans ce
genre d'application, même quand il est
équipé d'une base de données
performante.
I.c] Autres exemples
- Réalisation
d'une application de correction orthographique pour les mots courants du français (environ 400.000) (par exemple
proposer vraisemblable à partir de vraissemblable)
- Recherche
des différentes graphies (transcription) utilisées pour désigner un même individu dans une base documentaire (ex: ELTSINE
ou IELTSINE)
- Construction
d'un index phonétique d'une base
documentaire ou d'un annuaire pour
faciliter (ou rendre possible) son
interrogation .
II] Fonctionnement du phonétiseur
II.a] Phonétiser les mots, noms propres ou non.
C'est
fournir la forme phonétique la plus
probable d'un mot nouveau. Voici le
résultat pour quelques mots courants et
moins courants :
Mot |
Avec
Accentuation |
Sans
Accentuation |
Alphabet |
alfab& |
alfab& |
Orthographe |
>ortograf |
ortograf |
Edmond Rostand |
&dmo^ r<osta^
|
&dmo^ rosta^ |
Couvent |
kuva^ (n)
kuv (v) |
kuva^ (n)
[kuv (n)]* |
Superman |
syp&rman |
syperman |
Shampooing |
$a^pwi^ |
$a^pwin |
Chuquikanata |
$ykikanata |
$ykikanata |
Agenda |
aji^da |
aji^da |
geisha |
g&j$a |
g&j$a |
varech |
var&k |
var&k |
vraisemblable |
vr&sa^blabl
|
vr&sa^blabl |
transaction |
tra^zaksion
|
tra^zaksion |
Caesar |
c&zar |
c&sar |
Résultat de la
phonétisation par défaut |
II.b] L'étape suivante consiste le
plus souvent à conserver dans un index,
généralement un index secondaire, le
résultat de cette phonétique.
II.c] Puis on interroge cet index
sur les différentes possibilités de
prononciation possible,
Ici, un autre phonétiseur calcule des
solutions moins évidentes.
Voici, au final, les résultat obtenus :
Saisie 1, ou |
Saisie 2, donneront
|
la réponse : |
ABDELCADER |
ABDELKADER |
ABD EL-KADER |
ALEKEM |
ALEQUEM |
ALEIKHEM |
ACOKA |
ACOCA |
ASOKA |
BETOVENE |
BAITOVEN |
BEETHOVEN |
CLITEMESTRE |
CLITMESTRE |
CLYTMNESTRE |
CROUTCHEF |
KROUTCHEV |
KROUCHTCHEV
|
ESENAUER |
EISENOER |
EISENHOWER |
EMMEBURGUEUR |
HAMBURGHER |
HAMBURGER |
NITCHE |
NIETSHE |
NIETZSCHE |
MITRANT |
MITTERANT |
MITTERRAND |
REMBRANT |
REMBRAND |
REMBRANDT |
SCHOPENAUHEUR |
CHOPENOER |
SCHOPENHAUER |
Quelques exemples
de correction en environnement
multilingue |
|