|
LA
PHONÉTIQUE
Disponible en C ou Java pour le français
et l'anglais .
Les API
phonétiques présentées servent à la
recherche phonétique et à la correction
phonétique.
I] Exemples
d'utilisation
I.a] L'exemple de
l'accès à des noms propres
La première page de
l'annuaire téléphonique de CAEN donne
par exemple : " AB DER HALDEN J. ", " ABBEILLES
taxi ", " ABDALLAH S. et M. ", " ABDERHALDEN
J. ", " ABDILLAHI-ADEM M. ", " ABGRALL
Y. ", " ABOILARD C. ", " A CASA CORSA ",
" ACCARION C. ", " ACCORSI C. ", ...
Mille raisons pour éprouver des
difficultés à connaître la graphie
exacte!
Si vous souhaitez
absolument rencontrer Monsieur ABGRALL,
sans connaître l'orthographe de son nom,
sachant que vous n'êtes pas sûr du son
"B", qui vous fait douté du "P", l'usage
d'un phonétiseur est pour vous, ou
plutôt pour vos applications.
I.b] L'exemple de la
recherche d'antériorité de noms de
marques
Savez-vous, par exemple,
que les noms des nouvelles variétés de
plante sont soigneusement contrôlés :
entre deux noms de plantes, un ancien et
un nouveau, le nouveau nom doit
respecter :
- suffisamment de différence graphiques
(les lettres sont différentes)
- et phonétiques (l'enchaînement des
sons doivent être différents).
Ce genre de contrôle avant
enregistrement, au risque et péril du
demandeur, peut représenter des heures
de travail par un expert d'interrogation
de bases de données de marque. Un
phonétiseur fournit une économie de
temps considérable à l'expert dans ce
genre d'application, même quand il est
équipé d'une base de données
performante.
I.c] Autres exemples
Réalisation
d'une application de correction
orthographique pour les mots courants du
français (environ 400.000) (par exemple
proposer 'vraisemblable' à partir de
'vraissemblable')
Recherche
des différentes graphies (transcription)
utilisées pour désigner un même individu
dans une base documentaire (ex: ELTSINE
ou IELTSINE)
Construction
d'un index phonétique d'une base
documentaire ou d'un annuaire pour
faciliter (ou rendre possible) son
interrogation .
II] Fonctionnement du phonétiseur
II.a] Il faut d'abord savoir
phonétiser les mots, noms propres ou
non.
Ici, phonétiser les mots, c'est
fournir la forme phonétique la plus
probable d'un mot nouveau. Voici le
résultat pour quelques mots courants et
moins courants :
|
Mot |
Avec
Accentuation |
Sans
Accentuation |
| Alphabet |
alfab& |
alfab& |
| Orthographe |
>ortograf |
ortograf |
| Edmond Rostand |
&dmo^ r<osta^
|
&dmo^ rosta^ |
| Couvent |
kuva^ (n)
kuv (v) |
kuva^ (n)
[kuv (n)]* |
| Superman |
syp&rman |
syperman |
| Shampooing |
$a^pwi^ |
$a^pwin |
| Chuquikanata |
$ykikanata |
$ykikanata |
| Agenda |
aji^da |
aji^da |
| geisha |
g&j$a |
g&j$a |
| varech |
var&k |
var&k |
| vraisemblable |
vr&sa^blabl
|
vr&sa^blabl |
| transaction |
tra^zaksion
|
tra^zaksion |
| Caesar |
c&zar |
c&sar |
|
Résultat de la
phonétisation par défaut |
II.b] L'étape suivante consiste le
plus souvent à conserver dans un index,
généralement un index secondaire, le
résultat de cette phonétique.
II.c] Puis on interroge cet index
sur les différentes possibilités de
prononciation possible,
Ici, un autre phonétiseur calcule des
solutions moins évidentes.
Voici, au final, les résultat obtenus :
|
Saisie 1, ou |
Saisie 2, donneront
|
la réponse : |
| ABDELCADER |
ABDELKADER |
ABD EL-KADER |
| ALEKEM |
ALEQUEM |
ALEIKHEM |
| ACOKA |
ACOCA |
ASOKA |
| BETOVENE |
BAITOVEN |
BEETHOVEN |
| CLITEMESTRE |
CLITMESTRE |
CLYTMNESTRE |
| CROUTCHEF |
KROUTCHEV |
KROUCHTCHEV
|
| ESENAUER |
EISENOER |
EISENHOWER |
| EMMEBURGUEUR |
HAMBURGHER |
HAMBURGER |
| NITCHE |
NIETSHE |
NIETSCHE |
| MITRANT |
MITTERANT |
MITTERRAND |
| REMBRANT |
REMBRAND |
REMBRANDT |
| SCHOPENAUHEUR |
CHOPENOER |
SCHOPENHAUER |
|
Quelques exemples
de correction en environnement
multilingue |
|