Cette fonction permet de ne garder dans une phrase que les mots-sens ayant un bon score de distance (si activation = false) ou d'activation (si activation = true).
void resume ( Phrase une phrase, boolean activation )
Note : la phrase est ici comprise comme un ensemble de mots qui regroupent plusieurs mots-sens, pouvant être issus de plusieurs phrases syntaxiques. Il s'agit d'une phrase sémantique dans laquelle on effectue une recherche de redondance sémantique.
Un bonne majorité des moteurs de recherche grand public dont Yahoo, Altavista, Lycos ou Voilà, affiche un extrait du document. Il s'agit bien généralement des deux ou trois premières lignes, et non pas phrases, de ce dernier...ce qui nous donne un texte souvent très peu informationnel. Excite, quant à lui, nous propose un "résumé automatique", qui se révèle être, à défaut de résumé une collecte fixe de cinq phrases prises ça et là dans le document. Les seuls outils fournissant un résumé intéressant sont bien entendu ceux rédigés manuellement (AliWeb, Magellan), mais en contre partie, très peu de documents sont disponibles avec ce type de résumé. Comme nous le voyons, certains choisissent de privilégier la quantité plutôt que la qualité (extrait des documents), d'autres font l'inverse (résumé manuel). Il serait donc intéressant de se poser le problème de réussir à combiner quantité et qualité, c'est à dire parvenir à générer pour chaque document un résumé automatique. Comme nous l'avons vu, divers travaux existent dans ce domaine et les résultats semblent réellement exploitables. Il serait donc intéressant d'étudier s'il était possible d'adapter de tels systèmes aux contraintes imposées par Internet.
L'apparition de très récentes technologies comme le workflow qui s'occupe de gérer au mieux l'activité des grandes sociétés au niveau de la communication des tâches au cours d'un processus de travail, peuvent servir de terrain de choix à un système de résumé automatique de texte. En effet, dans ces sociétés, la circulation des textes écrits non traités représente toujours un temps précieux de traitement qu'un système de résumé automatique de texte pourrait réduire en vue d'une meilleure productivité.
| Le résumé automatique des textes techniques et scientifiques | Résumé automatique par filtrage sémantique d’informations |