Résumé automatique multi-document et indépendance de la langue : une première évaluation en français

Florian Boudin, Juan-Manuel Torres-Moreno


Abstract
Le résumé automatique de texte est une problématique difficile, fortement dépendante de la langue et qui peut nécessiter un ensemble de données d’apprentissage conséquent. L’approche par extraction peut aider à surmonter ces difficultés. (Mihalcea, 2004) a démontré l’intérêt des approches à base de graphes pour l’extraction de segments de texte importants. Dans cette étude, nous décrivons une approche indépendante de la langue pour la problématique du résumé automatique multi-documents. L’originalité de notre méthode repose sur l’utilisation d’une mesure de similarité permettant le rapprochement de segments morphologiquement proches. De plus, c’est à notre connaissance la première fois que l’évaluation d’une approche de résumé automatique multi-document est conduite sur des textes en français.
Anthology ID:
2009.jeptalnrecital-court.35
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Adeline Nazarenko, Thierry Poibeau
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
321–330
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-court.35
DOI:
Bibkey:
Cite (ACL):
Florian Boudin and Juan-Manuel Torres-Moreno. 2009. Résumé automatique multi-document et indépendance de la langue : une première évaluation en français. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 321–330, Senlis, France. ATALA.
Cite (Informal):
Résumé automatique multi-document et indépendance de la langue : une première évaluation en français (Boudin & Torres-Moreno, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-court.35.pdf