Apport d’un corpus comparable déséquilibré à l’extraction de lexiques bilingues

Emmanuel Morin


Abstract
Les principaux travaux en extraction de lexiques bilingues à partir de corpus comparables reposent sur l’hypothèse implicite que ces corpus sont équilibrés. Cependant, les différentes méthodes computationnelles associées sont relativement insensibles à la taille de chaque partie du corpus. Dans ce contexte, nous étudions l’influence que peut avoir un corpus comparable déséquilibré sur la qualité des terminologies bilingues extraites à travers différentes expériences. Nos résultats montrent que sous certaines conditions l’utilisation d’un corpus comparable déséquilibré peut engendrer un gain significatif dans la qualité des lexiques extraits.
Anthology ID:
2009.jeptalnrecital-long.6
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Adeline Nazarenko, Thierry Poibeau
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
51–60
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-long.6
DOI:
Bibkey:
Cite (ACL):
Emmanuel Morin. 2009. Apport d’un corpus comparable déséquilibré à l’extraction de lexiques bilingues. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 51–60, Senlis, France. ATALA.
Cite (Informal):
Apport d’un corpus comparable déséquilibré à l’extraction de lexiques bilingues (Morin, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-long.6.pdf