Évaluation de G-LexAr pour la traduction automatique statistique (Evaluation of G-Lexar for statistical machine translation)

Wigdan Mekki, Julien Gosme, Fathi Debili, Yves Lepage, Nadine Lucas


Abstract
G-LexAr est un analyseur morphologique de l’arabe qui a récemment reçu des améliorations substantielles. Cet article propose une évaluation de cet analyseur en tant qu’outil de pré-traitement pour la traduction automatique statistique, ce dont il n’a encore jamais fait l’objet. Nous étudions l’impact des différentes formes proposées par son analyse (voyellation, lemmatisation et segmentation) sur un système de traduction arabe-anglais, ainsi que l’impact de la combinaison de ces formes. Nos expériences montrent que l’utilisation séparée de chacune de ces formes n’a que peu d’influence sur la qualité des traductions obtenues, tandis que leur combinaison y contribue de façon très bénéfique.
Anthology ID:
2011.jeptalnrecital-court.40
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2011
Address:
Montpellier, France
Editors:
Mathieu Lafourcade, Violaine Prince
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
236–241
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-court.40
DOI:
Bibkey:
Cite (ACL):
Wigdan Mekki, Julien Gosme, Fathi Debili, Yves Lepage, and Nadine Lucas. 2011. Évaluation de G-LexAr pour la traduction automatique statistique (Evaluation of G-Lexar for statistical machine translation). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 236–241, Montpellier, France. ATALA.
Cite (Informal):
Évaluation de G-LexAr pour la traduction automatique statistique (Evaluation of G-Lexar for statistical machine translation) (Mekki et al., JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://aclanthology.org/2011.jeptalnrecital-court.40.pdf