Une approche hybride traduction/correction pour la normalisation des SMS

Richard Beaufort, Sophie Roekhaut, Louise-Amélie Cougnon, Cédrick Fairon


Abstract
Cet article présente une méthode hybride de normalisation des SMS, à mi-chemin entre correction orthographique et traduction automatique. La partie du système qui assure la normalisation utilise exclusivement des modèles entraînés sur corpus. Evalué en français par validation croisée, le système obtient un taux d’erreur au mot de 9.3% et un score BLEU de 0.83.
Anthology ID:
2010.jeptalnrecital-long.12
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
111–120
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.12
DOI:
Bibkey:
Cite (ACL):
Richard Beaufort, Sophie Roekhaut, Louise-Amélie Cougnon, and Cédrick Fairon. 2010. Une approche hybride traduction/correction pour la normalisation des SMS. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 111–120, Montréal, Canada. ATALA.
Cite (Informal):
Une approche hybride traduction/correction pour la normalisation des SMS (Beaufort et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.12.pdf