Analyse automatique vs analyse interactive : un cercle vertueux pour la voyellation, l’étiquetage et la lemmatisation de l’arabe

Fathi Debili, Zied Ben Tahar, Emna Souissi


Abstract
Comment produire de façon massive des textes annotés dans des conditions d’efficacité, de reproductibilité et de coût optimales ? Plutôt que de corriger les sorties d’analyse automatique moyennant des outils d’éditions éventuellement dédiés, ainsi qu’il estcommunément préconisé, nous proposons de recourir à des outils d’analyse interactive où la correction manuelle est au fur et à mesure prise en compte par l’analyse automatique. Posant le problème de l’évaluation de ces outils interactifs et du rendement de leur ergonomie linguistique, et proposant pour cela une métrique fondée sur le calcul du coût qu’exigent ces corrections exprimé en nombre de manipulations (frappe au clavier, clic de souris, etc.), nous montrons, au travers d’un protocole expérimental simple orienté vers la voyellation, l’étiquetage et la lemmatisation de l’arabe, que paradoxalement, les meilleures performances interactives d’un système ne sont pas toujours corrélées à ses meilleures performances automatiques. Autrement dit, que le comportement linguistique automatique le plus performant n’est pas toujours celui qui assure, dès lors qu’il y a contributions manuelles, le meilleur rendement interactif.
Anthology ID:
2007.jeptalnrecital-long.32
Volume:
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2007
Address:
Toulouse, France
Editors:
Nabil Hathout, Philippe Muller
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
325–334
Language:
French
URL:
https://aclanthology.org/2007.jeptalnrecital-long.32
DOI:
Bibkey:
Cite (ACL):
Fathi Debili, Zied Ben Tahar, and Emna Souissi. 2007. Analyse automatique vs analyse interactive : un cercle vertueux pour la voyellation, l’étiquetage et la lemmatisation de l’arabe. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 325–334, Toulouse, France. ATALA.
Cite (Informal):
Analyse automatique vs analyse interactive : un cercle vertueux pour la voyellation, l’étiquetage et la lemmatisation de l’arabe (Debili et al., JEP/TALN/RECITAL 2007)
Copy Citation:
PDF:
https://aclanthology.org/2007.jeptalnrecital-long.32.pdf