Élaboration automatique d’un dictionnaire de cooccurrences grand public

Simon Charest, Éric Brunelle, Jean Fontaine, Bertrand Pelletier


Abstract
Antidote RX, un logiciel d’aide à la rédaction grand public, comporte un nouveau dictionnaire de 800 000 cooccurrences, élaboré essentiellement automatiquement. Nous l’avons créé par l’analyse syntaxique détaillée d’un vaste corpus et par la sélection automatique des cooccurrences les plus pertinentes à l’aide d’un test statistique, le rapport de vraisemblance. Chaque cooccurrence est illustrée par des exemples de phrases également tirés du corpus automatiquement. Les cooccurrences et les exemples extraits ont été révisés par des linguistes. Nous examinons les choix d’interface que nous avons faits pour présenter ces données complexes à un public non spécialisé. Enfin, nous montrons comment nous avons intégré les cooccurrences au correcteur d’Antidote pour améliorer ses performances.
Anthology ID:
2007.jeptalnrecital-long.26
Volume:
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2007
Address:
Toulouse, France
Editors:
Nabil Hathout, Philippe Muller
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
265–274
Language:
French
URL:
https://aclanthology.org/2007.jeptalnrecital-long.26
DOI:
Bibkey:
Cite (ACL):
Simon Charest, Éric Brunelle, Jean Fontaine, and Bertrand Pelletier. 2007. Élaboration automatique d’un dictionnaire de cooccurrences grand public. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 265–274, Toulouse, France. ATALA.
Cite (Informal):
Élaboration automatique d’un dictionnaire de cooccurrences grand public (Charest et al., JEP/TALN/RECITAL 2007)
Copy Citation:
PDF:
https://aclanthology.org/2007.jeptalnrecital-long.26.pdf