Analyse syntaxique du français : des constituants aux dépendances

Marie Candito, Benoît Crabbé, Pascal Denis, François Guérin


Abstract
Cet article présente une technique d’analyse syntaxique statistique à la fois en constituants et en dépendances. L’analyse procède en ajoutant des étiquettes fonctionnelles aux sorties d’un analyseur en constituants, entraîné sur le French Treebank, pour permettre l’extraction de dépendances typées. D’une part, nous spécifions d’un point de vue formel et linguistique les structures de dépendances à produire, ainsi que la procédure de conversion du corpus en constituants (le French Treebank) vers un corpus cible annoté en dépendances, et partiellement validé. D’autre part, nous décrivons l’approche algorithmique qui permet de réaliser automatiquement le typage des dépendances. En particulier, nous nous focalisons sur les méthodes d’apprentissage discriminantes d’étiquetage en fonctions grammaticales.
Anthology ID:
2009.jeptalnrecital-long.4
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Adeline Nazarenko, Thierry Poibeau
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
31–40
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-long.4
DOI:
Bibkey:
Cite (ACL):
Marie Candito, Benoît Crabbé, Pascal Denis, and François Guérin. 2009. Analyse syntaxique du français : des constituants aux dépendances. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 31–40, Senlis, France. ATALA.
Cite (Informal):
Analyse syntaxique du français : des constituants aux dépendances (Candito et al., JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-long.4.pdf