Le corpus Text+Berg Une ressource parallèle alpin français-allemand (The Text+Berg Corpus An Alpine French-German Parallel Resource)

Anne Göhring, Martin Volk


Abstract
Cet article présente un corpus parallèle français-allemand de plus de 4 millions de mots issu de la numérisation d’un corpus alpin multilingue. Ce corpus est une précieuse ressource pour de nombreuses études de linguistique comparée et du patrimoine culturel ainsi que pour le développement d’un système statistique de traduction automatique dans un domaine spécifique. Nous avons annoté un échantillon de ce corpus parallèle et aligné les structures arborées au niveau des mots, des constituants et des phrases. Cet “alpine treebank” est le premier corpus arboré parallèle français-allemand de haute qualité (manuellement contrôlé), de libre accès et dans un domaine et un genre nouveau : le récit d’alpinisme.
Anthology ID:
2011.jeptalnrecital-court.17
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2011
Address:
Montpellier, France
Editors:
Mathieu Lafourcade, Violaine Prince
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
97–102
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-court.17
DOI:
Bibkey:
Cite (ACL):
Anne Göhring and Martin Volk. 2011. Le corpus Text+Berg Une ressource parallèle alpin français-allemand (The Text+Berg Corpus An Alpine French-German Parallel Resource). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 97–102, Montpellier, France. ATALA.
Cite (Informal):
Le corpus Text+Berg Une ressource parallèle alpin français-allemand (The Text+Berg Corpus An Alpine French-German Parallel Resource) (Göhring & Volk, JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://aclanthology.org/2011.jeptalnrecital-court.17.pdf