Simbow : une mesure de similarité sémantique entre textes (Simbow : a semantic similarity metric between texts)

Delphine Charlet, Géraldine Damnati


Abstract
Cet article décrit une mesure de similarité sémantique non-supervisée qui repose sur l’introduction d’une matrice de relations entre mots, dans un paradigme de mesure cosinus entre sacs de mots. La métrique obtenue, apparentée à soft-cosinus, tient compte des relations entre mots qui peuvent être d’ordre lexical ou sémantique selon la matrice considérée. La mise en œuvre de cette métrique sur la tâche qui consiste à mesurer des similarités sémantiques entre questions posées sur un forum, a remporté la campagne d’évaluation SemEval2017. Si l’approche soumise à la campagne est une combinaison supervisée de différentes mesures non-supervisées, nous présentons dans cet article en détail les métriques non-supervisées, qui présentent l’avantage de produire de bons résultats sans nécessiter de ressources spécifiques autres que des données non annotées du domaine considéré.
Anthology ID:
2017.jeptalnrecital-court.16
Volume:
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
Month:
6
Year:
2017
Address:
Orléans, France
Editors:
Iris Eshkol-Taravella, Jean-Yves Antoine
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
126–133
Language:
French
URL:
https://aclanthology.org/2017.jeptalnrecital-court.16
DOI:
Bibkey:
Cite (ACL):
Delphine Charlet and Géraldine Damnati. 2017. Simbow : une mesure de similarité sémantique entre textes (Simbow : a semantic similarity metric between texts). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts, pages 126–133, Orléans, France. ATALA.
Cite (Informal):
Simbow : une mesure de similarité sémantique entre textes (Simbow : a semantic similarity metric between texts) (Charlet & Damnati, JEP/TALN/RECITAL 2017)
Copy Citation:
PDF:
https://aclanthology.org/2017.jeptalnrecital-court.16.pdf