SENSE-LM : Extraction de références olfactives et auditives dans des textes, basée sur des représentations sensorimotrices et un modèle linguistique
Cédric Boscher  1@  , Christine Largeron  2@  , Veronique Eglin  3@  , Elöd Egyed-Zsigmond  4@  
1 : Laboratoire d'InfoRmatique en Image et Systèmes d'information
Institut National des Sciences Appliquées (INSA) - Lyon
2 : Laboratoire Hubert Curien
Université Jean Monnet - Saint-Etienne
3 : Laboratoire d'InfoRmatique en Image et Systèmes d'information
INSA Lyon, France
4 : Laboratoire d'InfoRmatique en Image et Systèmes d'information  (LIRIS)
Université Lumière - Lyon II, Université Claude Bernard - Lyon I (UCBL), Institut National des Sciences Appliquées [INSA] : EA- LYON, Ecole Centrale de Lyon, CNRS : UMR5205, Institut National des Sciences Appliquées [INSA]
Bâtiment Blaise Pascal - 20, avenue Albert Einstein - 69621 Villeurbanne cedex -  France

Bien que l'intelligence artificielle ait fait des avancées considérables dans de nombreux domaines, son application dans la recherche d'informations en sciences humaines et sociales reste peu exploitée. Elle présente pourtant un potentiel considérable pour des applications spécialisées telles que l'étude approfondie de la linguistique sensorielle. Les cinq sens – la vue, le goût, l'odorat, l'ouïe et le toucher – sont des concepts qui façonnent la perception du monde par l'être humain à traversdifférentes modalités. L'extraction de références sensorielles (c'est-à-dire, desexpressions en langage naturel qui évoquent la présence d'une expérience sensorielle) dans un corpus textuel est un sujet d'intérêt, avec de nombreuses applications dans divers domaines tels que les neurosciences ou l'étude de l'héritageculturel. Dans cet article, nous proposons SENSE-LM, un système d'extractiond'informations sensorielles dans de grandes collections de documents textuels. Basé sur la combinaison de modèles de langage et des ressources linguistiques telles que les normes sensorimotrices, il aborde la tâche d'extraction d'informations sensorielles à gros grain (classification binaire de phrases) et à grain fin (extraction de termes sensoriels). Notre évaluation de SENSE-LM pour deux fonctions sensorielles, l'Odorat et l'Ouïe, souligne une avancée considérable dans l'automatisation de ces tâches complexes.


Personnes connectées : 1 Vie privée
Chargement...