Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Analyser les corpus des avis en ligne : Analyse lexicale exploratoire et/ou modélisation sémantique ?
Jean Moscarola  1@  , Younès Boughzala  2@  
1 : Institut de Recherche en Gestion et en Economie  (IREGE)  -  Site web
Université de Savoie, Institut d'Administration des Entreprises (IAE) - Savoie Mont-Blanc
Université de Savoie IAE Savoie Mont-Blanc 4, chemin de Bellevue B.P. 80439 74944 Annecy-le-Vieux Cedex -  France
2 : Le Sphinx  (Le Sphinx)  -  Site web
Le Sphinx
27 rue Cassiopée - Parc Altais - 74650 Chavanod -  France

 

L'objectif de ce papier est de présenter et illustrer un exemple d'Analyse de Données Textuelles (ADT) provenant du Web en mettant en place deux approches : exploratoire à travers les classifications lexicales, et confirmatoire à travers la modélisation sémantique. Pour ce faire, 600 commentaires en ligne de touristes français évaluant des hébergements en Algérie, au Maroc et en Tunisie sont collectés sur le site de commentaires en ligne TripAdvisor.com. L'objectif de cette collecte est d'étudier la perception expérientielle de ces 3 destinations touristiques selon le type d'hébergement choisi : hôtel ou maison d'hôte.

Les corpus disponibles sur le Web (commentaires sur les sites spécialisés, les réseaux sociaux, etc.) présentent l'avantage d'être abondants, indépendants et spontanés mais non structurés. Leur exploration est une nouvelle voie de recherche en sciences humaines et sociales. Pour les analyser, les méthodes traditionnelles des ADT (propriétés lexicales) doivent être enrichies par des approches sémantiques ad hoc (construction et application de thésaurus) et des analyses de sentiment.

En se basant sur cet exemple de corpus importé depuis le Web, nous présenterons de manière pratique et accessible les apports et la richesse de cette combinaison d'approches pour les chercheurs en sciences humaines et sociales et les professionnels des études.


Personnes connectées : 1