Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Comparer des AFC de cooccurrence généralisée
Jean-Marie Viprey  1@  
1 : ELLIADD-MSHE-UBFC – France  -  Site web
Université de Franche-Comté
UFC Place Goudimel 25030 Besançon Cedex -  France

En analyse de discours à consistance statistique la cooccurrence généralisée(Qocc) s'exprime par une matrice vocable/vocable destinée à l'AFC, qui met en évidence la structure réticulaire du vocabulaire d'après un paramétrage explicite et un choix des vocables à considérer. Beaucoup de chercheurs souhaitent comparer 2 ou n ensembles textuels selon cette optique. Nous proposons une méthode fondée sur l'angulation. Deux points d'un nuage forment par le centre un angle compris entre 0° et 180°, indépendant de l'effectif des vocables considérés tout en reflétant le système des écarts à l'équidistribution. Une fois déterminé cet angle pour toutes les paires de points dans un ensemble textuel A, puis dans une autre, B sur une liste commune de n vocables, on dispose n²/2 différences d'angles, dont la moyenne pour un vocable témoigne de sa migration relative dans le nuage, donc d'un éventuel changement de sa distribution harrissienne, i.e. de sa signifiance. On propose une application à un corpus Balzac-Stendhal-Flaubert, globale puis focalisée sur le lemme homme.


Personnes connectées : 1