Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Cooccurrences spécifiques et représentations graphiques, le nouveau « Thème » d'Hyperbase
Laurent Vanni  1@  , Adiel Mittmann * @
1 : Bases, Corpus, Langage  -  Site web
CNRS : UMR7320
* : Auteur correspondant

Le calcul des cooccurrents spe ́cifiques d'un mot est une des me ́thodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction “The`me” qui rend compte du lexique surutilise ́ autour d'une forme, d'une structure grammaticale ou d'un lemme. La repre ́sentation graphique d'une telle analyse est souvent loin d'eˆtre e ́vidente. Plus que la simple liste des cooccurrents spe ́cifiques, elle se doit de nous indiquer aussi l'ordre, l'e ́cart ainsi que les relations entre chaque paire de mots. Avec l'arrive ́e de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi lui permettant d'identifier la cooccurrence de deuxie`me niveau. La repre ́sentation graphique, quant a` elle, fait le pari de simplifier la lecture du re ́sultat de cette analyse tout en explicitant plus pre ́cise ́ment les calculs sous-jacents. 


Personnes connectées : 1