Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Mot à mot, brin par brin : les suites [Nom préposition Nom]comme indice de littérarité
Véronique Magri, Gérald Purnelle * , Dominique Legallois * @

Lors des JADT 2012, la théorie du motif avait été évaluée à l'aune des séquences Nom-préposition-Nom, restreintes aux cas où les deux noms sont identiques. Le corpus était alors constitué d'un extrait de Frantext, base catégorisée, qui offrait un échantillon des quatre genres littéraires principaux, les mémoires (109 textes), les romans (740 textes), la poésie (191 textes) et le théâtre (210 textes), soit près de 85 millions de mots. Ce premier travail exploratoire a montré que le motif NpN se situe entre langue et discours et se développe comme motif discursif susceptible de produire un effet stylistique corrélé à l'innovation lexicale. Il intervient aussi comme possible marqueur générique.

La présente communication entend poursuivre cette recherche en développant le corpus de de travail et en proposant de nouvelles études contrastives, susceptibles d'évaluer la suite NpN comme marqueur de littérarité.

Il est envisagé de confronter deux corpus, l'un composé d'articles journalistiques, l'autre de textes littéraires. Ces deux grands ensembles feront l'objet de partitions internes afin d'introduire des comparaisons plus fines. Le corpus médiatique se distribuera en deux sous-corpus, l'un constitué de deux quotidiens nationaux, Le Monde et Libération, l'autre de deux journaux régionaux, Ouest-France et l'Est Républicain. On pourra adjoindre une base de journaux francophones (Varitex de Sascha Diwersy). Le corpus littéraire se déclinera en sous-genres, extraits de Frantext, le roman, la poésie, le théâtre, les mémoires et on introduira un critère chronologique avec une base de romans contemporains.

L'objectif est d'observer le comportement de la suite NpN dans ces différents corpus et de mesurer les variations d'emploi, le cas échéant, d'un corpus à l'autre, tout en posant la question de son fonctionnement comme indice éventuel de littérarité.



  • Autre
Personnes connectées : 2