Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Lecture Textométrique Différentielle (LTD) de textes législatifs comparables de l'Union européenne
Stéphane Patin  1@  , Maria Zimina  1, *@  , Serge Fleury  2, *@  
1 : Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole  (CLILLAC-ARP)  -  Site web
Université Paris Diderot - Paris 7 : EA3967
8, place Ricoeur 75013 Paris -  France
2 : Langage, systèmes, discours  (CLESTHIA)  -  Site web
Université Paris III - Sorbonne nouvelle : EA7345
* : Auteur correspondant

Nous appelons Lecture Textométrique Différentielle (LTD) une stratégie de lecture de textes comparables appuyée par l'affichage synchrone des résultats de leur analyse textométrique parallèle (différences ou similarités caractéristiques). Les deux ensembles textuels sont affichés simultanément à l'écran pour faciliter les comparaisons. La différentiation mobilise le calcul des spécificités : les éléments caractéristiques sélectionnés par seuillage dans chacun des ensembles textuels comparés sont rendus « visibles » au fil des textes par un système de surlignage. La LTD est enrichie par la projection des résultats issus du calcul des répétitions segmentales sur annotations multiples afin de garantir une prise en main « globale » de la différentiation à plusieurs niveaux d'analyse linguistique.

Le recours à la LTD comme outil méthodologique peut avoir plusieurs objectifs. Elle peut aider à cerner un phénomène par l'examen des différentes causes, facteurs et processus qui y sont liés. Par exemple, la LTD appliquée à des textes législatifs issus du droit communautaire, et du droit national permet une meilleure compréhension des variétés juridiques.

Dans cette perspective, le présent travail prend appui sur le volet français du corpus comparable multilingue de la Faculté de traduction et d'interprétation de Rome élaboré dans le cadre du projet international Observatoire sur l'eurolecte. Analyse interlinguistique et intralinguistiques des variétés juridiques dans l'Union européenne. Ce volet est constitué des 660 directives de l'Union européenne de 1998 à 2008 (Corpus A) et de leur transposition en France, dans 129 textes de lois et ordonnances (Corpus B), comptabilisant, respectivement, 4 181 496 et 1 862 241 occurrences.

La question de la caractérisation de la langue communautaire européenne suscite un intérêt grandissant parmi les linguistes, traducteurs et juristes comme en témoigne la littérature de plus en plus abondante sur ce sujet (Fischer 2010 ; Biel 2014). Notre étude cherche, à localiser, quantifier et interpréter les différences « textuelles » entre les deux corpus afin de mettre en lumière les propriétés de l'eurolecte. Pour y parvenir, on déploie la stratégie de la LTD avec Le Trameur (Fleury et Zimina, 2014). Cette approche outillée nous permet d'apprécier les emplois spécifiques à chacun de deux corpus, comme ceux relevant d'une énonciation imprécise (pronom personnel, pronom indéfini, etc.) pour le Corpus A, ou ceux dénotant le travail de transposition des normes européennes pour le Corpus B.


Personnes connectées : 1