Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Exploitation quantitative de corpus de traductions annotés selon la typologie d'erreurs pour améliorer les méthodes d'enseignement de la traduction spécialisée
Natalie Kübler  1@  , Alexandra Mestivier  1@  , Mojca Pecman  1, *@  , Maria Zimina  1@  
1 : Centre de Linguistique Inter-langues, de Lexicologie, de Linguistique Anglaise et de Corpus-Atelier de Recherche sur la Parole  (CLILLAC-ARP)  -  Site web
Université Paris Diderot - Paris 7 : EA3967
8, place Ricoeur 75013 Paris -  France
* : Auteur correspondant

Les recherches expérimentales centrées sur l'enseignement de la traduction sur corpus constituent un paysage peu connu, où les travaux analysent surtout le ressenti des étudiants et très peu leurs productions (e.g. Bowker et Bennison 2003 ; Castagnoli et al. 2011). Notre étude tente de combler cette lacune en présentant une méthodologie d'enseignement de la traduction spécialisée qui exploite les avantages de l'analyse quantitative de traductions annotées selon la typologie d'erreurs. Cette méthodologie a été développée à l'Université Paris Diderot dans le cadre du Master Industrie des Langues et Traduction Spécialisée, en 2013-2014 (Kübler et al. 2015).

Les textes scientifiques en anglais que les étudiants ont à traduire sont segmentés en deux parties et traduits en français en deux temps dans des conditions différentes. Dans un premier temps, en utilisant une liste limitée de ressources dictionnairiques, sans apport de corpus (ER-TRAD-SP1) et, dans un deuxième temps, à l'aide de corpus spécialisés constitués par les étudiants (ER-TRAD-SP2). Les deux sous-corpus de traductions sont soumis à la procédure d'annotation d'erreurs de traduction selon la typologie MeLLANGE (Castagnoli et al. 2011) sur le serveur d'annotation BRAT (http://brat.nlplab.org).

Les traductions annotées au format BRAT sont ensuite converties en base textométrique et importées dans le logiciel Le Trameur (Fleury et Zimina 2014). A ce stade, chaque token est décrit par 5 niveaux d'annotations : forme, lemme, catégorie morphosyntaxique, catégorie d'erreur MeLLANGE (ou absence d'erreur), commentaire de l'annotateur (ou absence de commentaire).

Enfin, les traits caractéristiques des traductions réalisées avec et sans apport de corpus spécialisés sont analysés par la méthode des spécificités avec Le Trameur en croisant plusieurs niveaux d'annotations. Les résultats obtenus montrent que les items correspondant aux erreurs de traductions (toutes catégories confondues) sont nettement sous-représentés dans ER-TRAD-SP2. Ce constat confirme la pertinence de l'utilisation des corpus spécialisés. En outre, les catégories d'erreurs les plus saillantes et les schémas morphosyntaxiques qui les caractérisent sont analysés et exploités pour émettre des propositions méthodologiques en vue d'améliorer notre formation de traducteurs.

Cette expérimentation ouvre des perspectives pour étudier le processus de transfert du sens qui demeure une des activités langagières des plus complexes, notamment face aux besoins croissants en documents mutilingues touchant les discours spécialisés.

Bowker, Lynne and Peter Bennison (2003) “Student Translation Archive and Student Translation Tracking System. Design, Development and Application.” In Federico Zanettin; Silvia Bernardini and Dominic Stewart (eds) Corpora in translator education, Manchester: St. Jerome Publishing.

Castagnoli, Sara, Dragos Ciobanu, Natalie Kübler, Kerstin Kunz and Alexandra Volanschi (2011). “Designing a Learner Translator Corpus for Training Purposes”. In N. Kübler (ed) 2011 Corpora, Language, Teaching, and Resources : From Theory to Practice. Bern: Peter Lang.

Fleury, Serge and Maria Zimina (2014) “Trameur: A Framework for Annotated Text Corpora Exploration.” Proceedings of COLING 2014 the 25th International Conference on Computational Linguistics: System Demonstrations, August 2014, Dublin, Ireland.

Kübler, Natalie, Alexandra Mestivier et Mojca Pecman (2015) Etude sur l'utilisation des corpus dans l'enseignement de la terminologie et de la traduction spécialisée. Terrains de recherche en linguistique appliquée (TRELA). Conférence internationale, CLILLAC-ARP, Université Paris Diderot, Paris 8-10 juillet 2015.


Personnes connectées : 1