Journées internationales d'Analyse statistique des Données Textuelles
7-10 juin 2016 Nice (France)
Deux méthodes d'annotation de la conceptualisation métaphorique dans un corpus parallèle : On the Origin of Species de Charles Darwin
Eve-Marie Gendron-Pontbriand  1@  , Sylvie Vandaele  1@  , Yan Bodain  2@  
1 : Département de linguistique et de traduction, Université de Montréal  -  Site web
Pavillon Lionel-Groulx C. P. 6128, succursale Centre-ville Montréal (Québec) H3C 3J7 -  Canada
2 : Département de systèmes d'information et méthodes quantitatives de gestion, Université de Sherbrooke  -  Site web
2500, boul. de l'Université Sherbrooke (Québec) J1K 2R1 -  Canada

La conceptualisation métaphorique est omniprésente dans les textes scientifiques et soulève des problèmes quant à sa traduction. Nous proposons deux méthodes d'annotation faisant appel au langage XML, adaptées à l'étude de corpus traduits, et qui découlent d'une méthode antérieurement décrite pour la caractérisation de corpus comparables. La problématique a été soulevée dans le cadre d'une analyse des traductions françaises de On the Origin of Species de Charles Darwin, une œuvre scientifique phare reconnue pour sa richesse métaphorique. La première stratégie d'annotation fait appel au langage XLink pour établir un lien unidirectionnel entre fichiers contenant les textes source et cible. Dans la deuxième stratégie, l'annotation est subséquente à un alignement des textes source et cible. Les deux méthodes sont évaluées en fonction de leur faisabilité, de l'ergonomie de l'annotation et de l'usage en aval des fichiers annotés. Elles permettent d'obtenir des résultats quantitatifs exploitables statistiquement à l'aide de tests non paramétriques tels que le X2.


Personnes connectées : 1