Introduction
Les réflexions qui suivent sont le résultat d’une série de séances de traduction en classe de deuxième année de master Traduction à l’université d’Orléans, intégrant l’utilisation et la critique de la version gratuite de DeepL de façon différenciée lors du premier semestre 2024.
Les séances de traduction sont basées sur des textes "pragmatiques" qui présentaient à la fois un faible degré de technicité, et une proportion variable de « littérarité » : de fragments de texte pouvant présenter des aspects littéraires (figures de styles, jeux sur les termes employés etc…). Les stratégies de traduction des étudiants seront surtout analysées à la lumière de ces segments plus « littéraires », pour lesquels le postulat est qu’une seule étape de PE (post-édition) n'est ni cohérente, ni suffisante.
Si la TAN (Traduction automatique neuronale) est désormais utilisée par défaut en traduction spécialisée, le débat quant à son utilisation dans la cadre de textes créatifs est un axe de recherche en plein essor et suscite de multiples questions du type : est-elle possible, sur quel type de machine spécialisée, est-elle souhaitable, ou même en adéquation avec un exercice qui par essence requiert du temps et la prise en compte du paratexte, de l’intertexte, du ressenti personnel ?
Les récentes normes ISO régissant l’utilisation de la TA stipulent l’obligation d’une phase de post-édition (PE). Or, l’efficacité-même de cette phase a été remise en question :
Nous pouvons donc constater qu’en l’absence d’une formation spécifique en PE en général (…) les apprenant˖e˖s ont tendance à éprouver des difficultés à se détacher des propositions de la TAN ; ces derniers et dernières ont d’ailleurs conscience de la marge d’amélioration possible pour leurs textes post-édités. (CHAUVEAU, DE FARIA PIRES, 2024)
Ces quelques séances utilisant des textes à la fois généralistes et créatifs ont été agencées dans le but d’explorer des pistes qui faciliteraient un plus grand détachement des étudiants par rapport aux propositions de la TAN, de démontrer que cette unique phase de post-édition se révèle insuffisante, voire néfaste.
Les tentatives d’établir des normes pour l'utilisation de la TA sont déjà nombreuses. Si d'après la plupart de celles-ci, la « machine translation literacy » comporte un pan « critique » elle ne fait aucune distinction des types de texte traités et s’apparente davantage à un plaidoyer pour une utilisation efficace et déontologique de l’IA (Intelligence Artificielle). « Students especially need to gain AI literacy (…). We must be ready and forward thinking to adapt and succeed. » (ANDERS, 2023)
La succession d’ateliers analysée infra avait pour but que les étudiants puissent comparer et critiquer les différentes façons d’intégrer la TAN, d’en apprécier les limites, en commençant par une utilisation du type de celle qui se pratique désormais professionnellement pour la traduction pragmatique, à savoir la production d’une pré-traduction automatique suivie d’une phase de post-édition.
1. Intégration la TA de façon classique, (TAN + PE), résultats et retour des étudiants de deuxième année de Master Traduction et Communication Multilingue à Orléans (18 étudiants), septembre 2024.
Les exercices sont suivis de questionnaires (les questions sont suivies des réponses les plus représentatives) :
-
Did you feel the register chosen by AI was adequate?
-
it missed the metaphors / it depends / YES
-
-
How much of the text (in percent) do you figure AI got wrong?
-
5 % > 40 %
-
-
How much time do you reckon AI saved?
-
15’, a lot of time, more than half…
-
-
Would you have produced a totally different translation without it? A slightly different one? A similar one? A very similar one (apart from a handful of terms)?
-
Slightly different, similar, close, not in my case…
-
-
In that particular register, what is the main pitfall of MT?
-
Too literal, doesn’t take into account the poetic side of literature and such
-
Someone has to verify what MT did and edit it the right way. I guess the fluidness … ?
-
It was sometimes too literal, and used the wrong equivalents. It also couldn’t understand references (Heath Robinson) / MT’s translations are not idiomatic enough.
-
- the main pitfall would be to just copying without correcting / - main pitfall would be to copy and paste the AI translation because it contains a lot of literal translation
-
- the sense /-Repetition /-vocabulary register, syntax / the understanding of metaphors and literary devices.
-
- It is too literal / les termes propres au cinéma ne sont pas toujours traduits avec précision
-
- MT often fails to capture the whole meaning of a metaphor / produces too literal translations
-
-
Can you give a French equivalent for …
-
50 % de bonnes réponses sur les mots clefs
-
Les réponses sont mitigées quant à la qualité des pré-traductions, et très variables quant à l'économie de temps. Pour les termes "clefs", une bonne moitié se souvient de la traduction utilisée dans le contexte. La trop grande littéralité de la pré-traduction, et la mauvaise traduction des métaphores est mentionnée neuf fois, soit dans la moitié des réponses, comme étant l’écueil principal.
Cet écueil est indéniable dans l’extrait suivant, traduit avec la version gratuite de DeepL, https://www.deepl.com/fr/translator :
The violence of the edit, slamming image against image. Time chopped up. reordered, reversed. Sex and death and primal images. Narrative exploded. The magic of montage, film sculpted in the splices on the editing deck. "Film has to be formally interesting. Jenkin says. "I love films that foreground the fact that you are watching film."
Walkabout imprinted itself on Jenkins brain. It led to his early work as an editor in 'TV and music video, then a return to his native Cornwall and a long period of formal experimentation with shorts and documentaries, usually shot on celluloid and hand-developed at home through some strange Heath Robinson-type contraptions. This was the technique he used for his breakout first feature Bait (2019), a weird artefact of a film that seemed to bob up to the surface from the primordial deep. images looming out of beat-up celluloid.
La violence du montage, le claquement de l'image contre l'image. Le temps est haché, réorganisé, inversé. Le sexe, la mort et les images primaires. La narration a explosé. La magie du montage, le film sculpté dans les raccords sur la table de montage. « Le film doit être formellement intéressant. dit Jenkin. « J'aime les films qui mettent en avant le fait que vous regardez un film.
Walkabout s'est imprimé dans le cerveau de Jenkins. Il a commencé à travailler comme monteur pour la télévision et les vidéos musicales, avant de retourner dans sa Cornouailles natale et d'entamer une longue période d'expérimentation formelle avec des courts métrages et des documentaires, généralement tournés sur celluloïd et développés à la main chez lui à l'aide d'étranges appareils de type Heath Robinson. C'est cette technique qu'il a utilisée pour son premier long métrage Bait (2019), un artefact étrange d'un film qui semble remonter à la surface depuis les profondeurs primordiales. Des images surgissant d'un celluloïd déglingué. (https://www.deepl.com/fr/translator)
Effectivement, si la partie technique semble assez efficacement rendue, ce n’est pas le cas pour les effets de style où le texte met en scène ce qui se passe au niveau du montage dans le film Walkabout. Les formes nominales et verbales épurées et simplement alignées sont rendues de façon plus « habillée », (narrative exploded la narration a explosé), aussi, la métaphore « bob up to the surface » est rendue par un « remonter à la surface », bien moins imagé.
Cette première expérience a donc déclenché une prise de conscience de deux (au moins) niveaux de littérarité dans cet article apparemment spécialisé et non littéraire, et semé le doute quant à la capacité de la machine (dans son état actuel) à traiter les segments plus « littéraires » ou créatifs.
2. Utilisation différenciée de la TAN
Lors d'une deuxième phase, les étudiants pouvaient choisir de procéder à un « repérage stylistique » avant de procéder à une pré-traduction TAN pour la traduction d'un extrait d'article scientifique traitant de l'évaluation de la TA
-
Consigne : « Choose! You can either:
1. Pre-check, spot difficult, ambiguous chunks, and then use DeepL to create a pre-translation, which you will then check, especially where you had spotted difficulties.
2. Produce a pre-translation which you then post-edit carefully.
Voici un extrait dont les résultats traduits des deux options, et leur analyse, ont conforté le besoin de ne pas se satisfaire d’une pré-traduction post-éditée :
We present a framework for machine translation evaluation using neural networks in a pairwise setting, where the goal is to select the better translation from a pair of hypotheses, given the reference translation. (https://arxiv.org/abs/1912.03135)
Nous présentons un cadre pour l'évaluation des traductions automatiques à l'aide de réseaux neuronaux dans un contexte de paires, où l'objectif est de sélectionner la meilleure traduction à partir d'une paire d'hypothèses, étant donné la traduction de référence. (DeepL)
-
Avec phase de pré-repérage :
Cet article présente un cadre pour l'évaluation de la traduction automatique à l'aide de réseaux neuronaux en paires / qui utilisent les paires, l'objectif est de sélectionner la meilleure traduction à partir d'une paire d'hypothèses, en fonction de la traduction de référence fournie. (Étudiant X)
-
Sans phase de pré-repérage :
Nous présentons un cadre pour l'évaluation de la traduction automatique à l'aide de réseaux neuronaux dans un contexte de paires, où l'objectif est de sélectionner la meilleure traduction à partir d'une paire d'hypothèses, par rapport à la traduction de référence. (Étudiant Y)
On remarque que le scénario sans repérage pré-TAN aboutit à un texte cible pratiquement identique à la pré-traduction générée par la TAN, alors que le passage par pré-repérage stylistique aboutit à des versions plus personnelles :
Avec pré-repérage, « nous présentons », est rendu par une version moins abrupte : « cette article présente », « étant donnée la traduction de référence » devient « en fonction de la traduction de référence fournie... ».
Si pour cet extrait, la TA a été jugé utile à 100 %, les étudiants constatent que les traductions pré-repérées sont plus personnelles. Cet article, qui aurait très bien pu être « pré-édité » au sens que l’industrie donne à ce processus (rendre un texte MT-friendly, en gommant toutes les potentielles subtilités capables de résister à la TAN) a tout de même été traduit moins littéralement par celles et ceux qui avaient repéré certaines subtilités stylistiques propres au genre scientifique : « In this framework, lexical, syntactic and semantic information from the reference and the two hypotheses is embedded into compact distributed vector representations »
Pré-traduction de DeepL : Dans ce cadre, les informations lexicales, syntaxiques et sémantiques de la référence et des deux hypothèses sont intégrées dans des représentations vectorielles (DeepL)
Versions étudiants avec pré-repérage :
Ce cadre (ce protocole) permet d’intégrer les informations
Ce cadre nous a permis…
3. Vers une prise de conscience par les étudiants de leurs propres limites et de celles de la TAN et leurs stratégies de traduction : Traduction sans TAN, suivie d’une confrontation avec la prétraduction TAN
Consignes :
1. Traduire le texte (sur le syrah néo-zélandais) y compris le titre puis confronter votre traduction avec une prétraduction DeepL :
2. Quelles sont les différences ? La simple post-édition de DeepL aurait-elle été plus efficace ?
3. Conclusions sur l’utilisation de DeepL dans ce domaine précis (qualité, gain de temps).
Hormis le titre « Say Syrah, Syrah – Whatever will be will be » que DeepL digère littéralement (Dites Syrah, Syrah - Tout ce qui sera sera sera – DeepL)1, ce texte était assez spécialisé, et le gain de temps en ce qui concerne les termes spécifiques a été concédé par tous. Cependant, pour cet article d’œnologie généraliste, les bio-traductions se sont avérées de nettement meilleure qualité, même si certains étudiants tombent dans les mêmes pièges que DeepL :
"In a good year, Syrah is bottled joy" –> « le Syrah est mis en bouteille avec joie » (au lieu de « de la joie en bouteille »
Cette étape a semblé indiquer la nécessité d'opérer un meilleur dépistage de ce qui est créatif comme ce groupe nominal présentant un assemblage conceptuel peu prévisible (bottle + joy).
4. Possibilités d’utilisation de la TAN en se démarquant de ce qui est actuellement mis en avant pour une « MT litteracy ».
Traduction sans consigne
Après ces phases d'utilisation modérée, nous avons expérimenté l'absence de consignes. Les étudiants indiquaient, après avoir traduit, dans quelle mesure ils avaient utilisé DeepL ou tout autre outil en ligne.
Il s'agissait dans ce cas d'un projet « réel », un site de vigneron de Chavignol où les termes œnologiques et les jeux de mots étaient les principaux défis.
« Malice est un vin aux notes de fruits rouges (fraises, framboises), avec en final une pointe de minéralité qui lui apporte toute sa fraicheur. Il accompagnera idéalement vos apéritifs et salades estivales, et vous surprendra malicieusement durant l'hiver avec fondues et raclettes. Méfiez-vous la malice de ce Sancerre Rosé risque de prendre tout son sens (extrait du site traduit https://www.domainesergelaporte.com/)
Malice is a wine with notes of red fruit (strawberries, raspberries) and a hint of minerality on the finish, giving it a freshness all its own. It's an ideal accompaniment to summer aperitifs and salads, and a mischievous winter surprise with fondues and raclettes. Beware, the mischievousness of this Sancerre Rosé is likely to take on its full meaning. (DeepL)
Il s’est avéré que les étudiants ont pressenti que la TAN nécessiterait un taux élevé de PE, et la majorité des étudiants n’ont pas utilisé la TA, ayant repéré des traces de « littérarité », de jeux sur la langue, dans lesquels certains ont vu un défi qu'ils s'estimaient capables de relever.
- 5 l’ont consultée (vérification, comparaison)
- 2 l’ont utilisée pour des termes isolés (étudiantes étrangères)
- 8 n’ont pas eu recours à la TA
Effectivement la pré-trad TAN aboutit à un texte cible souvent littéral. « Mischievous winter surprise (DeepL) » ne fait plus du tout écho au nom du vin « Malice » !! comme le fait le texte source « et vous surprendra malicieusement durant l'hiver... » de même quant à la traduction de « la malice » du vin, dont il faut se méfier.
Traduction avec choix du degré d’utilisation de la TAN
En fin de semestre l'évaluation s'est faite en laissant le choix entre trois stratégies :
Pré-trad DeepL + PE
Repérage + pré-trad DeepL + PE
Biotraduction
L’exercice portait sur la traduction d’une brochure touristique du château de Douvres :
-
Fast forward to the 20th century and venture deep into the secret Wartime tunnels to witness the miracle of Dunkirk…
-
Avancez rapidement jusqu'au XXe siècle et aventurez-vous dans les tunnels secrets du temps de la guerre. (DeepL)
Sur l’extrait ci-dessus, celles et ceux qui ont procédé à un pré-repérage, ou n'ont pas utilisé de TA ont trouvé des solutions satisfaisantes. Notamment pour le groupe nominal complexe (secret wartime tunnels), où la relation entre les composants demeure un problème pour la TAN généraliste (BÉNARD, BORDET, KÜBLER, 2022). On remarque que la TAN s'est dispensée de « deep », omission expliquée par le fonctionnement même de la TAN qui ne procède plus terme à terme. Quant à « fast forward to the twentieth century » ce saut en avant était aussi lié à la mise en page du dépliant dont les illustrations allaient du moyen-âge à la seconde guerre mondiale, parallèle pris en compte ni par la TAN, ni par les étudiants.
Ce qui confirme les doutes évoqués en introduction quant à l’efficacité d’une seule post-édition dans un cadre de formation, « les difficultés à se détacher des propositions de la TAN » et la « conscience de la marge d’amélioration possible pour leurs textes post-édités ».
Conclusion
L'appropriation préalable du texte source par un repérage des difficultés prévisibles pour la TAN, comme l’illustre ce dernier exercice, semble ici encore être un des remèdes, aussi évident soit-il, à la difficulté de se détacher de la pré-traduction TAN.
S’il est difficile de parler de "pré-édition", car malheureusement, ce terme est déjà utilisé pour désigner une forme de lissage (washing down) du texte de façon à le rendre TA-compatible (GUERBEROF ARENAS, 2019), il s'agit de pré-transfert qui consiste en un repérage permettant de traiter les éléments jugés incompatible avec la TA, et de surcroît de poser un diagnostic quant à l'efficacité de son utilisation.
Pour l'apprenti-traducteur (nous tous), au-delà de discerner ce qu'on est capable et incapable de traduire, ces contournements procurent une prise de conscience de ce que la TA est capable et incapable de « pré-traduire » avec un quelconque gain de temps, et sans risque de perte de créativité. En fin de semestre, ce ne sont pas seulement les limites de la TAN qui ont motivé les deux tiers des étudiants à ne pas l’utiliser avant de produire leur propre traduction, mais aussi leur prise de conscience qu’une surutilisation de celle-ci serait un frein à leur formation de traducteur.
Il semble donc que, d’eux-mêmes, les étudiants finissent par pratiquer une forme de ce qui a été appelé, en référence à la « slow food », une slow translation (HUROT, 2022), surtout lorsqu’ils entrevoient que le texte va résister à la TA et nécessite une PE lourde. Ces résultats évolueraient sans doute avec des versions de TAN spécialisées plus performantes.
Sans délaisser l'exploration de la TA, ni sa pratique pondérée, il paraît fructueux d’envisager conjointement en classe de traduction une forme de RAW translation qui consiste à appréhender le texte source dans son intégralité, chacun avec sa propre sensibilité quitte à opérer en aval une confrontation avec une pré-traduction TAN.
Les exercices ont illustré qu’une étape de repérage, indispensable à la traduction littéraire, semble, en amont d’un pré-traduction TAN et de sa post-édition, être également utile pour des textes « pragmatiques », qui peuvent flirter avec le littéraire à différents degrés. Cette stratégie « inversée » n'est certes pas économiquement viable, mais paraît pédagogiquement intéressante, restituant aux étudiants la possibilité de continuer à développer la maîtrise de leurs langues de travail, leur capacité à repérer les spécificités stylistiques d'un texte, à s’approprier le texte source, ses paratextes, ses références, pour privilégier une forme d’instinct personnel, de mise en pratique de procédés de traduction obliques et de préserver le plaisir et l’aspect ludique de ce qu’est la traduction créative.

