Le présent article est le compte-rendu d’une expérimentation conduite lors d’un séminaire de traduction littéraire en 1ère année de master Langues, littératures et civilisations étrangères et régionales (LLCER) de japonais, à l’université de Strasbourg, au cours du premier semestre de l’année universitaire 2024-2025.
Nombreuses sont les raisons pour lesquelles l’automatisation de la traduction et le domaine littéraire semblent antinomiques. La traductologie du domaine littéraire s’adosse volontiers à la philosophie du langage, à l’éthique, à l’herméneutique, dimensions incompatibles avec la délégation du travail sensible et cognitif à une entité non humaine1. Pour l’équipe pédagogique dont je fais partie2, plus que ces principes éthiques ou herméneutique, ce sont des inquiétudes d’ordre pédagogique – sans doute très communes au sein de la communauté des enseignants – qui nous rendent réfractaires. Que ce soit pour la réflexion, la rédaction ou la traduction, nous voyons mal comment les apprenants peuvent se constituer un bagage d’apprentissage si les compétences cognitives sont externalisées au lieu d’être stimulées. Une célèbre étude du MIT consacrée à l’usage de ChatGPT dans un contexte d’apprentissage, pour des devoirs rédigés (et non pour la traduction), a d’ailleurs étayé ce risque, et évoque « une accumulation de dette cognitive » (KOSMYNA et al., 2025, 141 et passim). Je n’ignore pourtant pas que, à l’inverse, de nombreux articles scientifiques et tribunes récentes ont exposé de façon convaincante qu’un accompagnement pédagogique adéquat pouvait permettre aux étudiants d’utiliser des IA pour développer des compétences analytiques et critiques. Ainsi, Bilel Benbouzid, s’appuyant sur des recherches en psychologie cognitive, et sans nier les risques d’atrophie cognitive, évoque plusieurs avantages possibles de l’utilisation des IA génératives, soit parce qu’elles peuvent jouer « un rôle de levier motivationnel en réduisant la peur de l’échec », soit parce qu’elles « peuvent renforcer la métacognition en fournissant des outils d’auto-évaluation » (BENBOUZID 2025).
Il n’en reste pas moins que l’obstacle sur le plan pédagogique nous semble jusqu’à aujourd’hui indépassable. En effet, l’usage des IA prive l’étudiant de l’apprentissage par la compréhension de l’erreur. Les IA génératives sont perçues comme étant particulièrement utiles pour permettre aux utilisateurs de gagner du temps. Or, on voit mal comment cela peut être bénéfique dans le processus d’apprentissage. Il semble bien au contraire que l’apprenant a tout à gagner à – si j’ose dire – perdre du temps. Ou plutôt de se ménager le temps qui lui est nécessaire pour développer une expérience de traduction, une fréquentation du plus grand nombre possible de textes, afin de pouvoir ensuite, dans sa pratique professionnelle de la traduction littéraire, être capable de reconnaître les difficultés qu’il a déjà rencontrées durant son apprentissage – et de reproduire les solutions. Et ce, qu’il utilise ou pas des TAN dans sa pratique professionnelle, puisque pour pouvoir arbitrer entre plusieurs solutions et mener à bien les tâches de post-édition, il lui faudra avoir les compétences linguistiques et traductologiques nécessaires.
Sans doute y a-t-il des raisons propres à notre situation d’enseignants d’une langue – le japonais – qui est à la fois une langue modime, particulièrement peu enseignée dans le secondaire, et une langue linguistiquement distante du français. Nos étudiants, qui sont quasiment tous des débutants doivent en trois ans (pour la licence) ou cinq ans (pour le master) parvenir à un niveau de maîtrise professionnelle d’une langue dont la structure syntaxique, le lexique et le code graphique n’ont rien en commun avec leur langue maternelle. Il nous semble que nous n’avons que trop peu de temps pour cette formation initiale, et qu’il n’en reste pas pour se former à l’usage de la TAN (traduction automatique neuronale) et à la post-édition. La pertinence d’une plus grande intégration de l’usage de TAN à la formation, au niveau Master, se pose certainement différemment pour une langue telle que l’anglais ou l’espagnol, où l’on peut probablement espérer des compétences linguistiques meilleures de la part des étudiants en fin de licence ou de master.
J’ajouterai que, à titre personnel, quelques tentatives infructueuses m’ont découragée d’utiliser les IA génératives pour des traductions littéraires. En effet, j’ai pour habitude de rédiger un premier jet uniquement pour trouver le rythme des phrases, sans me préoccuper du lexique ni de la syntaxe, dont le travail vient dans un deuxième temps. Les IA génératives n’étant pas sensibles aux questions de rythme – du moins dans les limites de l’usage que je suis capable d’en faire – cela me prend finalement plus de temps de localiser le problème puis de modifier la longueur et l’emplacement des propositions, que de réaliser entièrement la traduction par moi-même.
Sans vouloir abuser ici de l’excusatio propter infirmitatem, je conviendrai volontiers que cet article présente de nombreuses limites. L’échantillon – trois étudiants – est ridiculement petit. Je ne suis ni traductologue, ni linguiste, ni même formée à l’utilisation des TAN. Toutefois, j’ai souhaité donner en partage cette exercice de portée modeste, en présentant le dispositif employé et mes premières observations empiriques, avec l’espoir que cela pourra constituer une première pierre pour d’autres études plus poussées, considérant qu’il n'y a eu, à ma connaissance, aucune publication de compte-rendu d’expérimentation concernant la traduction littéraire du japonais au français et l’usage de la TAN.
Ma démarche était uniquement pragmatique. Partant du principe que la probabilité de l’utilisation par les étudiants d’un traducteur automatique ou d’une IA générative était hautement probable si celle-ci représente un gain pour eux, je me suis posé les questions suivantes. (1) Est-ce que l’usage des IA génératives permet de réaliser des traductions satisfaisantes ? (2) Est-ce que l’usage des IA génératives suivi de post-édition permet de produire des textes meilleurs qu’un traducteur humain ? (3) Est-ce que l’usage des IA génératives permet un gain de temps ? (4) Est-ce que l’usage des IA génératives suivi de post-édition permet à l’étudiant de progresser dans sa maîtrise de la langue japonaise et de la traduction du japonais au français.
Je vais ici présenter les conditions de l’expérience, puis quelques difficultés du texte pour observer celles que les IA génératives ont pu surmonter ou non, enfin je présenterai le travail de prompt et de post-édition effectué par les trois étudiants volontaires.
I.Contexte et description de l’expérimentation
L’exercice de traduction du japonais vers le français intervient à tous les niveaux de notre cursus de LLCER japonais. Au premier semestre du Master 1, il s’agit de 6 séances de 120 minutes, toutes les deux semaines, avec pour chaque séance un extrait de texte littéraire. Les étudiants rendent le texte traduit une semaine à l’avance. Le contenu de la séance est d’attirer l’attention sur les éléments linguistiques ayant posé problème aux étudiants, lesquels sont incités à discuter pour améliorer leurs traductions.
Ma première surprise fut la difficulté de recruter des volontaires. Sur une promotion de dix étudiants, seuls deux ont accepté de se prêter à l’exercice. Tous deux étaient issus d’une licence LLCER japonais hors université de Strasbourg, les huit autres étant issus de notre licence LLCER japonais. Un troisième, qui était issu de notre licence LLCER a finalement accepté après insistance de ma part, et promesse de lui faire faire un exercice supplémentaire. La raison principalement invoquée pour ce refus était qu’ils ne voulaient pas perdre l’occasion de traduire deux textes, preuve si besoin était qu’ils ont fait leurs nos inquiétudes quant à la « dette cognitive ».
Deux textes étaient proposés pour cet exercice : la première moitié de la courte nouvelle Sakura no ki no shita ni wa (Sous les cerisiers) de KAJII Motojirô (1928) et l’incipit de Moetsukita chizu (Le plan calciné) d’ABE Kôbô (1967). Parmi les six textes à traduire tout au long du semestre, ces deux textes étaient sans aucun doute ceux qui contenaient le plus de risques de contresens, et notamment de risques d’erreurs d’identification des sujets. Je voulais tenter d’observer si les IA génératives parvenaient mieux que les étudiants à lever ces difficultés.
Pour des raisons pratiques, dans le cadre de cet article, je vais limiter mon analyse au premier de ces deux textes, la nouvelle de Kajii.
1.Dispositif et protocole
Les étudiants volontaires devaient suivre un protocole en trois étapes : (1) traduction via TAN (traducteur automatique de type DeepL ou IA générative type ChatGPT) sans prompt, (2) ajout d’un ou plusieurs prompts, (3) post-édition avec relecture attentive de l’original en japonais3.
Je désignerai les trois étudiants par leurs initiales, respectivement ML, VC et EB, en ajoutant un numéro pour distinguer les trois versions. Par exemple, pour le travail effectué par VC, VC1 signifie traduction automatisée mais sans prompt, VC2 nouvelle traduction avec ajout d’un prompt, VC3 traduction post-éditée.
À vrai dire, seul VC a réellement suivi le protocole. Il a utilisé ChatGPT 4.0. EB ayant commencé à travailler sans attendre le protocole a suivi une méthode différente, consistant à comparer une version traduite par DeepL et une autre par ChatGPT4, puis a comparé avec sa propre traduction sans TAN. ML ayant fait une première version avec DeepL, et n’ayant pas su ou pas voulu utiliser les outils de modification (version professionnelle payante), elle a basculé sur ChatGPT pour réaliser la 2e version avec prompt.
Mon très petit échantillon n’est donc pas même homogène, par faute d’un respect tout relatif des consignes par les étudiants, et d’un cadrage sans doute insuffisant de ma part. Toutefois, si je veux tout de même voir quelque chose de positif dans le relatif échec de mon dispositif, disons qu’il constitue un éventail assez représentatif des bricolages que peuvent faire spontanément les étudiants : utilisation d’un ou deux logiciels de type IA gratuits en ligne, successivement ou en panachant deux versions.
Récapitulons donc les chemins suivis par ces trois étudiants.
2. Échec d’une détection des traductions automatisées
J’ai commencé par lire tous les devoirs anonymisés en essayant d’identifier ceux qui avaient eu recours au prompt. Cet exercice ne s’est pas avéré concluant. Je n’ai pas été capable d’identifier « à l’aveugle » les devoirs n’étant pas 100 % humain. Par exemple, la présence de phrases de longueurs standardisées est souvent perçue comme un indice dénonçant une rédaction faite à l’aide d’un agent conversationnel, mais cela n’était pas probant ici. Sans doute que le texte d’origine, fonctionnant comme un prompt, incitait le logiciel utilisé à varier la longueur des phrases.
J’ai fini par utiliser comme indices de traduction humaine la présence de fautes d’orthographe ou de contresens, mais ce n’était pas très concluant non plus, car la correction comme l’erreur peuvent être des produits de la post-édition.
J’ai également soumis les devoirs à l’analyse de GPTzero, qui a conclu qu’ils étaient « 100 % humain », y compris ceux qui avaient recouru à la TAN, bien évidemment.
3. Le texte à traduire Sakura no ki no shita ni wa de Kajii Motojirô (1928)
Célèbre pour sa spectaculaire entrée en matière – Sous les cerisiers, il y a des cadavres ! – ce texte est entièrement constitué d’un long monologue développant cette image initiale. Sorte d’hallucination enchaînant des comparaisons et métaphores imbriquées les unes dans les autres, évoquant tout aussi bien le thème bouddhique de l’impermanence que le memento mori chrétien, ce texte aux accents quasi-mystiques repose aussi sur une réalité biologique : la croissance des plantes se nourrit de la décomposition de la matière4.
La voix du narrateur est exaltée, à la fois marquée par des traits d’oralité, comme la reformulation, des ruptures de syntaxe, et par une élégante virtuosité stylistique, se caractérisant par de longues périodes, un lexique précieux, une certaine musicalité.
Bien qu’à aucun moment le texte ne donne à lire les répliques de la personne à qui le narrataire s’adresse, il semble bien qu’il s’agisse d’un dialogue dont on ne perçoit pas l’autre partie, selon un dispositif similaire à celui que l’on observe dans La Chute de Camus (1956), ce qui place le lecteur dans la position du destinataire du discours.
Cette nouvelle est par ailleurs caractérisée par un usage très maîtrisé du lexique :
-
Le mot shitai (cadavre), 11 occurrences dans la totalité de la nouvelle sans compter le titre, qui avec furan suru 腐乱 (pourrir) – 1 occurrence – forme un mini champ lexical de la putréfaction ;
-
Le champ lexical de la fleur et de la vie, associé à l’expression de la beauté : sous forme du qualificatif utsukushii – 1 occurrence, et de son dérivé nominal utsukushisa – 3 occurrences ;
-
Le champ lexical du malaise, caractérisant l’état d’esprit du narrateur : fuan (malaise) – 4 occurrences, yûutsu (déprimé) – 4 occurrences, inki (sombre) – 1 occurrence.
Ces répétitions de mots et ces champs lexicaux cohérents modèlent un personnage travaillé par des visions obsessionnelles. Le cadavre et la fleur-vie, pôles opposés, dont la coexistence créée chez le narrateur un état psychique instable, jusqu’au moment où une forme de révélation lui permet de dépasser ce paradoxe : vie et mort sont inséparables et constituent une seule et même chose.
Le cadavre, la vie / fleur et le malaise constituent trois trames parallèles, trois lignes de forces structurant le texte de manière particulièrement habile. Si la traduction ne les rend pas perceptibles, alors le texte risque de ne sembler être rien d’autre qu’un verbiage chaotique.
II. Quelques problèmes et leurs résolutions
Sous les cerisiers de Kajii Motojirô contient un certain nombre de difficultés, qui ont bien évidemment suscité mon choix de proposer ce texte aux étudiants. Ces points d’attention pour la traduction de ce texte – et donc pour l’évaluation – sont les suivants : la cohérence lexicale dans l’ensemble du texte, un risque de sur-traduction sur la première phrase (umatteiru), l’ordre des composants de la phrase dans le titre et la première phrase, le choix entre le féminin et le masculin pour la voix du narrateur, l’identification des sujets grammaticaux, un choix pertinent concernant le registre (notamment : le tutoiement ou le vouvoiement), l’importance de ne pas normaliser ou assagir une syntaxe volontairement extravagante. Enfin, je précise très rapidement que, du fait d’un carambolage de comparaisons non compatibles entre elles, ce texte cause moins des contresens que des phrases absolument sans sens. Je n’aurai malheureusement pas l’espaces pour développer ceci ici.
Je voudrais tout d’abord comparer les solutions données par la traduction automatique brute, par la traduction automatique avec post-édition, et par les traducteurs humains, sous forme d’une simple énumération.
1. Problème de discrimination du langage masculin / langage féminin
La langue japonaise présente des variations selon que le locuteur est un homme ou une femme. Cela est particulièrement visible dans les formes verbales utilisées, les particules modales en fin de phrase et dans les mots auto-désignatifs (je). Ici, deux indices permettent identifier le narrateur comme un homme, le second étant particulièrement discriminant. D’abord, l’utilisation du style dit « neutre », par opposition au style dit « poli », marqué par des terminaisons de mots variables en -masu / desu – bien que ce ne soit pas un marqueur absolument fiable, en tendance, les femmes s’expriment plus en style poli. S’agissant de littérature des années 1920, un lecteur averti aura tendance à considérer que c’est une femme. Le deuxième indice est beaucoup plus évident. Le narrateur se désigne lui-même par le mot ore – qui signifie « je », et est connoté viril – et désigne son interlocuteur par omae – « tu », relevant du langage masculin et familier. Ces deux mots lèvent toute ambiguïté. Il n’est pas envisageable que ce soit une femme, a fortiori s’agissant des années 1920.
Or, DeepL a genré le narrateur au féminin dans la version ML1 et EB1(1). En revanche, ChatGPT a genré au masculin dans VC1 et EB1(2). Dans des tests que j’ai effectués moi-même en utilisant ChatGPT4 (octobre 2025) sans prompt, le texte est également toujours genré au féminin. Il conviendrait de vérifier avec un panel beaucoup plus large et sur des versions récentes, mais en tout cas la reconnaissance de la modulation masculin / féminin semble être une faiblesse de la TAN. Dans le cas de ML1 et mes propres tests, on peut se demander si le TAN n’est pas influencé par le genre de l’utilisateur : ML et moi-même étant des femmes, en l’absence de prompt de rôle, le rôle serait défini par les utilisations antérieures, qui seraient principalement genrées au féminin quand le sujet est « je". Cette donnée métatextuelle primerait sur le contenu5.
Inversement, ce point semble ne poser aucun problème à des traducteurs humains. ML a inclus dans le prompt « Le narrateur est un homme qui écrit dans un contexte de 1925 ». Les versions ML2 et ML3 sont donc au masculin. EB a comparé une traduction par ChatGPT qui genrait au masculin et une traduction par DeepL qui genrait au féminin, et a correctement arbitré en faveur du masculin. Dans le cas de VC, la première version étant déjà au masculin, la question ne se pose pas vraiment. Tous les étudiants ayant travaillé sans TAN, sans exception, ont identifié correctement le narrateur comme un homme.
Si cette défaillance des TAN se confirme, cela doit être un point de vigilance lors de la post-édition. J’y vois aussi une difficulté de la traduction littéraire avec TAN : ChatGPT comme DeepL proposent généralement de bonnes solutions quant à la dénotation des mots, mais sont malhabiles quant à la dénotation. « Je » est identifié, mais pas les connotations (genre, registre de langue) de ce « je ». Un exemple similaire intervient plus loin dans EB1(1), où omae (tu) est traduit par « ma chère ». Or, si un homme voulant afficher sa virilité pourrait effectivement s’adresser ainsi à son épouse ou à une conquête, il est ici plus vraisemblable que l’interlocuteur soit un homme, pas forcément familier, car omae est également une adresse argotique utilisable entre hommes.
2. Problème de discrimination entre le singulier et le pluriel
La langue japonaise ne distingue en principe pas, par la morphologie des mots, le singulier et le pluriel. Ce point constitue dans les cours de traduction un problème récurrent, ou pour le dire autrement : un riche sujet d’observation. Le traducteur doit être guidé par le contexte ou la simple logique à partir de ce que ses connaissances extratextuelles lui permettent de savoir à propos du référent. Parfois, toutefois, il n’existe pas de solution juste absolument, et le traducteur doit alors faire un choix.
Ici, il faut d’emblée trancher entre « le/un cerisier » ou « les/des cerisiers » pour Sakura no ki no shita ni wa, qui constitue à la fois le titre et le début de la première phrase. Hors contexte, ces quatre propositions semblent toutes acceptables. On peut imaginer que le narrateur parle de l’unique arbre de son jardin (le cerisier), d’un arbre parmi d’autres (un cerisier), d’une généralité ou des arbres de son verger (les cerisiers), ou de certains arbres (des cerisiers6). Toutefois, le premier paragraphe, se présente comme l’affirmation péremptoire, par le narrateur, de ce qui est pour lui une vérité absolue. Ceci me semble de nature à faire arbitrer en faveur du pluriel – et par ailleurs de l’article défini. C’est d’ailleurs le choix fait par 5 des 7 étudiants ayant travaillé sans TAN (un seul – de langue maternelle espagnole – a opté pour le singulier, un autre a fait des choix confus, mélangeant les deux).
En outre, il y a dans la suite du texte plusieurs éléments qui incitent à le lire comme une généralité. Ainsi, dans le 4e paragraphe7 « donna ki no hana de mo » (toute fleur d’arbre), puis, dans le 6e paragraphe « sakura no shita e, hitotsu hitotsu shitai ga umatte iru » (sous ces cerisiers […] magnifiques, il y a, un à un, des cadavres enfouis). Aussi, et même si un traducteur humain aurait pu hésiter dans le premier paragraphe, une fois le contexte éclairci par la suite du texte, il aurait forcément unifié à rebours, ce que ne peut évidemment pas faire une IA générative telle que ChatGPT, qui produit des énoncés phrase après phrase et ne peut donc pas remonter en arrière. ML l’a bien perçu, et l’elle explique dans le commentaire qu’elle m’a fourni pour accompagner son travail : « L’IA ne semble pas prendre en compte le texte dans son ensemble. Par exemple, alors que l’on parle de plusieurs cerisiers dans la suite du texte, la première phrase avait été traduite au singulier : “ Sous le cerisier en fleurs, des cadavres sont enterrés ! ”».
DeepL et ChatGPT sont tous deux en pleine confusion du nombre : ML1, VC1, EB1(1) et EB1(2) donnent tous le singulier (« un » ou « le ») dans le titre et « les » dans la première phrase, alors que ce membre de phrase est identique dans les deux cas dans le texte source.
Sans grande surprise, il semblerait que dans le titre, par nature décontextualisé, ces IA privilégient le singulier, puis fassent un choix plus pertinent dans le paragraphe.
ML réussit évidemment sans problème à unifier. De même pour EB. En revanche, VC fait un choix surprenant. Alors que VC2 avait bien unifié au pluriel, il reprend les choix de VC1 dans le texte post-édité VC3. Il semblerait que l’étudiant ait pu être contaminé par le choix de l’IA, alors que sans IA sa probabilité d’erreur aurait été faible.
3.Registre
J’attendais des étudiants des choix pertinents concernant le registre de langue, et tout ce qui relève des compétences socio-linguistiques. En l’occurrence, il fallait choisir entre « tu » et « vous », puisque le narrateur s’adresse à un narrataire muet.
On a un indice important dans le début du texte, dont il a déjà été question : l’usage d’ore, nom signifiant « je ». Parmi les nombreux mots auto-désignatifs, ore se distingue par un registre familier et un style viril affirmé. Surtout : il emploie un ton familier avec son interlocuteur (omae pour désigner la 2e personne), ce qui incite à opter pour « tu ». Sur les 7 traducteurs humains, 6 ont opté pour « tu », un seul pour « vous ». Dans les traductions assistées, seul EB1(1) (DeepL) propose « vous ».VC1 et ML1 propose « tu » à juste titre. Étrangement, VC va volontairement créer un prompt demandant de vouvoyer, et s’y conformera.
4.Calque
Le début de la première phrase du texte, qui constitue également le titre de la nouvelle, est Sakura no ki no shita ni wa (Sous les cerisiers). Si on décompose sakura no ki littéralement et en mot à mot, cela donne < cerisier – particule de détermination – arbre >. Or, si sakura seul suffit à signifier « cerisier », il est courant pour désigner les essences d’arbres de recourir à un syntagme de type « [nom d’arbre] no ki » ([nom d’arbre] – particule de détermination – arbre). Une traduction mot à mot en français est redondante, et ne peut être perçue que comme un calque maladroit : il suffit d’écrire « cerisier » et nom « arbre de cerisier ».
Or, dans EB1(1) (DeepL), il y a « sous l’arbre de cerisier » dans le titre et dans la première phrase. La traduction effectuée avec DeepL par EB pour comparaison, EB1(2) propose également « sous l’arbre de cerisier » dans le titre, mais pas dans la première phrase : « sous les cerisiers ». De même, VC1 donne « Sous l’arbre de cerisier » dans le titre, mais « sous les cerisiers » dans la première phrase. Ces exemples semblent indiquer un fort risque de production de calques par les TAN, en particulier dans un titre – sans contexte. Il semble que ChatGPT parvienne mieux à éviter le calque lorsque l’expression à traduire est accompagnée d’un cotexte plus développé, mais ne peut évidemment pas corriger à rebours ce qui était dans le titre. ML a oublié de traduire le titre, donc ce n’est pas très signifiant. La première phrase donne « sous un cerisier ».
Aucun des traducteurs humains n’a produit ce calque, ni dans le titre, ni dans la première phrase.
EB corrige sans problème et donne « sous les cerisiers » dans EB2 et EB3. En revanche, VC corrige mal : alors que VC2 (version avec prompt) donne « sous les cerisiers » (titre et première phrase), VC3 réintroduit le problème, de surcroît en introduisant un solécisme : « l’arbre d’un cerisier ».
5.Identification du sujet des phrases
Le sujet est souvent non exprimé en japonais, ce qui pose des problèmes récurrents aux apprenants, mais des locuteurs natifs ou expérimentés savent normalement repérer les indices lexicaux et syntaxiques permettant de lever toute ambiguïté. Les étudiants de Master 1 sont un peu entre deux eaux. Il peut leur arriver de se tromper.
La première phrase du 2e paragraphe est « kore wa shinjite ii koto da yo », littéralement « Ceci est quelque chose qu’il est possible de croire ! ». La langue japonaise ne précise pas qui est le sujet de « croire », et cela ne gêne pas l’intelligibilité du sens. En français, une construction impersonnelle est ici inconfortable. Il me semble que sont ici possibles : « une chose que l’on peut croire » (auquel cas c’est une vérité générale) et « […] que tu peux croire » (auquel cas c’est un conseil ou une consigne pour l’interlocuteur). En revanche, il est impossible de considérer que le sujet peut être « je » du fait de l’usage de la particule finale à valeur modale yo, qui relève de la pragmatique : elle signale que la phrase est une information que le locuteur fournit à son interlocuteur.
Les traducteurs humains sans TAN ont majoritairement recouru à juste titre à des tournures impersonnelles, mais 3 sur 7 tout de même ont fautivement introduit « je ». EB1(1) utilise « on », EB1(2) la tournure impersonnelle « il faut » ML1 donne « on », mais ML2 et ML3 utilisent la 1ère personne. De même, VC1 donne « tu », VC2 « vous » mais VC3 « je ». Je reviendrai sur ce point.
6. Le « presque même »
Le problème de la phrase qui vient d’être évoquée est dédoublé, car le paragraphe débute et se termine par des phrases quasiment identiques. Au début il y a la phrase « Kore wa shinjite ii koto nanda yo. » et se termine par « Kore wa shinjite ii koto nanda. » Ces deux phrases signifient grosso modo, on l’a vu, « Ceci est quelque chose qu’il est possible de croire ! ». La seule différence étant la présence dans la première occurrence de la particule finale yo, dans la deuxième occurrence la locution modale koto nan da, qui marque une affirmation péremptoire. Hors contexte, le « je » ne serait pas impossible ici, comme une phrase pour souligner une prise de conscience personnel, mais dans le contexte présent, il me semble que cette interprétation ne tient pas. Le « tu » / « vous » est envisageable, mais je penche plutôt pour un impersonnel « on ». Il convient donc d’une part de former deux phrases quasiment identiques (par souci de cohérence lexicale), d’autre part toutefois de tenir compte de cette importante nuance. Je propose, respectivement : « C’est un fait dont tu peux être sûr. » et « C’est un fait dont on peut être sûr8. »
Voyons qui a su faire du quasi identique, mais avec nuance. 5 sur 7 des traducteurs humains traduisent de façon strictement identiques, seuls 2 introduisent une nuance9. ML1 (DeepL) propose des phrases quasiment identiques, avec la nuance « on » / « je ». Ce n’est pas mon choix, mais c’est un choix plus pertinent que la plupart des humains du panel. ML2 et ML3 harmonisent hélas en mettant « je » dans les deux cas. VC1, VC2 et VC3 proposent des phrases identiques en début et fin de paragraphe. EB1(1) (DeepL encore) propose judicieusement des phrase quasi-identiques avec la nuance « on » / « je ». EB1(2) utilise des phrases identiques. EB2 invente des phrases très dissemblables. EB3 propose deux phrases identiques.
7. Ordre des éléments composant la phrase
La langue japonaise reporte en fin de phrase (et de proposition, le cas échant) le prédicat, qui peut être un verbe, un adjectif ou un nom suivi de la copule desu (ou ses variantes), ce prédicat étant ou nom suivi de mots à valeur modale. Lors de la traduction du japonais vers le français ou une autre langue de structure SVO (sujet-verbe-objet), il est courant de traduire les éléments de ramener le syntagme traduisant ce prédicat au tout début de la phrase, ou en deuxième position, juste après le syntagme nominal traduisant le sujet et/ou le thème. Dans le cours de leur apprentissage, les étudiants acquièrent donc assez facilement l’habitude de retourner les phrases comme des chaussettes, ce qui est une tactique efficace dans de nombreux cas, mais peut faire courir un risque d’automatisme dangereux, empêchant de réfléchir au cas par cas à la solution la plus adaptée.
La nouvelle dont il est ici question présente un cas intéressant à cet égard. La première phrase, bien que n’étant pas particulièrement longue, est en deux temps. Elle provoque un effet de surprise, et même un choc. La première période « Sakura no ki no shita ni wa » (Sous les cerisiers) créé l’attente de l’évocation de la beauté des fleurs, peut-être des banquets arrosés que l’on pourra faire joyeusement sous les arbres, mais ce topos se brise sur la deuxième partie de la phrase, qui le prend à revers : « shitai ga umatteiru » (il y a des cadavres). Il est très important de conserver cet ordre des constituants de la phrase, sans quoi l’effet produit par cette première phrase sera réduit à néant, entrainant dans sa déchéance la nouvelle entière.
Sur le critère du respect d’un ordre pertinent des membres de la phrase, seuls 3 traducteurs humains sur 7 ont fait un choix qui me semble pertinent. ML1 et EB1(1) (DeepL tous deux) retournent la phrase. VC1 et EB1(2) (ChatGPT) en revanche, conservent l’effet de surprise. ML2 redonne l’ordre avec effet de surprise, ML3 le conserve. De même, VC2 et VC3 conservent cet ordre. EB arbitre hélas en faveur de l’ordre sans effet de surprise dans EB2 et EB3.
III. Quelques observations à propos du prompt et de la post-édition
Dans cette dernière partie, je vais observer le cheminement de réécriture pour chacun des trois étudiants, en me limitant au titre, au 1er paragraphe (une seule phrase) et au 2e paragraphe.
1.Le cas de ML
Comme déjà évoqué, ML a d’abord utilisé DeepL et obtenu la version suivante :
ML1
Un cadavre est enterré sous un cerisier !
C'est une chose à laquelle on peut croire. Parce qu'il est incroyable que les cerisiers en fleurs puissent fleurir de façon aussi spectaculaire, n'est-ce pas ? Ces derniers jours, j'étais anxieuse parce que je n'arrivais pas à croire à cette beauté. Mais le moment est enfin venu pour moi de comprendre. Il y a des cadavres enterrés sous les cerisiers. C'est une chose à laquelle je peux croire.
Elle a ensuite utilisé ChatGPT avec prompt, si bien qu’il n’y a pas de lien entre ML1 et ML2. Le prompt était le suivant : « Le narrateur est un homme qui écrit dans un contexte de 1925. / Il y a une tension entre le modernisme (technologie, rationalité) et la nature traditionnelle japonaise. / Le narrateur est conscient de sa maladie et de sa condition terminale, ce qui teinte son discours d’une réflexion existentielle. / C’est une nouvelle, donc le ton doit être littéraire, avec une profondeur introspective. »
Voici le résultat obtenu :
ML2
Sous le cerisier en fleurs, des cadavres sont enterrés !
C’est une vérité que je peux accepter. Car enfin, comment croire autrement à la splendeur de ces fleurs de cerisier ? Leur éclat semble défier toute logique, toute raison. Depuis quelques jours, cette beauté me trouble profondément. Une beauté si parfaite qu’elle semble irréelle, presque menaçante.
Aujourd’hui, cependant, j’ai compris. Sous chaque cerisier en fleurs, des cadavres reposent. Oui, je peux maintenant croire à cette idée.
Cette version ML2 s’apparente à une réécriture beaucoup plus qu’à une traduction. Les passages soulignés ci-dessus correspondent à des modifications problématiques, qui ne sauraient être considérés comme de simples erreurs de traduction, mais plutôt comme des hallucinations. Ainsi, « Leur éclat semble défier toute logique, toute raison. » ainsi que « Une beauté si parfaite qu’elle semble irréelle, presque menaçante. » ne correspond à rien dans le texte source.
On peut supposer que les indications dans le prompt concernant le ton – qui « doit être littéraire » – et l’intention – une « réflexion existentielle » ont créé ce texte réécrit.
ML2 introduit des erreurs de sujet, avec l’apparition du « je », peut-être dû au prompt demandant une « profondeur introspective ».
En revanche, l’indication sur le genre du narrateur a permis d’écarter une possible erreur de genre.
Il est difficile de savoir si les indications sur l’époque, la supposée importance de l’opposition modernité/tradition et les détails biographiques ont eu une incidence.
Au stade de la post-édition (ML3), ML explique qu’elle a travaillé en comparant l’original japonais avec ML2, et qu’ayant constaté des ajouts inexpliqués, elle les a corrigés, puis s’est aidée d’un dictionnaire de synonymes. De fait, elle a su supprimer les hallucinations les plus évidentes, notamment la phrase évoquant une « beauté parfaite ». Mais voyons en détail.
ML3
Sous les fleurs des cerisiers, il y’a des cadavres !
C’est ce que je crois. Autrement, comment croire à la splendeur de ces fleurs. Depuis plusieurs jours, cela me préoccupe, je n’ai pas confiance en leurs éclats. Mais, le moment de comprendre est enfin venu. Sous chaque cerisier en fleurs gisent des cadavres. Oui, j’en suis persuadé.
Le plus étonnant ici est le fait que ML, bien que pensant revenir à l’original japonais, s’en est en fait éloignée de plus en plus. Ainsi, les « cerisiers » (ML1) deviennent « cerisiers en fleurs » puis « fleurs de cerisiers ». L’hallucination « éclat » a été conservée, et trouve même un développement inédit « je n’ai pas confiance en leurs éclats », qui est un contresens (ou plutôt : qui est difficilement intelligible), car le narrateur dit ici que la beauté est tellement forte qu’elle est irréelle, qu’on peine à y croire. Enfin, les deux phrases soulignées, qui sont quasiment identiques en japonais, différent totalement ici. L’erreur de sujet (je), apparue dans ML2, n’est pas corrigée en post-édition.
Le regard de ML sur le texte semble biaisé par la version ML2, dont elle conserve l’intention, et qu’elle prolonge plus qu’elle ne la corrige par endroits.
2. Le cas de VC
VC est le seul à avoir utilisé ChatGPT pour les deux premières versions. Cela l’a visiblement protégé des hallucinations les plus flagrantes, car on peut supposer que ChatGPT a gardé en mémoire la première traduction (VC1).
VC1
Sous l'arbre de cerisier
Sous les cerisiers, des cadavres sont enterrés !
C’est une chose que tu peux croire. Pourquoi ? Parce que n’est-ce pas incroyable de voir les fleurs de cerisier s'épanouir avec une telle splendeur ? Moi, je n’arrive pas à croire en cette beauté, et cela m’a rendu anxieux ces deux ou trois derniers jours. Mais maintenant, le moment est venu où j’ai enfin compris. Sous les cerisiers, des cadavres sont enterrés. C’est une chose que tu peux croire.
Cette première version est d’une qualité honnête. Outre le problème de calque déjà évoqué, le plus gros défaut est un problème de dérivation sur « incroyable » et une syntaxe hasardeuse. « Incroyable » traduit ici shinjirarenai, le verbe croire, au passif, à la négation. Or, si cela signifie bien « qui ne peut être cru », il y a un problème dû au fait qu’en français « incroyable » a changé de sens par rapport à « croire » dont il dérive. « Incroyable » dit l’admiration, plus que l’incrédulité, ce qui n’est pas le cas de shinjirarenai. Il faut re-motiver le sens de ce mot, par exemple en disant : ce n’est pas croyable.
L’IA générative ne perçoit pas cette nuance de sens. Elle semble également avoir eu du mal à gérer la double négation interrogative (littéralement « n’est-ce pas non-croyable ? »). Ce type de structure, qui est une interrogation rhétorique, est pourtant très courante en japonais, et ne pose pas de problème particulier à un traducteur humain. VC a ensuite introduit le prompt suivant : « Utilise la 2ème personne du pluriel / Fais des phrases plus poétiques avec des éléments contemplatifs. / Essaye de pousser plus loin les métaphores entre la mort (les cadavres) et le vivant (le cerisier) / Essaye de faire ressortir l’implicite du texte. »
Ce qui a produit la version suivante :
VC2
Sous l’arbre de cerisier
Sous les cerisiers, des corps reposent.
C’est une vérité à laquelle vous pouvez vous fier. Car, comment pourriez-vous croire autrement que de telles fleurs, d’une splendeur si éclatante, puissent éclore naturellement ? N’est-ce pas une énigme ? Moi, je n’ai su croire à cette beauté saisissante, et ces derniers jours, elle a semé en moi une angoisse sourde. Mais à présent, la révélation s’est imposée : sous chaque cerisier, des corps sont enterrés. Oui, cela, vous pouvez le croire.
Comme chez ML, le recours d’un prompt précisant l’intention (demande d’un style poétique, « contemplatif », demande de « pousser » les métaphores) a produit des sur-traductions, voire des hallucinations, quoi que moins choquantes que dans ML2.
Une mauvaise analyse du texte source a conduit à la demande d’introduire du vouvoiement. La première et la dernière phrase du 2e paragraphe, qui étaient identiques dans VC1, sont devenus totalement différentes. Étrangement, « cadavres » est devenu « corps », peut-être pour former la phrase « des corps reposent », en réponse au prompte sur le style poétique.
Après un travail, effectué par VC, de comparaison avec le texte source et de réécriture, le produit est le suivant :
VC3
Sous l'arbre d’un cerisier
Sous les cerisiers, des cadavres sont enterrés !
C’est une chose que je peux croire. Pourquoi cela ? N’est-ce pas incroyable de voir les fleurs de cerisier s'épanouir avec une splendeur pareille ? Cette beauté, en laquelle je n’arrive pas à croire, m’a rendu perplexe ces deux, trois derniers jours. Mais à présent, j’ai finalement compris. Sous les cerisiers, des cadavres y sont enterrés. C’est une chose que je peux croire.
VC a corrigé plusieurs erreurs basiques, comme l’incohérence syntaxique. En revanche, il n’a pas su voir le problème posé par l’introduction du « je », et l’a même amplifié (voir les parties soulignées ci-dessus).
3.Le cas d’EB
EB, comme indiqué en introduction, n’a pas suivi le protocole proposé. EB1(1) (DeepL) et EB1(2) sont deux versions sans prompt.
EB1(1)
Sous l’arbre de cerisier
Il y a des cadavres enterrés sous les cerisiers.
C'est une chose à laquelle on peut croire. Parce qu'il est incroyable que les cerisiers en fleurs puissent fleurir de manière aussi spectaculaire. J'étais anxieuse ces deux derniers jours parce que je n'arrivais pas à croire à la beauté de la chose. Mais le moment est enfin venu pour moi de comprendre. Il y a des cadavres enterrés sous les cerisiers. C'est une chose à laquelle je peux croire.
Sans être catastrophique, cette version cumule plusieurs problèmes déjà évoqués : ordre des éléments, non-unification singulier / pluriel, mégenrage, problème de dérivation sur « incroyable », problème de sujet (je). « Spectaculaire » pour traduire migoto me semble être de la sur-traduction : on attendrait plutôt un adverbe correspondant au sens de « admirable » ou « splendide ». Peut-être s’agit-il d’une confusion avec l’anglais spectacular ?
EB1(2)
Sous l’arbre de cerisier
Sous l'arbre de cerisier, des corps sont enterrés !
C'est quelque chose en quoi il faut croire. Pourquoi ? Parce qu'il est incroyable de voir les fleurs de cerisier s'épanouir aussi magnifiquement. Je n'ai pas pu croire à cette beauté, et j'ai été anxieux ces deux ou trois derniers jours. Mais maintenant, le moment est enfin venu de comprendre. Sous l'arbre de cerisier, des corps sont enterrés. C'est quelque chose en quoi il faut croire.
Je ne m’attarde pas sur EB1(2), qui n’apporte pas vraiment d’éléments nouveaux, si ce n’est pour relever que l’ordre des éléments dans la 1ère phrase est meilleur, qu’il n’y a pas de mégenrage, ni de sur-traduction sur migoto.
Pour la version suivante, EB n’a pas utilisé de prompt. Prenant pour base la version de DeepL, il l’a amendée en s’inspirant de la version ChatGPT, tout en regardant le texte source « rapidement » et sans dictionnaire.
EB2
Sous les cerisiers
Il y a des cadavres enterrés sous les cerisiers.
C’est quelque chose d’assez vraisemblable. Peut-on croire que leurs fleurs puissent sinon devenir aussi belles ? Pour ma part, je n’arrivais pas y croire, et ça m’a rendu anxieux ces derniers temps. Mais le moment est enfin venu pour moi de le comprendre. Il y a des cadavres enterrés sous les cerisiers. C'est quelque chose auquel je peux croire.
EB fait dans l’ensemble des choix pertinents concernant le genre, le nombre, le registre de langue. En revanche, deux défauts majeurs : le « je » à la fin de l’extrait, et une tendance à normaliser le style baroque de l’œuvre. Ainsi, « Peut-on croire que… » traduit un « Nazette » (Pourquoi ?) éruptif, qui semble répéter une question posée par l’interlocuteur, faisant donc apparaître celui-ci dans le champ de vision du lecteur. De même, « pour ma part » est trop logique et trop posé pour ce texte. C’est un trait fréquent chez les étudiants d’avoir du mal à se départir du présupposé qu’un texte littéraire doit forcément être une belle écriture sage.
Pour la troisième étape, EB m’explique qu’il est reparti du texte source, et non pas de la version EB2, même si, reconnaît-il, il a probablement été influencé par le travail effectué pour éditer EB2. EB3 n’est donc pas à proprement parler une post-édition. Plutôt une traduction humaine avec une traduction automatisée comme référence.
EB3
Sous les cerisiers
Sous les cerisiers, des cadavres sont enterrés !
C’est une chose que je peux croire. Pourquoi cela ? N’est-ce pas incroyable de voir les fleurs de cerisier s'épanouir avec une splendeur pareille ? Cette beauté, en laquelle je n’arrive pas à croire, m’a rendu perplexe ces deux, trois derniers jours. Mais à présent, j’ai finalement compris. Sous les cerisiers, des cadavres y sont enterrés. C’est une chose que je peux croire.
Globalement, la syntaxe est un peu moins sage et restitue un peu mieux le rythme du texte source. L’ordre dans la 1ère phrase est mieux. Il n’y a pas de problème avec le pluriel. Fuan (perplexe) reste sous-traduit. Il est dommage que le problème du « je » ait été maintenu, mais il est difficile de savoir si c’est ou non à cause de l’influence des versions EB1(1) et EB2.
Tentons une synthèse de ces quelques observations sur les prompts et la post-édition. On l’a vu avec les cas de ML et de VC : les prompts concernant le style et l’intention fonctionnent très mal. L’IA réécrit un nouveau texte, éloigné du texte d’origine, avec fort risque de sur-traduction et de création d’hallucinations. Les prompts précis sur le genre du narrateur ou l’utilisation du tutoiement fonctionnent mieux.
Les IA génératives ne parviennent pas bien à restituer la cohérence lexicale du texte d’origine.
Finalement, EB s’en sort mieux que ML et VC, probablement grâce à ses compétences acquises de traducteur et de scripteur, mais aussi certainement parce qu’il n’a pas utilisé de prompt polluant la perception qu’il pouvait avoir de la signification des mots et de l’intention contenue dans l’œuvre.
Conclusions provisoires et perspectives
Dans le cadre de cet exercice, et plus largement si je compare ces productions avec celles des mêmes étudiants sur d’autres textes et sans IA, je n’ai pas constaté que l’usage des TAN, même avec post-édition, permette de produire des textes meilleurs que la traduction non assistée. Au risque d’une lapalissade, la qualité du texte produit dépend des qualités de l’étudiant, et demeure équivalente avec ou sans utilisation de TAN.
Concernant la possibilité de gagner du temps, l’expérimentation ne semble pas confirmer clairement le présupposé des étudiants, selon lequel l’usage des IA permet un gain de temps évident. VC affirme que la totalité du travail lui a pris 4h30. Le temps consacré à ces travaux (sans TAN) varie beaucoup d’un étudiant à l’autre, mais se situe entre 1h30 et 6h pour une traduction non assistée. VC est donc vers le milieu de la fourchette. ML n’a pas indiqué le temps consacré. EB indique avoir passé « entre 6 et 8 heures » au total, se répartissant à égalité en des plages de 3 à 4 heures pour chacune des étapes EB2 et EB3. Pour des travaux similaires sans TAN, il estime consacrer six heures. Il a donc consacré un temps légèrement supérieur. Certes, on peut supposer que, du fait qu’ils étaient conscients d’être objets d’étude, et qu’ils se chronométraient, le temps déclaré est peut-être supérieur à ce qu’il serait dans le cadre confidentiel d’un devoir habituel. Il n’empêche ! Le travail post-éditorial demande un temps considérable.
Enfin, concernant le gain pédagogique, à savoir, est-ce que l’usage des IA génératives suivi de post-édition permet à l’étudiant de progresser dans sa maîtrise de la langue japonaise et de la traduction japonais > français, la réponse est plutôt non, du moins dans les conditions qui furent celles de l’exercice. ML et VC se sont plutôt égarés dans des versions très éloignées de la source, ce qui ne semble pas avoir contribué ni à leur connaissance de la langue, ni au développement de leurs compétences métacognitive.
Toutefois, sur la base des observations effectuées durant l’expérience, et pour ne pas rester dans une position obtuse de simple rejet, je souhaiterais énoncer quelques propositions pour le cas où les TAN seraient utilisées dans un cours de traduction littéraire.
1. Pré-traduction et travail du prompt. L’un des défauts majeurs dans les travaux proposés par les étudiants a été l’utilisation de mauvais prompts, qui orientaient mal le choix de style par le TAN et créaient des hallucinations. Il est intéressant de constater que celui qui s’en sort le mieux, EB, n’a pas utilisé de prompt… ce qui vaut mieux qu’un mauvais prompt. Il conviendrait donc de mieux guider les étudiants dans la phase de pré-traduction, notamment par une analyse du style et du lexique caractérisant le texte source, aboutissant ainsi à un travail soigné pour rédiger le prompt, en évitant toute considération trop large comme « style poétique » ou « style littéraire », ou encore des demandes de faire ressortir « l’implicite du texte », logiquement interprétées par l’IA comme des invitations à inventer du nouveau texte.
2. Un meilleur cadrage du travail post-éditorial s’appuyant sur le constat des risques de faiblesses du TAN, tels que nous les avons observés plus haut : modulation langage féminin / masculin, calques, registre, unification du lexique, dérivation. Je crois qu’il faudrait tenter un séquençage en plusieurs étapes, ajoutant un élément à chaque étape, et autant de réécritures. De même, il faudrait une attention spécifique portée au style, au rythme et à l’ordre des éléments dans la phrase.
3. Que ce soit dans la phase de pré-traduction ou le travail post-éditorial, il conviendrait de faire un travail de repérage du lexique, avec pour but un travail sur la cohérence textuelle dans la langue cible. Il serait intéressant de voir si l’on pourrait créer des « corpus augmentés » par annotation syntaxique, comme dans le domaine de la traduction technique. Mais la littérature, ayant par nature un réservoir lexicographique infini, risque de ne pas se laisser indexer si facilement. Il faudrait attirer l’attention des étudiants sur l’importance d’un travail soigné à faire sur la connotation, qui est apparue comme un point faible dans les traductions automatisées, alors que la dénotation pose généralement moins de problème.
Pour finir, je voudrais revenir sur le cadrage de l’expérience. Mon relatif échec a été de ne pas avoir pu créer des conditions identiques pour les trois étudiants. Certes, cela m’a permis d’observer différentes stratégies d’usage des IA, mais une meilleure homogénéité permettrait de mieux observer les choix post-éditoriaux opérés par chacun. Il faudrait donc indiquer un même logiciel à utiliser pour tous, et vérifier que le protocole est bien compris. Par ailleurs, il me semble que le travail individuel a des limites. Il serait mieux d’en faire une phase possible d’un travail collaboratif. Le protocole serait le suivant : (1) en dehors de la classe : traduction individuelle (travail préparatoire) ; (2) en dehors de la classe : réalisation d’une traduction commune par des groupes de 3 étudiants après comparaisons de leurs trois versions ; (3) en classe : travail collaboratif d’amélioration, encadré par l’enseignant. La comparaison avec un texte produit par IA pourrait intervenir dans les phases (2) et (3) Ce type de protocole permettant une première phase exploratoire, ne privant pas de l’apprentissage par l’erreur, et un travail réflexif conscientisé développant la connaissance de la langue source, et les compétences éditoriales.








