Les outils de traduction automatique, quelle utilité pour l’enseignement du japonais ? – Comparaison de trois outils –

Résumés

Previous studies on teaching Japanese as a foreign language to French-speaking learners remain limited, particularly with regard to the use of machine translation (MT) tools. Moreover, existing research has primarily focused on Google Translate (GT) and DeepL (DL). To our knowledge, ChatGPT (CG) has not yet been explored in the context of language teaching. This study aims to provide detailed insights for educators seeking to incorporate MT tools into their pedagogy. Based on MT outputs in Japanese generated from source texts written by French learners, we analyze the characteristics and differences among the various tools. The comparison involves not only the three MT tools but also different input types, such as full texts versus individual sentences. In light of the rapid progress in MT technology, the study also explores disparities between translations produced at two different points in time.

Les études portant sur l’enseignement du japonais comme langue étrangère auprès d’apprenants francophones en lien avec les outils de traduction automatique restent encore limitées. De plus, elles portent principalement sur Google Translate (GT) et DeepL (DL). En effet, ChatGPT (CG) n’est pas encore, à notre connaissance, exploité dans l’enseignement des langues. Notre objectif est d’apporter des informations détaillées à des enseignants qui souhaitent introduire des outils de traduction automatique (TA). Dans ce travail, en nous appuyant sur les données obtenues par des TA en japonais, à partir de textes produits dans leur langue par des apprenants français, nous analysons les caractéristiques et les différences des traductions selon les outils. La comparaison entre les trois outils portera notamment sur les unités saisies : texte ou phrase. Etant donné le progrès considérable des TA, nous observerons également des disparités entre des traductions faites à deux moments différents.

Plan

Texte

INTRODUCTION

De plus en plus de recherches s’intéressent à la traduction automatique (TA) et ce, non seulement dans le domaine de la traduction mais aussi dans celui de l’enseignement des langues en vue de faciliter le travail collaboratif avec de tels instruments (BARYSEVICH & COSTARIS 2021, KIMURA 2023, entre autres). En effet, le développement technologique semble faciliter le travail de l’enseignant et réduire parfois l’implication des apprenants. Si nous prenons en compte la réalité où l’apprenant recourt fréquemment à des outils de traduction, connaître leurs caractéristiques et avertir sur leur usage semble une première étape cruciale pour la prise de conscience de l’apprenant. Parmi les études antérieures, celles qui se rapportent à l’enseignement du japonais langue étrangère et aux apprenants francophones sont encore peu nombreuses. De plus, elles portent principalement sur Google Translate (GT) et DeepL (DL). ChatGPT (CG), n’est pas encore, à notre connaissance, utilisé dans l’enseignement des langues. Notre travail a pour objectif d’apporter des informations à des enseignants qui souhaitent avoir recours à des outils de TA. Pour ce faire, nous nous appuyons sur des données recueillies auprès d’étudiants français en première année de master (LEA), qui ont rédigé des textes dans leur langue, ensuite traduits par la TA en japonais. Nous analysons les caractéristiques et les dissemblances de ces traductions. La comparaison s’effectue non seulement entre ces trois outils mais aussi entre les unités saisies, à savoir un texte ou une phrase. Etant donné le progrès considérable des TA, notre étude portera également sur l’observation des disparités entre des traductions faites à deux moments différents. Nous illustrerons, à la fin de cette contribution, les types d’exercices que nous pouvons créer en utilisant CG.1 

1. Travaux antérieurs

1.1. Utilisation de la traduction automatique dans l’enseignement

Selon l’enquête menée par T. Oda auprès d’étudiants non spécialisés en anglais, environ 74 % des participants estimaient que l’utilisation de la TA ne devrait pas être interdite (ODA, 2019, 5-6). 2 De même, K. Iyanaga rapporte que 89 % d’étudiants ont répondu que l’usage de la TA devrait être autorisé (IYANAGA, 2022, 15). Ce qui est particulièrement intéressant, c’est que le groupe ayant un niveau élevé dans la LC (langue cible) est celui qui soutient le plus l’utilisation de la TA. En effet, on a tendance à penser que ce sont plutôt les apprenants ayant un faible niveau ou une certaine appréhension envers la LC qui s’appuient sur la TA. Ces résultats montrent que les apprenants ayant un niveau avancé utilisent la TA comme un outil d’apprentissage, notamment pour la recherche de vocabulaire, et que leur motivation individuelle joue également un rôle dans cette utilisation. De plus, il a été rapporté que de nombreux apprenants utilisent la TA principalement pour rechercher du vocabulaire et la considèrent comme une alternative aux dictionnaires (TAMURA & YAMADA, 2021, 57 ; IYANAGA, 2022, 5). 3Alors que les dictionnaires classiques se limitent à répondre à des besoins précis comme la consultation de la signification d’un mot ou d’une expression, l’usage de la TA permet non seulement de traduire des informations obtenues dans une autre langue, mais aussi d’accéder à divers exemples d’utilisation et d’effectuer des recherches approfondies qui s’étendent au-delà de l’objectif initial. Malgré cette différence dans les approches, les apprenants qui recourent fréquemment à la TA ont également tendance à consulter souvent les dictionnaires, tandis que ceux qui ne recourent pas à la TA ont peu d’occasion d’utiliser un dictionnaire. Cela suggère que les apprenants exploitent la TA en la considérant comme l’un des nombreux outils dont ils disposent pour accéder à l’information (IYANAGA, 2022, 13 ; O’NEILL, 2019, 154).

En ce qui concerne les unités de saisie lors de l’utilisation de la TA, J. Clifford, L. Merschel, et J. Munné, dans une étude portant sur des apprenants d’espagnol, suggèrent que peu d’étudiants saisissent des phrases ou des paragraphes entiers, et que la majorité utilise des unités plus petites (89 % pour les unités au niveau du mot, 62 % pour des séquences de 5 mots ou moins) (CLIFFORD et al, 2023). Une tendance similaire est observée dans Iyanaga (2022, 12). Toutefois, il y a une différence selon les tâches observées : en lecture, les entrées sont principalement au niveau du mot, tandis qu’en écriture, les séquences de deux mots ou plus, ainsi que les phrases entières, sont plus fréquentes. Cela peut s’expliquer par le fait que, lors des tâches de production comme l’écriture, il est nécessaire de fournir un contexte général à la TA pour obtenir une traduction précise. De plus, cela pourrait également compenser le manque de connaissances syntaxiques de l’apprenant. E.-M. O’Neill rapporte que 93,9 % des participants ont une opinion positive sur l’utilisation de sites servant de dictionnaire, tandis que ce pourcentage tombe à 75,6 % lorsqu’il s’agit d’utiliser la TA à des fins de traduction, ce qui montre que les apprenants n’utilisent pas la TA de manière irréfléchie (O’NEILL, 2019, 156).

À l’inverse de la perception positive de l’utilisation de la TA par les apprenants, de nombreux enseignants sont réticents à intégrer la TA dans leurs cours, et les cas où elle a été réellement adoptée en classe semblent rares (BARYSEVICH & COSTARIS, 2021, 3). Dans une enquête réalisée en 2022 auprès des enseignants du département de langues étrangères de l’université où travaille S. Kimura, parmi 40 enseignants, seule l’auteure utilisait la TA dans ses cours, tandis que deux enseignants interdisaient son utilisation (KIMURA, 2023, 19). De plus, 27 % des enseignants ont estimé que la TA était utile pour des apprenants débutants, tandis que 54 % ont exprimé la même opinion pour des apprenants avancés (CLIFFORD & al., 2013, cité dans TAMURA & YAMADA, 2021, 57). D’autre part, P. Stapleton et B. L. K. Kin rapportent que tous les enseignants étaient contre le fait de soumettre une composition entière dans la LS (langue source) à la TA, mais 75 % des enseignants étaient favorables à son utilisation comme outil d’apprentissage pour la recherche de vocabulaire (STAPLETON & KIN, 2019, 25). Il semble donc que, chez les enseignants, il y ait des différences d’opinions sur l’emploi de la TA en fonction des tâches, du niveau de la LC des apprenants, etc.

1.2. Performance de la TA et littératie de l’enseignant

Comme le mentionne C. Larsonneur, « les résultats actuels en TAN sont suffisamment concluants pour venir concurrencer la traduction humaine » (LARSONNEUR, 2021, 5), la TA a considérablement gagné en précision grâce au deep learning basé sur les réseaux neuronaux, mais ce niveau de performance est évalué de différentes manières. Lorsqu’on a demandé à une TA de traduire un texte japonais vers l’anglais, sa précision équivalait à un score de 900 points sur 990 au TOEIC (ODA, 2019, 4).4 En revanche, pour la traduction de l’anglais vers le japonais, il est indiqué qu’elle a atteint « une précision équivalente à celle d’un homme d’affaires de niveau 960 points ». 5 GT possède une capacité de traduction japonais-anglais équivalente à celle d’un étudiant japonais du niveau TOEIC 800 points (IYANAGA, 2022). De plus, le dernier modèle de CG (ChatGPT-4) a obtenu des résultats dans le top 10 % lors de l’examen du barreau aux États-Unis, et a dépassé la note de passage lors de l’examen national de médecine au Japon. 6 De plus, dans les études menées par Lee (2020) et S.-C. Tsai (2020) auprès d’apprenants coréens et chinois de niveau intermédiaire (étudiants spécialisés et non spécialisés en anglais), il semble que GT dépasse le niveau des apprenants. Par conséquent, la traduction anglaise produite par GT pourrait être équivalente à un niveau B2 à C1 selon le CECRL (IYANAGA, 2022, 4). S. Kimura affirme que « l’opinion largement partagée parmi de nombreux chercheurs et commentateurs est que la traduction d’œuvres littéraires par l’IA est impossible » (KIMURA, 2022, 82). Effectivement, la « traduction » d’œuvres littéraires, qui intègrent de nombreux éléments du contexte culturel propre à chaque langue, peut sembler irréalisable. Toutefois, il est important de noter que la « création » d’œuvres littéraires à l’aide de l’IA est déjà une réalité.7 

Etant donné la haute performance et la large reconnaissance sociale de ces outils, il est probablement difficile de trouver des apprenants qui ne les utilisent pas du tout. Cependant, les effets négatifs de leur utilisation ont été rapportés dans le domaine de l’éducation. D’après O’Neill qui a travaillé sur des apprenants américains de l’espagnol ou du français, à peu près 88 % d’entre eux ont utilisé la TA malgré l’interdiction de son usage (O’NEILL, 2019, 154). Ce genre de problème semble se retrouver dans de nombreux contextes et quelle que soit la LC des apprenants (ODA, 2019, 17). Cela peut expliquer l’hésitation des enseignants à intégrer la TA dans l’enseignement. Toutefois, dans une enquête menée auprès de 60 enseignants dispensant des cours d’anglais en tant que matière générale dans des universités japonaises, plus de la moitié ont déclaré qu’ils voudraient essayer d’utiliser la TA ou faire confiance aux résultats des moteurs de traduction. Environ 80 % d’entre eux ont, cependant, indiqué qu’ils ne l’utilisaient pas réellement en cours (YAMADA & al, 2021). Les enseignants qui ont déclaré ne pas utiliser du tout ou très peu la TA dans la vie quotidienne étaient 63 %, tandis que 8 5% ont répondu qu’ils ne connaissaient pas son utilisation dans les cours pratiques d’anglais et 76 % d’entre eux ont déclaré qu’ils ne connaissaient pas le fonctionnement de la TA neuronale. Ces résultats suggèrent que le manque de connaissances des enseignants sur l’utilisation de la TA joue un rôle important dans le fait qu’elle ne soit pas intégrée en contexte pédagogique. C’est pourquoi de nombreux chercheurs et éducateurs estiment qu’il est essentiel de nos jours de renforcer la littératie liée à l’usage de la TA. 8 L. Bowker (2020, 11-12), qui a mené un atelier auprès de 23 étudiants de l’école de commerce de l’Université Concordia au Canada, présente le contenu sur la littératie en TA en identifiant 6 points auxquels il faut porter attention (BOWKER, 2020, 11-12). 9Après avoir suivi cette formation, 91 % des étudiants ont déclaré qu’ils la recommanderaient à leurs amis, ce qui suggère que de nombreuses personnes considèrent l’utilisation de la TA comme un atout, à condition de posséder les connaissances adéquates. Les enseignants, tout autant que les étudiants, peuvent acquérir des connaissances en recourant à la TA. Cela leur permettrait non seulement d’améliorer la formation de leurs étudiants, mais aussi de réfléchir à la manière d’intégrer la TA dans leurs cours. C’est dans cette optique que nous présentons ci-dessous les problèmes linguistiques et culturels déjà identifiés sur l’utilisation de la TA.

1.3. Problématiques rapportées

Malgré de nombreux avantages de la machine, son utilisation suscite des réserves d’ordres différents. Il peut y avoir une question éthique : est-il acceptable de montrer aux étudiants des traductions contenant des erreurs ? (YAMADA, 191). Il y a également un débat sur la langue intermédiaire. S. Kimura souligne que l'anglais pourrait être la langue médiatrice dans d'autres langues en mettant en évidence que la traduction entre l'allemand et le japonais est une traduction indirecte via l'anglais (KIMURA, 2023, 5) 10De surcroît, on dit souvent que les expressions originales et innovantes ne peuvent pas être traitées, de même que les nuances subtiles dans des situations spécifiques. Il est aussi impossible de saisir les contextes culturels et de refléter la vaste connaissance générale que possèdent les humains dans les traductions (NODA, 2023, 57-58). Par exemple, une phrase comme « Tu es vraiment gentil », énoncée à une personne sur un ton ironique, est souvent traduite telle quelle par la TA. K. Senoue (2018, 8) souligne que « l'intention du traducteur, l’un des principaux sujets des études contemporaines en traductologie, est ignorée par la traduction automatique, […] » (SENOUE, 2018, 8). Mais dans le domaine de l’enseignement-apprentissage, le problème crucial réside notamment dans la précision et l’exactitude de la traduction. Nous présentons donc dans le tableau ci-dessous les problématiques des TA pour la langue japonaise, mises en évidence dans les travaux antérieurs.

Tableau 1 : Erreurs typiques de la TA vers le japonais

Tableau 1 : Erreurs typiques de la TA vers le japonais

La plupart de ces difficultés ont également été observées dans notre étude. 11 De nombreux problèmes sont liés aux particularités de la langue japonaise comme l'omission du thème ou de l'objet, l’emploi excessif des pronoms démonstratifs, etc., mais il existe aussi des problèmes concernant l'écriture et le registre : les deux registres, poli et neutre, qui doivent être homogènes dans un texte peuvent être mélangés dans la traduction de sortie.

2. Analyse

2.1. Méthode

Les données sont issues de rédactions en japonais écrites par 9 étudiants français en première année de master. Nous avons utilisé uniquement les traductions en japonais générées par la machine. Les étudiants ont d’abord produit un texte en français, puis nous les avons encouragés à le traduire en japonais à l’aide de la TA. Deux raisons ont guidé ce choix : d’une part, observer quel type de traducteur les étudiants choisiraient, d’autre part, voir quelles impressions auraient les étudiants en lisant les productions japonaises ainsi générées.

2.2. Résultats de l’enquête

Nous exposons les résultats de l'enquête auprès des étudiants dans le tableau ci-dessous qui montre les points relevés avant et après l'utilisation de l’outil. En ce qui concerne les avantages, de nombreuses réponses mettent en avant la commodité, tandis que les inconvénients concernent principalement la qualité de la TA. Comme on peut le constater dans les parties en gras, certaines opinions peuvent être à la fois des avantages et des inconvénients.

Tableau 2 : Enquête auprès des apprenants sur les TA

Tableau 2 : Enquête auprès des apprenants sur les TA

Tous les étudiants étaient en faveur de l’utilisation des TA, mais la plupart d’entre eux ont souligné que, même si les outils sont pratiques pour rechercher des mots, ils sont moins utiles pour traduire des phrases entières. Parmi les 9 participants, 8 ont choisi GT, un seul a opté pour DL et aucun n'a utilisé CG. Ce dernier demande la création d'un compte utilisateur, c’est peut-être cet aspect un peu fastidieux qui a dissuadé les étudiants.

2.3. Différentes comparaisons entre le texte source et sa traduction par TA

Pour comparer les différences entre le texte en français et sa traduction en japonais d’une part, et d’autre part entre les unités saisies (phrase vs texte), nous nous sommes appuyées sur 61 éléments comme les erreurs de catégories grammaticales, l'ajout ou la suppression d'éléments grammaticaux, la synonymie ou non des mots utilisés, etc. Étant donné que les erreurs ou les maladresses dans les traductions en japonais peuvent être influencées par ma subjectivité, nous avons fait appel à d’autres natifs japonais pour vérifier la qualité des traductions.

  • Textes originaux en français vs leurs traductions en japonais

Tout d'abord, nous allons présenter ce qui est constaté dans la comparaison des textes français et leurs traductions en japonais : en termes de nombre de phrases, la différence était plus marquée dans CG et celui qui était plus fidèle à celui de l’original était DL. CG semble avoir une grande liberté de construction des phrases. Une autre différence significative concerne les expressions de liaison, comme les conjonctions et les mots de liaison. Elles sont caractérisées par des ajouts et des omissions par rapport au texte source. En revanche, il est assez surprenant de constater que les erreurs grammaticales et les maladresses étaient plus marquées dans la traduction de CG. Voici, un panorama des phénomènes relevés.

Tableau 3 : Différences entre le texte en français et leur traduction en japonais selon des trois outils 12

Tableau 3 : Différences entre le texte en français et leur traduction en japonais selon des trois outils 12

  • Différences des unités saisies : texte vs phrase

Le tableau ci-après montre les différences entre les unités de production (texte vs phrase) selon les outils. GT est celui qui a généré le plus grand nombre de traductions identiques (127/163 phrases), ce qui suggère qu’il pourrait être moins sensible au contexte que les autres traducteurs. De plus, les différences entre les trois outils se manifestaient principalement au niveau du registre. Pour les textes et les phrases, CG et GT ont largement utilisé un registre poli, tandis que DL a utilisé dans la majorité des cas (plus de 80 %) un registre neutre.

Tableau 4 : Différences entre les unités saisies selon les trois outils

Tableau 4 : Différences entre les unités saisies selon les trois outils

Concernant toujours les différences entre les unités de production, nous soulignons que les éléments tels que le sujet, le thème, le déterminant possessif et le complément d’objet direct/indirect ont tendance à être explicités dans les traductions de « phrases », alors que ce n’est pas le cas dans celles de « textes ». Le tableau ci-dessous indique la proportion de chaque élément présent uniquement dans les traductions de « phrases », et non dans celles de « textes ».

Tableau 5 : Proportion des éléments dans la traduction des « phrases »

Tableau 5 : Proportion des éléments dans la traduction des « phrases »

Ce phénomène nous amène à penser que la TA tient compte de la caractéristique du japonais selon laquelle certains éléments grammaticaux peuvent être omis grâce au contexte antérieur.

3. Zones de fragilité dans les traductions

3.1. Prise en compte du contexte

Nous allons maintenant discuter quelques exemples particuliers. Un des éléments qui suggèrent que le contexte est pris en compte par la TA est les temps verbaux. Comme l’on peut le voir dans la partie soulignée du texte original (1), le locuteur exprime des événements passés en utilisant le présent (pour les verbes « reprendre » et « venir ») alors que jusqu’à ces passages, il exprimait des actions au passé. Même si la phrase en français est au présent, les traductions en japonais de CG et DL sont clairement exprimées au passé (à la forme impliquant -ta). De plus, il ne s'agit pas seulement d'un problème de temps verbaux : des expressions indiquant un changement comme « -koto ni naru » ou « -yô ni naru » et des expressions de transfert « -tekureru/morau/ageru », qui sont difficiles à assimiler chez des apprenants, sont correctement utilisées. Beaucoup de travaux antérieurs soulignent que les TA ont du mal à prendre en compte le contexte, mais il semble que cette lacune s'améliore progressivement.

(1) Original : C’était un dimanche. Alors, l’électricien était en congés. Je reprends des douches fraiches. […] Il vient le mercredi.

CG (Texte) : Sorewa nichiyôbi deshita. Shitagatte,denki-gishi wa kyûkachû deshita.Watashi wa reisui no shawâ o abirukotoni narimashita. […] Suiyôbi ni kitekuremashita.

DL (Texte) : Nichiyôbi datta. Denkiya wa yasumi datta. Watashi wa shawâ o abinaoshita. […] Kare wa suiyôbi ni yattekita.

(Phrase) : Nichiyôbi datta. Denki-gishi wa kyûkachû datta.Mata tsumetai shawâ o abiruyôni natta. […] Kare wa suiyôbi ni kuru.

Pour les verbes, les différences s’observent non seulement sur l’aspect et le temps, mais aussi sur la modalité. Dans l’exemple suivant, on peut également observer la richesse des expressions de liaison et l’adverbe. En comparant les trois outils, on peut remarquer que DL utilise le registre familier, des expressions proches de la langue parlée comme « -nakyaikenai » et « sonna konnade ». Étant donné que les énoncés originaux comportent des mots/tournures de registre familier, comme « job », « ça » (dans « à cause de tout ça »), on peut penser que ce sont ces éléments qui ont conduit à une traduction au registre neutre. Toutefois, compte tenu du taux d’utilisation du registre neutre dans DL (voir tableau 4), la traduction en registre familier ne semble pas être liée au choix du registre dans les phrases originales.

(2) Original : Comme j’ai besoin d’argent, je dois chercher un job étudiant, mais aussi apprendre mes cours, […] et chercher un stage. À cause de tout ça, je stresse un petit peu. […] Pour utiliser correctement mon temps, je vais faire un planning.

CG (Texte) : Okane ga hitsuyô nanode, arubaito o sagasanakerebanaranai dakedenaku, jugyô o manabi, […], intân o mitsukenakerebanarimasen. korera subeteno koto kara, watashi wa sukoshi sutoresu o kanjiteimasu. […] Watashi no jikan o tadashiku tsukau tameni, sukejûru o tateru tsumori desu.

(Phrase) : Okane ga hitsuyô nanode, arubaito o sagasanakerebanaranaidakedenaku, jugyô no gakushû, […], soshite intân-shippu no kensaku mo shinakerebanarimasen. Sonotame, watashi wa sukoshi sutoresu o kanjiteimasu. […] Kôkateki ni jikan o tsukau tameni, sukejûru o tateru kotoni shimasu.

DL (Texte) : Okane ga hitsuyô dakara, gakusei-baito o sagasanakyaikenaishi, jugyô mo ukenakyaikenaishi, […], shigoto mo sagasanakyaikenai. Sonnakonnade, chotto sutoresu ga tamatteimasu. […] Jikan o yûkô ni tsukau tameni, sukejûru o tateru.

3.2. Phrases complexes

Au niveau syntaxique, les erreurs de traduction sont fréquentes dans les phrases complexes comme on le voit dans l’exemple (3). La partie « afin de ne pas avoir de soucis » n’est pas bien positionnée dans la traduction de CG.

(3) Original : […], j’avais tout rempli avant sur internet, afin de ne pas avoir de soucis. Je suis donc arrivé à *T* sans soucis, jusqu’à la résidence où je devais compléter mon dossier.

CG (Texte) : […], jizen ni subete o intânetto de kinyûshite okanakereba narimasen deshita. Shitagatte, watashi wa toraburu ga nai yô ni *T* ni tôchaku shimashita. Soko de jûkyo no tetsuduki o suru hazu deshita.

(Traduction en français de CG : *J'ai dû tout remplir à l'avance. Par conséquent, je suis arrivé à *T* pour éviter des problèmes. C'est là que je devais effectuer les démarches pour le logement.)

Et les erreurs s’observent aussi quand il s’agit de constructions avec le gérondif :

(4) Original : Ce n’est pas encore suffisant, mais je fais de mon mieux en continuant mes études.

GT (Texte et Phrase) : Madamada fujûbun desu ga, benkyô o tsuzukete ganbatte ikimasu.

(Traduction de GT en français : *13 je vais continuer à faire de mon mieux pour mes études.)

DL (Texte) : Mada jûbun dewa nai keredo, benkyô o tsuzukeru koto de besuto o tsukushiteiru.

(Traduction de DL en français : * je fais de mon mieux grâce au fait que je continue mes études.)

DL (Phrase) : Mada jûbun dewa nai keredo, benkyô o tsuzukeru tameni besuto o tsukushiteiru.

(Traduction de DL en français : * je fais de mon mieux pour continuer mes études.)

Pour (4), seul CG a généré la bonne traduction en japonais avec « -nagara », et la traduction des autres ne correspond pas au sens de l’original.

Il est aussi important de faire attention lors de la saisie du français. Par exemple, le mot « après » dans l’exemple (5) n’a pas de fonction temporelle. Il est utilisé pour ajouter des informations supplémentaires au contenu précédemment mentionné. Donc la traduction en japonais « sonogo (“après cela”) » qui exprime la relation temporelle n’est pas appropriée. 14

(5) Original : D’abord, à *T*, il y a beaucoup de calcaire dans l’eau. Après, je n’ai d’eau chaude.

CG (Texte) : Sonogo, watashi wa oyu ga demasen.

(Phrase) : Sonogo, watashi wa onsui ga arimasen.

3.3. Proverbes, expressions idiomatiques

Dans l’original de l’exemple (6), l'expression « être perdu » est utilisée dans le sens d’« être désemparé », mais elle est traduite littéralement comme « s’égarer (“michi ni mayou”) » dans GT et DL15

(6) Original : J’étais perdue, et même en pleurant devant eux, ils n’ont pas voulu me donner les clefs.

GT (Texte et Phrase) : Michi ni mayotte karera no mae de naiteitemo kagi o watashitekuremasen deshita.

DL (Texte) : Watashi wa michi ni mayoi, karera no mae de naita nimo kakawarazu, karera wa kagi o watashitekurenakatta.

(Phrase) : Watashi wa michi ni mayoi, karera no mae de naitemo kagi o kurenakatta.

On dit souvent que ce genre d’expressions idiomatiques ainsi que les proverbes sont des éléments que les TA ont du mal à traiter. Effectivement, parmi les expressions idiomatiques et les proverbes présentés ci-dessous, seul CG a fourni une traduction appropriée.

(7) Expression idiomatique : « Anoko wa dokoka de abura o utteiru ni chigainai. »

(“Cet enfant doit être en train de traîner quelque part.”)

CG : Cet enfant doit être en train de traîner quelque part. (Correcte)

GT : Ce gamin doit vendre du pétrole quelque part. (Erronée)

DL : Ce garçon doit vendre de l‘huile quelque part. (Littérale)

Proverbe : « Hotoke no kao mo sando made » (“Même une personne aussi indulgente qu’un Bouddha finira par se mettre en colère ou par abandonner si elle est constamment traitée de manière injuste.”) 

CG : Même la patience a ses limites. (Correcte)

GT : Le visage de Bouddha jusqu'à trois fois. (Littérale)

DL : Le visage du Bouddha n'est pas le même que le visage du Bouddha trois fois. (Erronée)

Pour améliorer notre analyse, nous avons sélectionné 40 proverbes et 40 expressions idiomatiques que les Japonais apprennent généralement jusqu'à l'enseignement secondaire, puis avons comparé les traductions données par les trois outils. Le tableau suivant montre les résultats de l’analyse. Le signe « ? » indique les cas où la traduction semble être littérale mais est compréhensible en tant que proverbe et expression idiomatique.

Tableau 6 : Pertinence de la traduction des proverbes (ProVB) et des expressions idiomatiques (Ex.id.) selon les outils

Tableau 6 : Pertinence de la traduction des proverbes (ProVB) et des expressions idiomatiques (Ex.id.) selon les outils

Le taux de pertinence est plus élevé dans CG, alors que GT produit souvent des traductions littérales. Les proverbes comme « shu ni majiwareba akaku naru » (“Qui se frotte au rouge devient rouge.”) pour lesquels le degré de concrétude de chaque mot est relativement élevé et qui sont composés d’éléments grammaticaux de base sont souvent traduits avec précision par les trois outils. En revanche, les erreurs de traduction étaient fréquentes pour les expressions dépourvues d’éléments grammaticaux et/ou composées de mots dont le sens des mots est abstrait.

3.4. Différences selon la date de recueil des données (décembre 2023 vs mai 2024)

Comme les TA s’améliorent constamment grâce au deep learning, nous avons comparé les traductions obtenues en décembre 2023 et en mai 2024 pour observer les différences entre les trois outils ainsi que les unités de production. Mis à part la ponctuation, toutes les TA présentent plus de divergences dans les traductions de phrases que dans celles de textes. Et la variation était particulièrement marquée dans CG. Dans l'exemple (8), le mot « tatoeba (“par exemple”) » a été ajouté, bien qu'il n'apparaisse pas dans le texte source.

(8) Original : […] il y a de nombreuses dépenses que l’on ne peut pas voir. Le prix des repas, le loyer, l’électricité, […].

CG (2024) : […] ôku no shishutsu ga arimasu. Tatoeba, shokuji no nedan, yachin, denkidai, […].

En plus, les erreurs et les maladresses observées dans les traductions de 2023 se sont améliorées en 2024, avec des progrès notables dans CG, suivi de GT, puis de DL. Dans la version 2024, il y a beaucoup de suppressions/omissions de thème, sujet, possessifs, etc. et l’ajout d’éléments non présents dans le texte original au niveau de la phrase.

4. ChatGPT et l’enseignement du japonais

À l'heure actuelle, GT et DL sont les outils de traduction les plus utilisés. Mais, en voyant l’évolution rapide de CG et la qualité de sa traduction, il est probable que de plus en plus d'étudiants y recourront. 16 En plus, cet outil pourrait aussi être utile pour les enseignants dans la création d’exercices/questions. Nous allons donc examiner maintenant comment les apprenants et les enseignants peuvent tirer parti de CG.

4.1. Création d’exercices : verbe transitif et intransitif en japonais

Pour commencer, nous avons tenté de créer des exercices sur les verbes intransitifs et transitifs dont l’acquisition est difficile chez les apprenants de japonais. Pour vérifier la qualité de CG, nous avons donné une instruction avec une phrase qui contient une erreur : nous avons utilisé exprès le verbe transitif « waru (“briser”) » à la place du verbe intransitif « wareru (“se briser”) » et demandé à CG d’expliquer pour quelle raison la phrase contenait des erreurs. CG a fourni une explication correcte en utilisant le métalangage comme transitif et intransitif :

(9) « VB intransitif / transitif » japonais

(Instruction) : Veuillez expliquer s'il y a des erreurs dans la phrase « * mado-garasu ga watteimasu » (“la vitre est cassée”)

Réponse de CG :

La phrase « mado-garasu ga watteimasu » contient une petite erreur. L’expression correcte est « Mado-garasu ga wareteimasu ». Le verbe « waru » étant transitif, il est nécessaire d’utiliser le verbe intransitif « wareru » dans la phrase donnée.

Nous avons alors ajouté un ensemble de 38 paires de verbes transitifs/intransitifs dans CG, et lui avons demandé de créer des exercices. Nous avons alors obtenu exercices du type suivants : ceux qui demandent de transformer le verbe transitif en un verbe intransitif et vice-versa et des exercices à trous (Image 1).

Image 1 : Exercice de transformation

Image 1 : Exercice de transformation

Comme nous avons demandé d'utiliser les verbes intransitifs et transitifs figurant dans le tableau donné, les mêmes mots ont été utilisés. Mais une instruction plus détaillée comme « veuillez changer des mots » conduirait CG à varier le choix des termes/mots. Selon les instructions, il est aussi possible de varier le registre, le nombre d’exercices et même de générer des questions ou des textes adaptés au niveau des apprenants.

4.2. Création d’exercices : textes contenant les expressions/le vocabulaire visés

Il est également possible de créer des exercices au niveau des textes en se concentrant sur les mots ou les expressions souhaités. Par exemple, nous avons donné une instruction très détaillée : « Veuillez créer un texte français qui contient les expressions suivantes lors de la traduction en japonais. Le niveau CECRL doit être compris entre A1 et B1, le texte doit faire moins de 500 mots ». CG a alors généré un grand texte (ci-dessous à gauche). Nous avons, par la suite, demandé, sa traduction en japonais (dans Image 2 à droite) car l'enseignant doit toujours vérifier le texte pour détecter des erreurs, du vocabulaire ou des expressions non appris, et s'assurer que toutes les expressions souhaitées sont correctement incluses.

Image 2 : Texte généré par ChatGPT

Image 2 : Texte généré par ChatGPT

Le texte généré ainsi peut être utilisé en cours de la manière suivante :

1) Le texte en français sera distribué aux apprenants qui traduiraient d'abord, individuellement ou en groupe, le texte en japonais « sans utiliser » de TA.

2) Par la suite, ils utiliseraient la machine pour effectuer une seconde traduction.

3) Enfin, ils compareraient leur traduction avec celle produite par l’outil, en réfléchissant aux différences et aux causes de leurs erreurs. Ce que les étudiants n’arrivent pas à comprendre pourrait être discuté entre eux ou abordé avec l'enseignant, ce qui permettrait de susciter des réflexions chez les apprenants et d'encourager des activités interactives et métalinguistiques.

Ce n'est qu'un exemple d'exercice de traduction, mais il est possible de proposer différentes activités à partir des textes générés par CG.

Conclusion

Cette étude nous a permis de mettre en lumière des différences entre les outils de TA : CG fournit les meilleures traductions, GT privilégie la traduction littérale, et DL utilise de nombreuses tournures familières ou orales. Deux facteurs de variation ont également pu être identifiés : l'unité d'entrée (texte vs phrase) et l’évolution rapide des performances, ces outils étant en constante amélioration. L’utilisation des outils de traductions conduit l’apprenant à réfléchir à ce qu’il peut en tirer et aux améliorations possibles, et offre de nouvelles pistes de réflexion portant sur les unités, la lexicalisation, l’importance du contexte, etc. Ces activités cognitives, qui élargissent le champ de réflexion, semblent être importantes parce qu’elles seront demandées lorsque les étudiants entreront dans le monde professionnel. Enfin, une réflexion qui nous est venue au fil de la recherche semble être importante : s’il y a des enseignants qui essaient de sensibiliser des apprenants à l'utilisation des outils de traduction automatique, la plupart le font individuellement, en étant seuls responsables. Mais, étant donné la vitesse de diffusion et l’amélioration considérable de la qualité des traductions, la place de la TA mérite sans doute d’être interrogée. Faut-il encourager le mouvement actuel et l’étendre à l’ensemble des établissements, ou bien accentuer encore cette évolution en intégrant la TA dans les programmes ?

Bibliographie

BARYSEVICH, Alena & COSTARIS, Claire, « Traducteurs automatiques neuronaux comme outil didactique/pédagogique : DeepL dans l’apprentissage du français langue seconde », in Nouvelle Revue Synergies Canada, 2021, Guelph, (14), p. 1-16.

BOWKER, Lynne, « Machine translation literacy instruction for international business students and business English instructors », in Journal of Business & Finance Librarianship, 2020, 25(1-2), p. 25-43, <URL : https://doi.org/10.1080/08963568.2020.1794739>.

CLIFFORD, Joan, MERSCHEL, Lisa & Joan MUNNÉ, « Surveying the landscape: what is the role of machine translation in language learning? », in The Acquisition of Second Languages and Innovative Pedagogies, 2013, Vol. 10, no. 10, p. 108-121, consulté en novembre 2023, <URL : https://doi.org/10.7203/attic.10.2228>.

GONSE, Angèle, « Traduction automatique et usages sociaux des langues. Quelles conséquences pour la diversité linguistique ? », in Beacco, Jeau-Claude et al., Traduire, Revue française de la traduction, 2022, 246, p. 24-27.

IYANAGA, Keiko, « A Survey of the Use of Machine Translators by Japanese College Students and an Implication for its Incorporation into English Language Instruction », in Memoirs of Kyoto Tachibana University, 2022, No. 48, p. 1-19.

KIMURA, Sachiko, « AI翻訳と日本の大学におけるドイツ語教育 [Traduction de l’IA et enseignement de la langue allemande dans les universités japonaise] », in Dokkyo journal of language learning and teaching, 2022, Sōka, 10, p 77-95.

KIMURA, Sachiko, « AI翻訳の外国語教育への影響を考える――獨協大学ドイツ語学科開設科目『テクスト研究芸術・文化』におけるAI翻訳の活用例―― [Réflexion sur l’impact de la traduction par l’IA sur l’enseignement des langues étrangères] », in Dokkyo University German Studies Research Contributions, 2023, Sōka, 81, p. 1-22.

KLIFFER, Michael, « An experiment in MT post-editing by a class of intermediate/advanced French majors », in Proceedings of the 10th EAMT conference: Practical applications of machine translation, 2005, Budapest, p. 160-165. <URL : https://aclanthology.org/2005.eamt-1.22/>.

LARSONNEUR, Claire, « Intelligence artificielle ET/OU diversité linguistique : les paradoxes du traitement automatique des langues », consulté en novembre 2023, <URL : https://doi.org/10.4000/hybrid.650>.

LEE, Sangmin-Michelle, « The impact of using machine translation on EFL students’ writing », in Computer Assisted Language Learning, 2019 (online)/2020, 33, p. 157-175, <URL : https://doi.org/10.1080/09588221.2018.1553186>.

NISHIJIMA, Yu, « Can The Machine Translation end Linguistic Imperialism?: Thinking from its Mechanism », in AGLOS: Journal of Area-Based Global Studies (Special Edition 2016), Sophia University Graduate School of Global Studies, 2018, Sophia, p. 1-19, consulté en novembre 2023, <URL : http://gds-gs-sophia.jp>.

ODA, Toshiko, « 機械翻訳と共存する外国語学習活動とは [Activités d’apprentissage des langues étrangères compatibles avec la traduction automatique] », in Revue des sciences humaines et naturelles de l’Université Tokyo Keizai, 2019, No. 145, p. 3-27.

O’NEILL, Errol-M, « Online Translator, Dictionary, and Search Engine Use: Among L2 Students », in CALL-EJ, 2019, 20-1, p. 154-177, <URL : https://old.callej.org/journal/20-1/O'Neill2019.pdf >.

SENOUE, Kazunori, « The Limitations of Machine Translation and the Possibility of Human Translation », in AGLOS: Journal of Area-Based Global Studies, 2018, p. 1-23.

STAPLETON, Paultapleton & KIN, Becky Leung Ka, « Assessing the accuracy and teachers’ impressions of Google Translate: A study of primary L2 writers in Hong Kong », in English for Specific Purposes, 2019, 56, p.18-34, <URL : https://doi.org/10.1016/j.esp.2019.07.001>.

TAMURA, Hayato & YAMADA, Masaru, « Enquête sur l’utilisation de la traduction automatique dans l’enseignement des langues étrangères : revue des travaux antérieurs », in MITIS Journal, 2021, vol. 2, No. 1, p. 55-66.

TSAI, Shu-Chiao, « Chinese students’ perceptions of using Google Translate as a translingual CALL tool in EFL writing », in Computer Assisted Language Learning, 2020, p. 1-23.

YAMADA, Masaru, LANGLITZ, Hisaka, ODA, Toshiko, MOCHIDA, Tomohiro, TAMURA, Hayato, HIRAOKA, Yusuke & Toshiko, IRIE, « A Preliminary Survey on the Use of Machine Translation in English Education at Japanese Universities », in Invitation to Interpreting and Translation Studies, 2021, No. 23, p. 139-156.

YAMADA, Masaru, « Language learners and non-professional translators as users », in Minako, O’Hagen (ed.). The Routledge Handbook of Translation and Technology, 2019, p. 183-199.

Notes

1 Il s’agit d’une version GPT-3.5. Retour au texte

2 Il en va de même pour les études de Tamura et Yamada (2021) et de Iyanaga (2022) : plus de 70 % des apprenants ont déjà utilisé la TA, et de plus en plus d’apprenants réclament son utilisation. Retour au texte

3 Selon Clifford et al. (2013), les principales utilisations de la TA sont les suivantes : « signification du vocabulaire (91 %) », « recherche d’expressions idiomatiques (36 %) » et « conjonctions (31 %) » (in Tamura et Yamada 2021 : 57). Retour au texte

4 Oda cite les résultats publiés par la société Mirai Translation S.A. en juin 2017. Retour au texte

5 Source : la société Mirai Translation S.A., avril 2019 Retour au texte

6 Selon Nikkei Big Gate (https://bizgate.nikkei.com/aboutus/index.html) Retour au texte

7 Le roman « Tokyo-to Dôjô-tô » de Rie Kudan, qui a remporté le 170e prix Akutagawa en 2024, contient 5 % de contenu généré par des IA creatives telles que ChatGPT. Retour au texte

8 C’est l’opinion de la plupart des auteurs des ouvrages traités dans cet article. Retour au texte

9 (1) Privacy/confidentiality (2) Academic integrity (3) Potential for algorithmic bias (4) Awareness of different tools (5) Awareness of different translation tasks (6) Improving the output by changing the input Retour au texte

10 Nishijima (2017, 14) suggère également que dans le GT, il existe des combinaisons de traductions où l'anglais sert de langue médiatrice. Également, Gonse (2022, 26) : « Les auteurs sont nombreux à s’accorder sur le fait que l’anglais est la langue pivot en matière de traduction automatique, en raison de l’ampleur du corpus dans cette langue ». Retour au texte

11 Pour minimiser ces problèmes, on parle souvent de l’importance de la pré-édition et de la post-édition que nous ne développerons pas ici. Retour au texte

12 Dans le tableau, le signe « > » indique une supériorité en termes de quantité. Retour au texte

13 Dans ce travail, nous utilisons le signe « * » pour indiquer une phrase dont le sens diffère de celui de l’original. Retour au texte

14 Pour les machines dotées d’une fonction vocale comme ChatGPT, il faut également être particulièrement vigilant lors de la saisie vocale. En effet, certains étudiants utilisent le mot « donc » dans un contexte où il ne joue pas le rôle de conjonction, par exemple en début de présentation orale. Retour au texte

15 En passant, cette erreur n'avait pas été corrigée même en mai 2024 (donc 5 mois après le recueil des données). Retour au texte

16 Selon le site Nikkei, « le nombre d’utilisateurs ayant visité le site de ChatGPT en avril 2023 est estimé à environ 2,1 milliards, et son nombre d’utilisateurs a augmenté de manière spectaculaire ». Il est également mentionné que « la répartition des visiteurs par pays montre que les Etats-Unis sont en tête (environ 11 %), suivis par l’Inde (environ 9%) et le Japon (environ 7%) et que le Japon est le pays avec le plus grand nombre d’utilisateurs de GPT par habitant au monde ». Retour au texte

Illustrations

Citer cet article

Référence électronique

Chieko Kawai, « Les outils de traduction automatique, quelle utilité pour l’enseignement du japonais ? – Comparaison de trois outils – », La main de Thôt [En ligne], 13 | 2025, mis en ligne le 17 décembre 2025, consulté le 10 février 2026. URL : http://interfas.univ-tlse2.fr/lamaindethot/1660

Auteur

Chieko Kawai

Université Grenoble Alpes, chieko.kawai@univ-grenoble-alpes.fr