2024年5月に新しく発表された、生成人工知能システムChatGPT(チャットジーピーティー)4O(オムニバス)が話題になっている。GPT5ではなく、4oというのが、ちょっとミステリアスだが、果たしてそのクオリティはどうなのか?
当ブログでは以前、Chat GPT旧バージョン3.5 と4.0の翻訳能力、特に、日本語から英語(英訳)への機能についてその性能を検証した。主語が不明だったり、言葉のチョイスがおかしかったりしたが、人間の自然言語を使って作動する人工知能ということで、AIの存在そのものが身近になり、中でも翻訳機能(英訳)については、下訳としては、十分に機能することを確認した。
最新版のChat GPT-4o(オムニバス)の英訳クオリティを検証した。前回と違い、今回の結果からは、旧バージョンのGpt4と比べると、あまり変化がなく、一部では、退化したかと思われるような文章が得られた。しかし、そのクセを理解し、リスクを把握していれば、非常に便利なツールとして活躍してくれるだろう。
前回の記事「GPTオムニバスとは何か」、および「こころ」の冒頭前半部分英訳に対する解説はこちらから⇩
クオリティチェック! 漱石の「こころ」を英訳(2)!
では、前回の続きとして、GPT4オムニバスを使って、以下の夏目漱石の「こころ」に出てくる冒頭場面の続編を訳す。この作品は、英語に訳され、世界的に日本文学ファンに親しまれていて、その英語版がすでに3種類ほど出版されている。その英訳と人工知能が行った英訳とを比較・検討することにしたい。ちなみに正式な英語版に
方法は、原文をChatGPT4o(オムニバス)にかけ、その結果をまず示し、それがどの程度正確に訳されているかを分かりやすくするため、Google翻訳を使って再邦訳した。以前も軽く触れたが、Google翻訳に関しては、多少の問題はあるものの、邦訳については、案外しっかり訳してくれるので、一つの目安にはできる。もし、Google 翻訳に問題が発生した場合は指摘する。
最後に、正式な英文を掲載し、オムニバスの英訳と比較。改善点・問題点を指摘する。問題点は太字で示した。正式訳の青字部分は、生成AIと人間の訳の顕著な違いなので、同時に解説を加えている。
(原文2)学校の 授業が 始まるには まだ 大分 日数があるので 鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私は、 当分 元の 宿に 留まる 覚悟をした。 友達は 中国のある 資産家の 息子で 金に 不自由のない 男 であった けれども、 学校が学校なのと 年が年なので、 生活の 程度は 私とそう 変りもしなかった。 したがって 一人ぼっちに なった 私は 別に 恰好な 宿を 探す 面倒も もたなかったの である。
(オムニバス英訳2−1)Since there were still quite a few days before school started, I, who was in a situation where it didn’t matter whether I stayed in Kamakura or went back, decided to remain at the original inn for the time being. My friend was the son of a wealthy Chinese family and had no financial difficulties, but because of the school and his age, his standard of living was not much different from mine. Therefore, being alone, I didn’t bother to find a more suitable inn.
(オムニバス英訳の邦訳2−1)学校が始まるまでまだかなり日数があったので、鎌倉に残っても帰っても構わない状況だった私は、とりあえず元の宿に残ることにした。友人は裕福な中国人の息子で、経済的に困っているわけではないが、学校と年齢のせいで生活水準は私と大差なかった。だから、一人ぼっちの私は、もっと適当な宿を探す気にはならなかった。
(正式な英訳2)There were many days left before the beginning of term, and I was free either to stay in Kamakura or to go home. I decided to stay. My friend was from a wealthy family in the Central Provinces, and had no financial worries. But being a young student, his standard of living was much the same as my own. I was therefore not obliged, when I found myself alone, to change my lodgings.
解説
(1)不自然な英語:日本語に忠実に訳しすぎ △
(a)「鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私」
I, who was in a situation where it didn’t matter whether I stayed in Kamakura or went back, decided to stay…
この部分が不自然な英語になっている。なぜ不自然と感じるかは、その冗長さによる。関係副詞、関係代名詞を使って、日本語の構文に忠実に訳してしまった結果、主語である「I」とこの文の動詞「decided」が離れてしまったからだ。だから、英語としてかなり冗長で読みにくい。この後に続く部分、
(b-1) 当分 元の 宿に 留まる 覚悟をした。
to remain at the original inn for the time being.
この部分も不自然に感じる。なぜなら、ここを忠実に訳すことで、話の流れが悪くなってしまっているのだ。訳としては、別に間違っていないのだが、正式なマクレラン訳では
(正式な訳 b-2) I decided to stay (in Kamakura). (鎌倉に)残ることにした。
と、ごくシンプルに訳され、「元の宿に。。。」の部分が省略されている。なぜなら、「元の宿」というのは、鎌倉のことなので、ここでいちいち英語で再度説明すると、冗漫な文章になってしまい、逆にストーリー展開が理解しにくくなるからだ。ここでは、「次の場面にどんどん展開していかないと読者を惹きつけることができない」とマクレランは判断したのだろう。
(2)文章の書かれた場面背景を理解していない △
中国を、Chinaと訳してしまった。ここでは、中国地方のことなので、完全に誤訳である。
しかし、無理もない。機械にはそんな『こころ』の舞台設定など分かるはずもない。たとえ日本人であっても、同じように「China」と理解する人がいるかもしれない。現代では、中国人が観光で大勢訪日してくるので、「中国」と言えば、日本の「中国地方」ではなく外国の「中国」を思い浮かべる人がいてもおかしくない。
ちなみに、ChatGPT4oに、間違いを指摘してあげると、下記のようにきちんと訂正してくれた。
さて、オムニバスは、中国地方を the Chugoku region in Japanと訳してくれた。確かに、現代であれば、日本に来る外国人も増えたし、中国をChugokuと訳すことは適切だと思う。また、この「こころ」の読者はどんな人か? を考えた時に、日本に来て興味を持ち、日本文学にも手を出そうと思って漱石の作品を手に取る人も多いだろう。しかし、だとしても、日本に地理に詳しい人はそんなに多くはない。この訳だと、日本の一地方だとは分かるが、どの辺かは見当がつかない。
一方で、マクレランは、中国地方を「Central Provinces」と訳した。1950年代に日本のことをどれだけの人が詳しく知っていたかを考えた時、日本の地理に疎い人に対して、大体のイメージを与えるための訳としては適切だと感じている。ちなみに、中国地方は、京都と太宰府があった九州との「真ん中に位置する」という意味で中国なのだそうだ。
(3)日本語の独特の言い回しが分からない △
(c-1)学校が学校なのと 年が年なので、生活の 程度は 私とそう 変りもしなかった。
because of the school and his age, his standard of living was not much different from mine. (学校と年齢のせいで、生活水準は私と大差なかった)
これは、確かに、直訳するとその通りなのだが、「学校が学校なのと 年が年なので」を、日本語でもっと分かりやすい他の表現に言い換えると、「まだ年が若いので」と言い換えられる。
また、この部分の英語を読んでも、なんだか意味がよく分からない。要するに、ここは
- 「生活水準は私と大差なかった」
ということを言いたいわけだ。しかし、それが、「学校と年齢のせいで」と言われても、それがどう「生活水準」と結びつくのかよく分からない。だが、
- 「(金持ちの息子だが)まだ若いので(貧しい)自分とあまり生活は変わらない」
と言われれば納得する。正式なマクレランの訳では、
(正式な訳c-2) But being a young student, his standard of living was much the same as my own. (しかし、彼は若い学生だったので、生活水準は私とほとんど同じでした)
となっていて、その分かりにくい、文字として表れない文脈を上手に訳している。なんだか、これを訳した当時(1957年)、マクレランがかなり苦労して訳している様子が容易に想像され、興味深い。
ここで、少し英語が堪能な読者はお気づきかもしれないが、
- (オムニバス訳)his standard of living was not much different from mine. 生活水準は、私と大差なかった
- (正式な訳)his standard of living was much the same as my own. 生活水準は私とほとんど同じ
と、少し違いがある。differentを使うか、sameを使うのでは、どちらがいいのか?
確かに、日本語訳だけを見ると、オムニバス訳の方が、原文に近いので、こちらが正解と思われるかもしれない。しかしながら、英語では否定形を避けることで、文章を分かりやすくさせるのが、英作文の一つの技である。否定形を避けることで、ポジティブな印象を与えられるし、話が論理的に進みやすいし、理解されやすい。特に二重否定は、強調など、特別な意図がない限り、できるだけ避けた方がいい。
このような英文法の傾向があるのでマクラレンは、原文では確かに否定形を使っているのだが、「読者である英語のネイティブスピーカーはどう感じるか?」を優先的に考えて、否定形を避け、この文脈においてより自然な英語だと感じられる「Same」を使用したのだと推察される。この点が、日本語と英語の微妙な違いでもある。
(4)単語の選択が適切さに欠ける △
別に 恰好な 宿を 探す 面倒も もたなかったの である。
Therefore, being alone, I didn’t bother to find a more suitable inn.(だから、一人ぼっちの私は、もっと適当な宿を探す気にはならなかった)
この訳をより正確に訳すのは、正直言って、難しい。「探す面倒ももたなかった」というのは、「(他人の家だけど、一緒にいるはずの友人は帰ってしまって一人になったから)宿を探す必要はなかった」という意味だ。ここでは、「外的要素によってそういう状況になってしまった」という受け身的なニュアンスが場面背景として観察される。
(a) Not bother(気にしない), という表現をオムニバスは訳としてあてがった。botherには、結構感情的に強いニュアンスがある。家に残るという決断は、自分ではコントロールの効かない状況の中での判断であって、自分の都合だけで決断したのではない。しかし、bother を使ってしまうと、そこに自分の意思が働いているような印象を受けてしまう。
(b) 比較級の問題:さらに、a more suitable inn(より適当な宿)と続けている。「より適当な宿」と比較級を使って言ってしまうと、穿った見方をすれば、友達の下宿が、あたかも悪い場所であるかのような、「自分にとって、もっと素晴らしい場所(を探したい)」、とも解釈され、もっとより贅沢な場所を求めているような、なんとなくわがままなニュアンスが出てしまう。ちなみに、比較の要素は、原文にはない。
では、どういう単語を使うのが適切なのだろうか。
正式な訳:I was therefore not obliged, when I found myself alone, to change my lodgings(したがって、私が一人になったときに、下宿を変える必要(義務)はありませんでした)。
マクレランの英訳では、まず、比較級ではなく、シンプルにchange my lodgings(宿を変える)と表現した。さらに、obligedを使って、不可抗力であるニュアンスを表現している。obliged、のニュアンスには、「そうせざるを得なかった」という感覚が含まれる。
言外の文化背景を汲み取る能力をどう習得させるかが今後のAIの課題
人間の英訳と生成AIとの違い
- 自然な英語に直す能力: AIだと、どうしても日本語の構文や言葉にとらわれてしまって、直訳になってしまう。それが機械としての限界なのかもしれない。直訳だと、ダラダラと長いだけの冗長な文章になったり、日本語で表現しようとする意図が十分に伝わらない場合が多々ある。さらに、その場面に相応しい言葉、細かいニュアンスを伝える表現を選ばないと誤解を生んでしまう。マクレランは、ネイティブスピーカーとして英語話者にとって自然な表現を選んでいる。
- 場面背景を理解する能力: 中国を、お隣の中華人民共和国じゃないと判断できるかどうかは、生成AIにとって大きなチャレンジだ。しかし、これは、その都度AIに習得させれば、徐々に修正できる箇所かもしれない。一方で、マクレラン英訳では、中国をきちんとCentral Provincesと訳し、日本の地理に疎い読者でも大体分かるように配慮している。
- 日本語の独特な言い回し・文化背景理解する能力: 日本語は文脈に依存する言語なので、特に、微妙な心理や描写が多く登場する文学作品では、はっきりと文章として書かれていない部分が多く、それを機械が英訳することは大変難しい。だから、2024年6月現在の生成AIの技術では、十分に満足する結果が得られていない。ディープラーニングのレベルがまだ浅く、日本語独特の表現のインプットがまだまだ足りないのかもしれない。そういう目に見えない部分を理解し、補う能力は、人間にしかできないことであって、マクレランの英訳では、多少表面上の言葉が原文と変わっても、きちんと作者の本意が伝わるように創意工夫している。
オムニバスとGPT4.0との比較。改善点・問題点
次に示すのは、以前の記事からの引用で、上記の「こころ」と同じ部分に対するGPT4の英訳とその邦訳、そして、それと比較するためにオムニバスの英訳をその下に掲載した。
(原文2)学校の 授業が 始まるには まだ 大分 日数があるので 鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私は、 当分 元の 宿に 留まる 覚悟をした。 友達は 中国のある 資産家の 息子で 金に 不自由のない 男 であった けれども、 学校が学校なのと 年が年なので、 生活の 程度は 私とそう 変りもしなかった。 したがって 一人ぼっちに なった 私は 別に 恰好な 宿を 探す 面倒も もたなかったの である。
(GPT4英訳2−1)Since there were still many days before the start of school, I found myself in a situation where staying in Kamakura or returning home were both viable options. I decided to stay at my original lodging for the time being. My friend, the son of a wealthy family from China, never had to worry about money. However, given the nature of our school and our age, our lifestyles were not much different. Therefore, being left alone, I did not bother to look for a more suitable lodging.
(GPT4 再邦訳2-1)学校が始まるまではまだ日数があったので、鎌倉に残るか、実家に帰るか、どちらも選択肢として考えられる状況になりました。 とりあえず元の宿に泊まることにした。 私の友人は中国出身の裕福な家庭の息子で、お金の心配をする必要がありませんでした。 しかし、学校の性質や年齢を考えると、私たちの生活スタイルはそれほど変わりませんでした。 したがって、一人になった私は、より適当な宿を探す気にもならなかった。
(オムニバス英訳2−1)Since there were still quite a few days before school started, I, who was in a situation where it didn’t matter whether I stayed in Kamakura or went back, decided to remain at the original inn for the time being. My friend was the son of a wealthy Chinese family and had no financial difficulties, but because of the school and his age, his standard of living was not much different from mine. Therefore, being alone, I didn’t bother to find a more suitable inn.
(オムニバス英訳の邦訳2−1)学校が始まるまでまだかなり日数があったので、鎌倉に残っても帰っても構わない状況だった私は、とりあえず元の宿に残ることにした。友人は裕福な中国人の息子で、経済的に困っているわけではないが、学校と年齢のせいで生活水準は私と大差なかった。だから、一人ぼっちの私は、もっと適当な宿を探す気にはならなかった。
改善点なし
前回の「こころ」の冒頭部分前半の英訳に関しては、改善点がいくつか見られた。しかし、残念ながら、冒頭部分後半を英訳した今回は、特に改善点は見られなかった。
- 「当分 元の 宿に 留まる 覚悟をしたーat my original lodging for the time being」が、そのまま訳されている点も同じ。
- 中国を、隣国の中国、Chinaと訳してしまっている点も、相変わらずである。
- Not bother(気にしない), を使用したり、比較級を使っている点も改善が見られなかった。
原文:別に 恰好な 宿を 探す 面倒も もたなかったの である。
AI訳:I did not bother to look for a more suitable lodging(より適当な宿を探す気にもならなかった)。
問題点
冗長な表現
(原文)鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私
(GPT4英訳)I found myself in a situation where staying in Kamakura or returning home were both viable options(鎌倉に残るか、実家に帰るか、どちらも選択肢として考えられる状況になりました)。
との英訳だが、ここは、「言いたいことは分かるが、そこまで長々と説明しなくても。。。」と言いたくなるような冗長な文章だ。漱石の原文は、もっとあっさりしている。そこで、正式な英訳を見てみると、
(正式な訳)I was free either to stay in Kamakura or to go home(鎌倉に残るか帰るかは自由だった)
になっていて、漱石のシンプルな言い方から生まれるニュアンスをうまく表現している。
より分かりにくくなったオムニバス
では、ここで、この部分のオムニバスの英訳はどうなっているのか、先ほども例に挙げた部分だが、もう一度見てみよう。
(オムニバス英訳)I, who was in a situation where it didn’t matter whether I stayed in Kamakura or went back, decided to stay…
なんと! こちらの文章の方がより分かりにくい。なぜなら、関係代名詞と関係副詞のオンパレードという感じだからだ。文法的には、決して間違っていない。しかし、もし、あなたが、アメリカの大学で、英作文の授業を取っていて、このような文章を書いたら、必ず訂正されるタイプの文章だ。4.0の英訳も分かりにくかったが、オムニバスでは、さらに分かりにくくなってしまった。
オムニバスの問題点を理解した上で使いこなせば便利な道具
今回の検証では、以前のGPT4と比べて、オムニバスの翻訳クオリティは、同等か、少し退化したのでは? と懸念される箇所が発見された。実際、オムニバスを使い始めて、他の場面でも似たようなことを体験しているので、たまたまここの箇所だけおかしかっただけだ、と断言はできないだろう。
結論としては、前回と同様で、いざ、それだけでそのまま使えるかと言うと、そうではなく、やはり、誰か、2つの言語に精通した人にチェックしてもらわないといけないレベルだ。現段階では、翻訳・通訳の仕事を楽にしてくれるツールではあるが、レベルの高いプロの仕事を奪うには、まだまだ時間がかかるだろう。特に、ここで試したような夏目漱石に代表される文学作品の英訳には向かないだろう。
しかし、いちいち辞書を引かなくても良い、というメリットがある。しかも圧倒的に早い! その速さを追求するなら、十分に使える道具であることには間違いない。日常会話の通訳でも十分使えるだろうし、複雑で、高度な内容でも、誤解が多少生じてもいいなら、とても便利なツールだろう。つまり、そのリスク・デメリットを理解して使いこなせば良いのだ。それを使いこなす知恵を人間が身につける必要がある。