人間の言語がわかるコンピュータが登場した。それが、ChatGPT(チャットジーピーティー)だ。コンピュータ言語ではなく、自然言語を使って操作ができる。素人でもコンピュータ・プログラミングができる。それが、このAIチャットサービスの大きな特徴だ。このサービスを使えば、誰でも自由に、人間の文章を使って人工知能を操作できるようになった。そして、機械翻訳サービスも、この技術によって格段にレベルが上がった。
さらに、その性能は日々アップグレードされている。Chat GPTが発表された時は、まだまだ翻訳はできないとされていた。しかし、2023年11月現在、日本語と英語の翻訳ができるようになった。そこでその実力を試すために、今回は、夏目漱石の「こころ」を題材として取り上げ、実際にChatGPTを使って翻訳し、その後正式な英訳との比較も試みることにした。この検証によって、ChatGPTの英訳がどの程度まで進化したのかを確認し、さらに、無料版ChatGPTと有料版の違いにも言及し、その概要や問題点などを徹底解説したいと思う。
ChatGPTが翻訳もできるようになった。その実力は英訳に限って言うと、現時点では、まだまだそのままでは使えない。2つの言語に精通する人がチェックする必要がある。具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろう。
どこまで正式な英訳に近づけるのか? 漱石の「こころ」の英訳に挑戦!
ChatGPTが翻訳もできるようになった。その実力は英訳に限って言うと、現時点では、まだまだそのままでは使えない。2つの言語に精通する人がチェックする必要がある。具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろう。
では早速、ChatGPTを使って、前回の記事と同様、夏目漱石の「こころ」に出てくる別の冒頭部分の文章を英訳してみよう。この作品は、すでに英語版が、いろんな翻訳者によって3種類ほど、すでに出版されている。今回参照した正式な英語版 実際に人間が行った英訳と人工知能が行った英訳とを比較して、その精度などを検討していこう。
まず、原文をChatGPTにかけ、その成果を示し、その英訳がどの程度正確に訳されているかを検証するため、Google翻訳を使って再邦訳してみた。Google翻訳の精度は、上記でも軽く触れたが、邦訳に関しては、多少の問題はあるものの、結構しっかり訳してくれるので、一つの目安にはできる。もし、ここで問題が発生したら、その都度指摘していく。最後に、正式な英文を掲載し、英訳と比較。問題点を指摘する。問題点は太字で示した。
ここで、使用するChatGPTは、有料版の4.0のプラグインとして使える「和英翻訳GPT」を使用。無料版との比較は、その後に掲載する。
ChatGPT4による英訳2
(原文2)学校の 授業が 始まるには まだ 大分 日数があるので 鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私は、 当分 元の 宿に 留まる 覚悟をした。 友達は 中国のある 資産家の 息子で 金に 不自由のない 男 であった けれども、 学校が学校なのと 年が年なので、 生活の 程度は 私とそう 変りもしなかった。 したがって 一人ぼっちに なった 私は 別に 恰好な 宿を 探す 面倒も もたなかったの である。
(英訳2)Since there were still many days before the start of school, I found myself in a situation where staying in Kamakura or returning home were both viable options. I decided to stay at my original lodging for the time being. My friend, the son of a wealthy family from China, never had to worry about money. However, given the nature of our school and our age, our lifestyles were not much different. Therefore, being left alone, I did not bother to look for a more suitable lodging.
(Google 再邦訳2)学校が始まるまではまだ日数があったので、鎌倉に残るか、実家に帰るか、どちらも選択肢として考えられる状況になりました。 とりあえず元の宿に泊まることにした。 私の友人は中国出身の裕福な家庭の息子で、お金の心配をする必要がありませんでした。 しかし、学校の性質や年齢を考えると、私たちの生活スタイルはそれほど変わりませんでした。 したがって、一人になった私は、より適当な宿を探す気にもならなかった。
(正式な英訳2)There were many days left before the beginning of term, and I was free either to stay in Kamakura or to go home. I decided to stay. My friend was from a wealthy family in the Central Provinces, and had no financial worries. But being a young student, his standard of living was much the same as my own. I was therefore not obliged, when I found myself alone, to change my lodgings.
大目に見てもいい点
仰々しい表現
I found myself in a situation where staying in Kamakura or returning home were both viable options(鎌倉に残るか、実家に帰るか、どちらも選択肢として考えられる状況になりました)。
との英訳だが、ここは、仰々しい感じの訳になっていて、「確かに言いたいことは分かるが、そこまで長々と説明しなくてもいいのでは?」と、どうしてもツッコミを入れたくなるような文章だ。原文は、もっとあっさりしていて、
鎌倉に おっても よし、 帰っても よしと いう 境遇に いた 私
となっている。確かに、こういうちょっとした簡単な表現の方が翻訳が難しい場合も多々ある。そこで、正式な英訳を見てみると、
I was free either to stay in Kamakura or to go home(鎌倉に残るか帰るかは自由だった)
になっていて、原文のシンプルな言い方のニュアンスを表現するのに成功している。
上記はGPT-4.0の結果だが、試しに、GPT-3.5に訳させてみたら、意外な結果が出た(詳しくは下記に)。
(GPT-3.5の英訳)I was in a situation where it was okay to stay in Kamakura or go back home(鎌倉にいてもいいし、帰ってもいいという状況でした)。
こちらの訳の方が原文にも近いし、あっさりさが表現されていて好感が持てる。
問題点
中国を、隣国の中国、Chinaと訳してしまっているが、これは、中国地方のことなので、完全に誤訳である。
しかし、この原文を初めて読んだら、たとえ日本人であっても、現代の若者であれば、同じように「China」と解釈する人がいると思う。明治時代と違って、現代においては、「インバウンド消費」などのニュースが毎日のように流れるので、「中国」と言えば、日本の「中国地方」ではなく外国の「中国」を思い浮かべる人の方が多いかもしれない。
難しい単語の選択
Not bother(気にしない), という言い方があり、それが使われている部分がある。ChatGPT-4.0の訳では、
AI訳:I did not bother to look for a more suitable lodging(より適当な宿を探す気にもならなかった)。
となっている。原文の、
原文:別に 恰好な 宿を 探す 面倒も もたなかったの である。
部分を訳したものである。この場面での、言外の文脈に隠された意味をあえて文章にすると、「生活レベルも同じくらいだし、特に気にする要素は何もないので、友達に気を使って、そこに滞在しないという選択肢もあったが、それはやめた」という意味だ。正式なマクレランの英訳は、その気持ちをよく表している。
正式な訳:I was therefore not obliged, when I found myself alone, to change my lodgings(したがって、私が一人になったときに、下宿を変える必要(義務)はありませんでした)。
となっている。日本語訳だけをみると、あまり大差ないように感じるが、英語で考えると少し違和感を感じる。この状況で、わざわざbotherを使って、
I did not bother to look for a more suitable lodging(より適当な宿を探す気にもならなかった)。
と言ってしまうと、ちょっとぶっきらぼう、というか、わがままで、自分のことだけを考えているような印象を与えてしまうからだ。botherには、結構感情的に強いものがあるからだ。この決断は、相手のことも含め、総合的に考えて判断したのであって、自分の都合だけで決断したのではないのにも関わらず、このGPTの訳では、その部分を強調するかのように bother を使い、さらに、a more suitable lodging(より適当な宿)と続けている。なぜここで比較をする必要があるのか? 「より適当な宿」と言ってしまうと、穿った見方をすれば、「自分にとって、もっと素晴らしい場所」とも解釈されてしまい、友達の下宿が、あたかも悪い場所であるかのようなニュアンスが出てしまう。ちなみに、比較の要素は、原文にはない。
一方で、マクレランの英訳では、その点を考慮して、シンプルにchange my lodgings(宿を変える)と表現し、比較することを避けた。さらに、obligedを使った点が素晴らしい。obliged、のニュアンスには、「義理を感じて決断する必要はない」という感覚が含まれるので、この単語の選択によって、「友達に気を使っている気持ち」だとか、控えめな気持ちが前面的に押し出された。
そもそも「面倒を持たなかった」をどう訳すかは、少し古い表現なので、AIだけでなくても、現代の翻訳者にとっても、少し難しいのかもしれない。しかしながら、どんな難しい状況でも、それぞれの状況に応じて、適切な単語を選択しなくてはならないのが、プロの(人間の)翻訳家の仕事だ。言葉一つひとつに隠されている微妙なニュアンスを感じ取って、どれを選ぶのがその作者やその主人公の気持ちをピッタリ表現できるかを熟考して、選ばなければならない。これが本当に難しい。こういう作業は、まだまだ今の段階では、AIにはできないということだろう。
無料版との比較
では、先にも少し触れたが、ここで、無料版のGPT-3.5と有料版のGPT-4の違いを検討するため、上記の同じ文章をGPT-3.5でも同じことをやってみた。
(GPT3.5 英訳2)“I was in a situation where it was okay to stay in Kamakura or go back home, as there were still many days before school started. So, I decided to stay at my original lodging for a while. My friend was the son of a wealthy Chinese businessman and was a man who was not short of money. However, since school is school and age is age, our standard of living was not much different. Therefore, when I became alone, I didn’t bother to look for another suitable lodging.”
(Google 上記の邦訳2)学校が始まるまではまだ日数があるので、鎌倉にいてもいいし、帰ってもいいという状況でした。 そこで、元の宿にしばらく滞在することにした。 私の友人は裕福な中国人実業家の息子で、お金には困らない人でした。 しかし、学校は学校、年齢は年齢なので、生活水準はそれほど変わりませんでした。 そのため、一人になったときは、わざわざ別の適当な宿を探すことはしませんでした。
先にも述べたように、”I was in a situation where it was okay to stay in Kamakura or go back home”(鎌倉にいてもいいし、帰ってもいいという状況でした)というこちらの訳は、原文にも近いし、あっさりさが表現されていて好感が持てる箇所だ。
問題点
GPT-4.0と同様、中国を中国地方のことだとは理解できていない。また、botherを使っている点も問題だ。さらに加えて、油断すると、一見見逃してしまいそうな部分があった。
school is school and age is age,
これでは、英語ではさっぱり意味がわからない。完全な日本語からの直訳だ。確かに原文にはそう書いてある。しかし、これをもっとわかりやすい日本語に直すと、
- 学校が学校→学校も同じレベル
- 年が年なので→年も同じくらい→まだ若い
という意味であり、生活水準の話をしているのだ。GPT-4.0では、そこをうまく訳している。
(GPT-4.0の訳)given the nature of our school and our age, our lifestyles were not much different(学校の性質や年齢を考えると、私たちの生活スタイルはそれほど変わりませんでした)。
(正式な英訳)being a young student, his standard of living was much the same as my own(若い学生だったので、彼の生活水準は私とほぼ同じでした)。
GPT-3.5では、良い点もあったが、この部分においては、致命的な間違いを犯してしまった。元々の日本語が、明治時代の日本語ということもあり、解釈が難しかったのかもしれない。
別記事の検証では、「3.5と4.0は、翻訳に限って言うと、どっちが優秀というよりも、二つの違うシステムと解釈した方がいい」との提言をし、確かにそういう面も実際には観察される。しかし、こういう致命的な間違いを起こされてしまうと、GPT-3.5では、使用する際に、より強い不安を残すシステムという印象を持たざるを得ない。
ここでは、明治時代の文学作品の英訳という、多分、AIがもっとも苦手とする分野をさせているような気がするので、多少ハンデを考えてあげないといけないのかもしれない。確かに、GPT-3.5は、簡単な訳であれば、十分に機能すると思う。しかし、GPT-4.0同様、まだまだ、誰かのチェックなしに、そのまま使えるツールにはなっていない。
AIを使った翻訳には、2つの言語に精通した人のサポートが不可欠
確かに、他の自動翻訳・機械翻訳のサービスのレベルと比べると、かなり進化していたことは事実だ。しかし、英訳として出てきた結果をそのまま使えるかと言うと、そうではない。誰か、2つの言語に精通した人にチェックしてもらわないといけないのが難点だ。AIが人の仕事を奪うかもしれない、と恐怖に慄く人もすでにいると思うが、まだまだそういう段階ではない。現段階では、プロの翻訳家の仕事を楽にしてくれるツールではあるが、翻訳家の仕事を奪うには、まだまだ時間がかかるだろう。逆に、AIを使わない翻訳家は、使っている人と比べると、使っていない人は、ハンデを追う可能性がある。AIを使った方が、はるかに早く仕上げることができるからだ。
早さが一番の長所
早さについては、人間は、AIには敵わない。あっという間に作業が終わってしまう。でも、正確さがない。だから、下訳としては、十分に使える。その特徴を活かして、さらに、編集作業を何回も繰り返したり、人間のその言語のネイティブスピーカーにチェックしてもらったりすれば、十分品質が高い作品が、従来より早く仕上げることができるだろう。校正作業、編集作業は、いずれにしても、どうしても避けられない作業行程なので、その時間短縮につながるAIの活用は、十分に利益をもたらすはずだ。要は、素晴らしい道具ができたので、それを使いこなす知恵が必要ということだ。
AIは人の仕事を奪うのか?
前回と今回の検証を通して感じたのは、AIに英訳をさせるためには、人との共同作業が欠かせないということだ。このことを突き詰めていくと、必要なツールではなるが、使い方次第で、仕事を奪うまでにはならないかもしれないということだ。確かに、初歩的な翻訳だけをしている人にとっては脅威かもしれない。しかし、少し複雑な文章や、そこの文化や習慣の特性が強く現れているものなどに対しては、まだまだ人の力が必要だ。
ということは、分野によって成果の差が生まれるということでもある。特に、文学作品の英訳は、まだまだ難しいところがあると思う。一方で、アカデミックな論文などには、適用できると思う。実際、それ専用の「和英翻訳GPT」なるプラグインサービスがあり、これはそれ専用だ。元々、この分野の翻訳は、専門知識が必要であり、人材が不足している分野であるので、人材不足を補うという点では、便利なツールであり、恐れる必要はないのかもしれない。
AI翻訳の未来
直訳すぎる問題
今後の課題としては、どうしても部分部分を訳す直訳からは抜けきれていない、その点をどう克服するか、が挙げられる。機械翻訳というのは、その性質上、部分の翻訳しかできず、それをつなぎ合わせているだけなので、どうしても変な文章が生まれてしまう。まだ、全体の文脈や、著者の意図、文化背景などを総合的に考慮するという機能がない。だから、その点を人間が補ってやらなくてはいけない。特に、日本語においては、分かりきった内容は省略するという文法上のルールがある。目に見える形で言い表されていない部分は、機械には理解できない。機械翻訳を利用する際には、そこを補って行く作業が必要になる。
文化・習慣・エッセンスをどう伝えるか
さらに、全体を通して「筆者が何を一番伝えたいのか」という作品のコアの部分、エッセンスを考えることは、翻訳においてもっとも重要な部分である。感動とは、一番伝えたいメッセージを中心にしてストーリーが展開されていくことで生まれるのだ。
加えて、文化的背景、その人や地域の慣習なども考慮しなければ、本当の翻訳は生まれない。日本的な抒情性を醸し出している日本独自の言い回しや表現がある。しかし、そういうところは、往々にして、海外の人にとっては、日本文化や地理が分からないと理解不能だったりする。だから、実際の英訳本では、注釈という形で、文化や習慣の解説がされる場合が多い。日本文化の細かい説明をストーリーとは少し離れたところで試みて、英語圏の読者に理解を求めている。そんな注釈の部分も、今後、AIがやってくれるなら素晴らしいとは思うが、果たして可能なのだろうか。
このように、具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろうし。その結果、将来、きっとAIはそれらを学習し、苦手な分野を乗り越えていくだろう。しかし、それはあくまでも共同作業を前提とするものであって、翻訳の仕事を完全に奪い去るものではないと思う。例え、翻訳ロボットが生まれて、全部代わりにやってくれるとしても、その使い方を教えたり、それを上手に使いこなして、さらに上のレベルの仕事をこなしたり、より創造的な仕事を創出したりすれば、AIを恐れることはないと思う。AIと人間がお互いに役割を決めて、助け合っていくこと、共存を目指すべきではないだろうか。だが、そのためには、私たちも、常にスキルを学び、向上心を持って進まなければならないと思う。
🔸英訳でChatGPTを活用するにはプロンプト(指示)のやり方を工夫しないといけない
ChatGPTが翻訳もできるようになった。その実力は英訳に限って言うと、現時点では、まだまだそのままでは使えない。2つの言語に精通する人がチェックする必要がある。具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろう。
🔸ChatGPTを使ってスピーチを作ってみよう!
ChatGPTが翻訳もできるようになった。その実力は英訳に限って言うと、現時点では、まだまだそのままでは使えない。2つの言語に精通する人がチェックする必要がある。具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろう。
🔸「直訳の問題点」について詳しい記事はこちら
ChatGPTが翻訳もできるようになった。その実力は英訳に限って言うと、現時点では、まだまだそのままでは使えない。2つの言語に精通する人がチェックする必要がある。具体的にどこが問題なのかを浮き彫りにすれば、AIがどこをどう学習すれば分かるので、これからもこういう分析は必要だろう。
🔸 「言わぬが花」から生まれる誤解の問題はこちらに詳しい