オープンAIが新型の生成人工知能システムChatGPT(チャットジーピーティー)4O(オムニバス)が2024年5月に発表された。何がすごいのか? それは同時通訳ができることにある。しかし、果たしてそのクオリティはどうなのか?
人間が使う自然な言葉を使って指示して、管理できるAI(人工知能)チャットサービスの一つであるChat Gptだが、Googleがバックについたクロード3などのライバルが出てきて、相当苦戦しているようだった。そんな中で発表されたこの新型サービスは、一度取られた顧客を奪い返す目論見があるようだ。この記事ではそんな経済戦争的な裏話はさておいて、翻訳機能のクオリティを中心に語りたい。
当ブログでは以前、Chat GPTの翻訳能力、特に、日本語から英語(英訳)への機能についてその性能を検証した。今までは、独自のコンピュータ言語でしか動かなかった人工知能システムが、誰でも自由に、人間の文章を使って操作できるようになり、ディープラーニングで学習した知識の利用がとても身近になった。中でも翻訳機能(英訳)については、まだまだ問題がありながらも、下訳としては、十分に機能することを確認した。
最新版のChat GPT-4o(オムニバス)は、 同時通訳として使えそうな便利なツールだ。しかし、確かにGpt4と比べるとクオリティは確実に上がっているが、まだまだ完璧とは言い難い。だが、そのクセを理解し、リスクを把握していれば、非常に便利なツールとして活躍してくれるだろう。
GPT-4o(オムニバス)とは?
GPT-4o(オムニバス)とは、どんなサービスなのかを、GPT-4o(オムニバス)自身に聞いてみた。
OpenAIのGPT-4技術をベースにした高度な言語モデルで、複数のタスクや機能を統合した形態を指します。これは、特定の目的に特化した単一のモデルではなく、多岐にわたるアプリケーションやシナリオに対応するために設計された汎用的なAIシステムです。以下に、GPT-4oの主な特徴を説明します。
1. 多機能性:GPT-4 オムニバスは、さまざまなタスクを一つのモデルで処理できるように設計されています。これには、テキスト生成、翻訳、質問応答、要約、対話などが含まれます。
2. 高度なトレーニングデータ:GPT-4 オムニバスは、インターネット上の幅広いデータソースを用いてトレーニングされており、専門的な知識から一般的な情報までをカバーしています。このトレーニングにより、多様なテーマや状況に適応する能力を持っています。
3. 柔軟な応用:このモデルは、多種多様なアプリケーションに適応可能です。例えば、カスタマーサポートの自動化、クリエイティブなライティング、教育ツール、データ解析、プログラミング支援など、多岐にわたる分野で利用されています。
4. 連続した学習:GPT-4 オムニバスは、継続的に学習し、更新されることで、新しい情報やトレンドにも対応できます。これにより、最新の情報を基にした適切な応答や提案が可能です。
5. ユーザー体験の強化:多機能なGPT-4 オムニバスは、ユーザーの多様なニーズに対応することで、より包括的でカスタマイズされた体験を提供します。個々の要求に応じたパーソナライズドな対応が可能です。
6. 倫理的配慮:強力なAI技術であるため、GPT-4 オムニバスの開発と利用には倫理的な配慮が重要です。OpenAIは、誤情報の拡散を防ぎ、偏見を最小限に抑えるための対策を講じています。
要約すると、GPT-4 オムニバスは、広範なタスクに対応できる多機能なAIシステムであり、ユーザーに高度なサポートと柔軟な応用可能性を提供する一方で、倫理的な配慮も重視されています。
私見だが、一般的なユーザーにとって、一番の進化は、同時通訳が可能になったことだと思う。これは、パソコンではなく、スマートフォンにアプリをダウンロードして、スマホの音声機能を使わないと同時通訳にはならない。詳しい設定などは、ネットを色々検索すると出てくるので、そちらにお任せしたい。
私自身が使ってみて思うことは、翻訳に少し時間がかかるので待たないといけない。この待つ時間が会議通訳には、ちょっと障害になり、まだまだ人間の同時通訳者に頼らないといけないだろう。だが、これはきっと時間が経ち、テクノロジーが進化するにつれて、解決される問題だと思う。
肝心のクオリティだが、ほぼほぼ正確に訳してくれる。では、いよいよ、具体的にどの程度信頼できるのかを次に検証していこう。
過去のChat GPT4を使った英訳のクオリティの記事はこちらから↓:
クオリティチェック! 漱石の「こころ」を英訳(1)!
では、早速GPT4オムニバスに以下の夏目漱石の「こころ」に出てくる冒頭場面を訳してもらおう。この作品は、世界的にも有名なので、すでに英語版がいろんな翻訳者によって3種類ほど出版されているので、この実験には、うってつけだ。実際に人間が行った英訳と人工知能が行った英訳とを比較して、その精度などを検討したい。ちなみに正式な英語版に
まずは、原文をChatGPT4o(オムニバス)にかけ、その成果を示し、その英訳がどの程度正確に訳されているかを検証するため、Google翻訳を使って英訳結果を再邦訳してみた。上記でも軽く触れたが、Google翻訳に関しては、多少の問題はあるものの、邦訳については、案外しっかり訳してくれるので、一つの目安にはできる。もし、Google 翻訳に問題が発生したら、その都度指摘していく。
最後に、正式な英文を掲載し、英訳と比較。改善点・問題点を指摘する。問題点は太字で示した。正式訳の青字部分は、生成AIと人間の訳の顕著な違いなので、最後の章で解説する。
(原文1)私が先生と知り合いになったのは鎌倉である。 その時私はまだ若々しい書生であった。 暑中休暇を利用して海水浴に行った友達からぜひ来いという端書を受け取ったので、 私は多少の金を工面して、 出掛ける 事にした。 私は金の工面に 二、三日を 費やした。 ところが 私が 鎌倉に着いて 三日と経たないうちに、 私を呼び寄せた友達は、急に国元から帰れという電報を受け取った。 電報には母が病気だからと断ってあったけれども友達はそれを信じなかった。 友達はかねてから国元にいる親たちに勧まない結婚を強いられていた。
(オムニバス英訳1−1)“I met Sensei in Kamakura. At that time, I was still a young student. I received a postcard from a friend who had gone swimming during the summer vacation, urging me to come, so I managed to scrape together some money and decided to go. It took me two or three days to gather the money. However, less than three days after I arrived in Kamakura, the friend who had called me there received a sudden telegram from home telling him to return immediately. The telegram said that his mother was ill, but my friend did not believe it. He had long been pressured by his parents back home to marry someone he did not want to marry.“
(オムニバス英訳の邦訳1−1) 私は鎌倉で先生に会いました。 当時、私はまだ若い学生でした。 夏休みに海水浴に行った友人から「ぜひ来てください」というはがきが届いたので、お金をかき集めて行くことにしました。 お金を集めるのに2、3日かかりました。 ところが、私が鎌倉に到着してから三日も経たないうちに、私を呼び寄せた友人の自宅から、すぐに帰るようにとの突然の電報が届きました。 電報には母親が病気だと書かれていたが、友人はそれを信じなかった。 彼は長い間、故郷の両親から、結婚したくない相手と結婚するよう圧力をかけられていたのです。
(正式な英訳1)It was at Kamakura, during the summer holidays, that I first met Sensei. I was then a very young student. I went there at the insistence of a friend of mine, who had gone to Kamakura to swim. We were not together for long. It had taken me a few days to get together enough money to cover the necessary expenses, and it was only three days after my arrival that my friend received a telegram from home demanding his return. His mother, the telegram explained, was ill. My friend, however, did not believe this. For some time his parents had been trying to persuade him, much against his will, to marry a certain girl.
解説
(1)Sensei ⭕️:
「先生」を、以前GPT4は、Teacherと訳していたが、Senseiに改善されている。これは後述に改善点で述べようと思ったが、読者の中には、日本語がそのまま残っていることに対して違和感を覚える方もいるかもしれないと思い、ここに解説させていただきたい。英語での teacherと日本語での「先生」は同じではない。英語のTeacherは学校の教師(主に高校まで)を指す言葉であるが、日本語の「先生」は必ずしも学校の教師でなくてもよく、尊敬する人に対して使える言葉だ。「こころ」の場合も学校の先生ではないので、やはりSenseiが適切だ。このような文化背景の理解は、まだまだAIにはできないと思っていたが、以前の記事で予測した通り、人工知能には訓練が可能なので、できるようになった。
(2)「多少の金を工面して」△
単語(scrape) の選択に問題あり
この日本語に対する英訳が、ChatGPTでは、managed to scrape together some money…(何とかお金をかき集めました)となっているが、scrapeという訳は、「工面して」の漢字のニュアンスを訳してしまっていて、職人が何かを作るようなイメージを抱いてしまうし、すごく努力してお金を集めているような印象を受けてしまう。
I finally scraped together enough money for a flight home. (やっと帰りの飛行機代を捻出するのに十分なお金が集まった)
という言い方はあるが、ネイティブスピーカーは、「ちょっとお金を集める」のに「scrape」という単語を使わないだろう。そもそも最近は「お金を工面する」という言い回しをあまりしなくなったので、人工知能が対応に困ったのかもしれない。一方で原文では、あっさりと「多少の金を工面して」という日本語を使っていて、この場面では、そんなことはあまり注目される必要なく、物語をどんどん先に進めたいところだ。そういう全体の流れを考慮したいところだが、オムニバスの英訳は、原文に忠実に訳そうと試みていて、英文全体を読んだ時に、ここで多少つまづいたような感じになってしまう。
では、正式な訳はどうなっているかというと、to get together enough money to cover the necessary expenses(必要な費用をカバーするのに十分なお金を集めるため) と英語圏社会の日常でよく耳にする表現に置き換えられていて、非常にあっさりとした印象を与える。ここは流石に人間でないとわからないニュアンスだと思う。さらに、次の文章をカンマで切って、続け様に並べていることで、物語の次への展開を急がせている。
(3)「勧まない結婚を強いられていた」△
オムニバス ”He had long been pressured by his parents back home to marry someone he did not want to marry.“(彼は故郷の両親から、結婚したくない相手と結婚するよう長い間圧力をかけられていた。)
とのオムニバスの訳だが、いくつかの複数の問題がここでは絡み合っている。
正式な訳:his parents had been trying to persuade him, much against his will, to marry a certain girl(彼の両親は、彼の意志に反して、ある少女と結婚するよう彼を説得しようとしていた).
と比べて検討してみよう。
日本語訳だけを、単純に比べてみると、オムニバスの訳の方が原文に忠実のように見える。しかし、次のような問題点がある。
a. Pressure(圧力をかける)
この単語は、かなり強く、誰かに何かをさせるために、脅迫、侮辱などありとあらゆる手段を使って強制させるイメージだ。一方で、正式な訳では、persuade(説得する)を使っている。人の考えを変えるために使用する単語だが、常に成功するとは限らない。原文では、この友達は断る気持ちの方が強いのが文脈から読み取れるので、ここはやはり、persuadeを使うのが友達の気持ちを正確に表しているので、正解となる。
b. 主語を誰にするか?
- ChatGPT4オムニバスでは、友達(彼)が主語になり、受動態が使われる。
- 正式な訳では、彼の両親が主語。
確かに、原文に忠実なのはオムニバスだ。しかし、ここでは、直訳的な変な流れになってしまっている。変な流れというのは、まず、彼を主語に使ったために、受動態を使うことになったこと。受動態は英語においてはあまり使われない(だから無生物主語などが英語では存在したり、他動詞が多用されたりする)。でも、正式な訳では、彼の両親を主語にすることで、より両親が彼にとってウザい存在であることが強調されるので、「なぜ母が病気だということを彼が信じなかったのか」がよく分かるようになる。
日本語では、主語は大抵人物であることが多いので、どうしても訳す時に受け身にしてしまう。それが英語らしくない翻訳と言われてしまう一つの原因なのだ。ここは、正式な訳に見られるように、両親を主語にすると、英語としてしっくりくるのだ。
書かれていないところを訳せるのが人間
日本語では、特に、その文化的背景や言語の性質上、言外の部分が多く、行間を読んだり、空気を読むことが求められる場合が多々ある。しかし、機械は、書かれた部分しか訳せない。
人間とAIとの違い
We were not together for long. (私たちはしばらく会っていなかった。)
正式な英訳では、この部分が付け加えられている。日本語を読んでいると、日本人であれば、日本の習慣が頭に入っているので、こんなことは当たり前なので、特に言わなくても文脈の中から察することができる。しかし、英語圏では、いろんな文化が混在するので、暗黙の了解をさけ、全てを見える化した方が、物語を深く味わうことができるようになる。ここでは、久しぶりに会う友達だが、お互いよく知り合っていることをあえて言っておかないと、後々の文章がわかりにくくなる。だから、あえて、マクラレンはこの行間に表現された暗黙の了解を英語にした。
to get together enough money to cover the necessary expenses,(必要な費用を賄うのに十分なお金を集めるために)
この青字の部分も日本語には表現されていないが補足されたものだ。日本語では、こんなことは容易に想像されるので、普通は言葉として表現されない。しかし英語では、あえて言わないと、何のためにお金を集めるのか、モヤモヤしてしまう。それが、英語を話すときのルールなのだ。
AI(人工知能)は、こういう技ができない。訳すのは、あくまでも、書かれていることだけだ。書かれていないことを理解し、それを言葉にできるのは、今のところ、人間だけだ。機械は、書かれていないことは理解できない。
同時通訳する時には、こういうところによく注意しないといけないだろう。特に日本語を英訳する時に、同じ「大丈夫」でも、ニュアンスによっては「大丈夫じゃない」時がある。そういう言葉に表されない部分は、表現されないのだ。AIを使う時は、こういうところをあえて日本語で言葉にする努力が必要だろう。
オムニバスではどこが改善されたのか?
次に示すのは、以前の記事からGPT4の英訳とその邦訳だ。
(原文1)私が先生と知り合いになったのは鎌倉である。 その時私はまだ若々しい書生であった。 暑中休暇を利用して海水浴に行った友達からぜひ来いという端書を受け取ったので、 私は多少の金を工面して、 出掛ける 事にした。 私は金の工面に 二、三日を 費やした。 ところが 私が 鎌倉に着いて 三日と経たないうちに、 私を呼び寄せた友達は、急に国元から帰れという電報を受け取った。 電報には母が病気だからと断ってあったけれども友達はそれを信じなかった。 友達はかねてから国元にいる親たちに勧まない結婚を強いられていた。
(GPT4 英訳1−2)I first met the teacher in Kamakura. At that time, I was still a youthful student. Receiving a postcard from a friend who had gone to the beach for a summer vacation, urging me to come, I managed to scrape together a little money and decided to make the trip. It took me two or three days to arrange the funds. However, no sooner had I arrived in Kamakura than my friend, who had called me there, received a telegram ordering him to return home immediately. The telegram mentioned his mother was ill, but he didn’t believe it. He had long been pressured by his parents back home into an unwelcome marriage.
(GPT4英訳の邦訳1−2) 先生と初めてお会いしたのは鎌倉でした。当時、私はまだ若々しい学生でした。夏休みに海に行った友人から、ぜひ来てくださいというはがきを受け取り、何とかお金をかき集めました。資金の手配に二、三日かかりましたが、鎌倉に着くとすぐに、電話をかけてきた友人に、すぐに帰国するよう電報が届きました。 母親が病気だと話していましたが、彼はそれを信じませんでした。彼は故郷の両親から、歓迎されない結婚をするよう長い間圧力をかけられていました。
(オムニバス英訳1−1)“I met Sensei in Kamakura. At that time, I was still a young student. I received a postcard from a friend who had gone swimming during the summer vacation, urging me to come, so I managed to scrape together some money and decided to go. It took me two or three days to gather the money. However, less than three days after I arrived in Kamakura, the friend who had called me there received a sudden telegram from home telling him to return immediately. The telegram said that his mother was ill, but my friend did not believe it. He had long been pressured by his parents back home to marry someone he did not want to marry.“
(オムニバス英訳の邦訳1−1) 私は鎌倉で先生に会いました。 当時、私はまだ若い学生でした。 夏休みに海水浴に行った友人から「ぜひ来てください」というはがきが届いたので、お金をかき集めて行くことにしました。 お金を集めるのに2、3日かかりました。 ところが、私が鎌倉に到着してから三日も経たないうちに、私を呼び寄せた友人の自宅から、すぐに帰るようにとの突然の電報が届きました。 電報には母親が病気だと書かれていたが、友人はそれを信じなかった。 彼は長い間、故郷の両親から、結婚したくない相手と結婚するよう圧力をかけられていたのです。
改善された点
- 「先生」:GPT4では、teacherと訳されていたが、オムニバスではSenseiと改善された。
- 「多少の金を工面して」: to arrange the fundsとなっていたGPT4の英訳を取り除いている。
- 「私が 鎌倉に着いて 三日と経たないうちに」を 「no sooner had I arrived in Kamakura (鎌倉に着くとすぐに)」としてしまい、「3日」が「すぐに」と変わってしまっていたGPT4だったが、オムニバスでは、きちんと「less than three days」と英訳できている。
- 「勧まない結婚」:GPT4では、unwelcome marriage(歓迎されない結婚)と訳されていたが、これでは、一体誰にとって不都合なのかがよくわからなかった。しかし、オムニバスでは、to marry someone he did not want to marry と訂正されていて、クリアになった。ちなみに、正式な訳では、much against his will(彼の意志に反して), と友達(彼)が嫌っていることが明確になっているし、さらっと短くなっている。
改善されなかった点
- 多少の金を工面して: scrapeについては、改善されていない。
- 前述のpressure, 主語の問題については、ほとんど改善されてはいない。
オムニバスの手軽さは魅力。正式に使うには言語に精通した人のチェックが必要
以前のGPT4と比べると、オムニバスの翻訳クオリティは、かなり改善され、より正確に訳せるようになったことは評価して良いだろう。では、いざそれだけでそのまま使えるかと言うと、まだまだだ。誰か、プロか、2つの言語に精通した人にチェックしてもらわないといけない。現段階では、今までよりも、より通訳作業が身近にはなったが、まだまだ全幅の信頼をおける存在としては使えない。翻訳・通訳の仕事を楽にしてくれるツールではあるが、レベルの高いプロの仕事を奪うには、まだまだ時間がかかるだろう。
特に、ここで試したような夏目漱石に代表される文学作品の英訳・通訳には向かないだろう。
しかし、いちいち辞書を引くという面倒な作業をしなくても良い、という意味では、十分に使えるかもしれない。誤解が多少生じても構わないような通訳作業の代替としては、十分に機能するだろう。
だが、道具は使い様である。もし、人間のプロにチェックしてもらいながら使うのであれば、十分だろうし、さらに後日、正式な翻訳をプリントで配るなどの工夫をすれば、色々と用途も増えて、便利な道具として使えるかもしれない。要するに、そのリスクさえ把握して使いこなすことが大切だ、ということだ。前回の記事の結論と同じで、それを使いこなす知恵が必要ということだ。