山田昇司
連載 第3回【完】
6.翻訳ソフトの「前文参照機能」
翻訳ソフトの英訳についてもう少し考察を続ける。新井(ibid.:pp.145-146)の誤訳例を踏まえていくつかの思考実験を行ってみた。
新井 p.145
入力 私は先週、山口と広島に行った。
出力 I went to Yamaguchi and Hiroshima last week. (グーグル:2018年)
思考実験 (1)
入力 私は先週、山口と広島に行った。
出力 I went to Yamaguchi and Hiroshima last week. (グーグル)
I went to Yamaguchi and Hiroshima last week. (みらい)
I went to Yamaguchi and Hiroshima last week. (DeepL)
今回の「グーグル」でも新井(ibid.)が試した2年前と同じ出力が確認された。他の2つのソフトでも全く同じ英訳が出力された。「山口」が地名として翻訳されていることが分かる。
思考実験 (2)
入力 山口は私の親友です。私は先週、山口と広島に行った。
出力 Yamaguchi is my best friend. I went to Yamaguchi and Hiroshima
last week.(グーグル)
Yamaguchi is my best friend. I went to Yamaguchi and Hiroshima
last week. (みらい)
Yamaguchi is my best friend. I went to Hiroshima with Yamaguchi
last week.(DeepL)
「グーグル」と「みらい」は前文をつけても、後文は実験(1)と全く同じであった。一方で「DeepL」は「山口」を人名として訳出している。前文の意味を参照している可能性が高い。
思考実験 (3)
入力 私は先週、山口と広島に行った。彼は私の親友です。
出力 I went to Yamaguchi and Hiroshima last week. He is my best
friend.(グーグル)
I went to Yamaguchi and Hiroshima last week. He is my best
friend.(みらい)
I went to Yamaguchi and Hiroshima last week. He’s a good friend
of mine.(DeepL)
この実験は翻訳ソフトが後文を参照しているかどうかをみるものであるが、前文を参照していた「DeepL」も後文は参照していないことがわかる。
思考実験 (4)
入力 私は先週、親友の山口と広島に行った。
出力 Last week I went to my best friend Yamaguchi and Hiroshima.
(グーグル)
I went to Hiroshima with my best friend Yamaguchi last week.
(みらい)
I went to Hiroshima last week with my good friend Yamaguchi.
(DeepL)
「みらい」「DeepL」は「親友の山口」を正しく認識しているが、「グーグル」は地名としてとらえて誤った英訳を出力している。
思考実験 (5)
入力 私は先週、親友の太郎と広島へ行った。
出力 Last week I went to Hiroshima with my best friend Taro.
(グーグル)
I went to Hiroshima with my best friend Taro last week.
(みらい)
I went to Hiroshima last week with my best friend Taro.
(DeepL)
「山口」を「太郎」に替えると全てのソフトが正しく英訳できる。「太郎」はどの翻訳ソフトの参照データーでも人名として出てくることが多いからであろう。
新井 p.145
入力 私は先週、山際と広島へ行った。
出力 I went to Yamagiwa and Hiroshima last week.
(グーグル:2018年)
思考実験 (6)
入力 私は先週、山際と広島へ行った。
出力 I went to Yamagiwa and Hiroshima last week. (グーグル)
I went to the mountains and Hiroshima last week. (みらい)
I went to Hiroshima with Yamagai last week. (DeepL)
「みらい」はYamagiwaが大文字で始まっているにもかかわらず人名とは認識していない。また「DeepL」は他の2つのソフトとは異なり「山際」を人名としてとらえているが、その漢字の読み方を間違えている。
以上の一連の実験から「DeepL」は前文の情報も読み込んでいる可能性が高いことや「山際」を人名と解していることがわかった。
そこで、今度は「DeepL」の「前文参照機能」に的を絞って、このソフトに本当にこの機能があるかを他の例文を用いて調べてみる。手始めに第4節で引用した例文で試してみることにする。
以下に示すように、半年前は「みらい」「グーグル」とも第2文の主語はheになっていた。あきらかに「前文参照」は行われていない。
半年前の結果
入力 一年間さらに厳しい授業に耐え抜いた私は絶対に受かると思っていた。
しかし合格点にわずか1点届かず不合格になってしまった。
出力 After enduring a year of tougher classes, I was sure I would pass.
However, he failed because he failed to get a passing score.
(みらい)
After a year of more difficult classes, I thought I would definitely
take it.
However, only one point was not reached to the passing score and
he was rejected. (グーグル)
思考実験 (7)
入力 一年間さらに厳しい授業に耐え抜いた私は絶対に受かると思っていた。
しかし合格点にわずか1点届かず不合格になってしまった。
出力 I endured a year of more rigorous classes, and I was sure I could
pass the test. But I was only one point shy of passing the exam,
and I failed. (DeepL)
「DeepL」は今度も第2文の主語は前文と同じ主語Iとなっていて前文の人称を引き継いでいる。
次に、他の二つのソフトも、念のために、再び試してみる。前回の出力から6ヶ月が経っていて進化している可能性があるからだ。
I thought I would pass the exam because I had endured a harder class for a year. However, he failed to pass the examination by only one point. (みらい)
Having withstood a tougher class for a year, I thought I would definitely take it. However, I didn’t reach the passing score, and I failed. (グーグル)
「みらい」は相変わらず間違えているが、「グーグル」の方は前文の人称に合わせて主語がIになっている。こちらは参照データーが単に増えただけでなくその中身に質的な変化もあったのだろう。
次の実験では、これまでの入力文の「私」を「彼」、「花子」に入れ替えて出力してみる。
思考実験 (8)
入力 一年間さらに厳しい授業に耐え抜いた彼は絶対に受かると思っていた。
しかし合格点にわずか1点届かず不合格になってしまった。
出力 After enduring a year of even more rigorous classes, he was sure
he would pass. However, he failed the test, falling just one point
short of the required score. (DeepL)
Having endured even tougher lessons for a year, he thought he
would definitely pass. However, I didn’t reach the passing score,
and I failed.(グーグル)
He endured an even tougher class for a year and thought he would
pass. However, he failed to pass the examination by only one
point. (みらい)
今度は「DeepL」「みらい」が人称を引き継ぎ、「グーグル」は人称の引き継ぎがなかった。
次は「花子」で実験してみよう。
思考実験 (9)
入力 一年間さらに厳しい授業に耐え抜いた花子は絶対に受かると思ってい
た。しかし合格点にわずか1点届かず不合格になってしまった。
出力 After enduring a year of even more rigorous classes, Hanako is
sure she’ll pass the exam, but she’s only one point shy of passing.
(However, she failed the test, falling just one point short of the
required score.)(DeepL)
Hanako endured an even tougher class for a year and thought she
would pass. However, he failed to pass the examination by only
one point.(みらい)
I thought that Hanako who could endure a tougher class for a year
would definitely take it. However, I didn’t reach the passing score,
and I failed.(グーグル)
「みらい」と「グーグル」では、今回は人称の引き継ぎを行われなかった。一方で「DeepL」は今回も前文からの引き継ぎをおこなっている。安定して人称の引き継ぎを行えるのは翻訳のしくみとして「前文参照」を行っていると考えてもいいのではなかろうか。なお今回はじめて「DeepL」において、第2文の英訳が2つ提示された。
最後の思考実験として、もう一度、別の英文を用いて3つのソフトを試してみる。これは、日本文ではよくあるが、一人称の主語が全く書かれていない文である。実験に先立って、半年前に行った掲示板投稿における2つのソフトの出力例を示す。
半年前の結果
入力 スーパーで人が倒れた時はこのような経験は初めてだったことから気が
動転して何もすることができなかった。だがこの時はすぐ駆け付けて声
をかけ、救急車を呼ぶことができた。
出力 When someone fell down in the supermarket, I was so upset that I
couldn’t do anything. However, he was able to rush to the scene
and call an ambulance.(みらい)
I was upset and couldn’t do anything when I fell in a supermarket
because this was my first experience. However, at this time, he
rushed and called out to call an ambulance. (グーグル)
思考実験 (10)
入力 スーパーで人が倒れた時はこのような経験は初めてだったことから気が
動転して何もすることができなかった。だがこの時はすぐ駆け付けて声
をかけ、救急車を呼ぶことができた。
出力 When the person collapsed in the supermarket, I was too upset to
do anything because I had never experienced anything like this
before. But in this case, I was able to rush to the scene, call out to
him and call an ambulance.(DeepL)
When someone collapsed in a supermarket, I was so upset that I
couldn’t do anything. But he was able to rush in and call for an
ambulance. (みらい)
When a person fell down at a supermarket, I was so upset that I
couldn’t do anything because this was my first experience.
However, at this time, I could rush to call out and call an
ambulance. (グーグル)
今回の「みらい」の出力は6ヶ月前のものとほぼ同じである。同じ人称誤訳が起きていることからおそらく「前文参照機能」はないと思われる。一方で「DeepL」は今回も安定して人称を揃えていることから「前文参照」のしくみがあるのはほぼ間違いないだろう。なお、今回の「グーグル」の出力は正確であるが、これまでの実験の結果も併せて考えると、単に「主語明示なし→主語I」というデーターが圧倒的にたくさん蓄積されていたと推測される。
ここまでで翻訳ソフトの「英訳」に関する検討を終える。なお、ここでひとつ付言しておくと、その機能を検討した翻訳ソフトはいずれも無料で使えるものである。有償のものにはより高度な機能が備わっているかもしれない。
さて翻訳ソフトの「英訳」に関する考察の次は「和訳」をする場合の検討に入ることにする。
7.翻訳ソフトが苦手な「分配よみ」
第2節で私は翻訳ソフトの「和訳」について次のように書いた。「おもしろそうな英文が見つかるとそれをソフトに入れるのだが、たちどころに翻訳が出てくる。それで大意は理解できる。もちろん意味が通らない日本語がいくつか出てくることもあるので英文にもどって確認するのだが、いずれにしても大量の英文がすばやく読めて情報が手に入る」。しかし私自身は出力された和訳が「どんなふうに意味が通らないのか」について、まだきちんと整理して詳しい分析をするには至っていない。そこでここでは1年生の遠隔授業で紹介した誤訳の事例を紹介するにとどめる。
1年生のみなさんは第11回講義の最後に出された課題を覚えていると思う。ある英文を3つのソフトにかけてその和訳を比較し、いちばん優れたものを選ぶという課題だった。
———————————————————————————————————–
第11回講義 課題の提示
video script に出て来た、女性ジャーナリストの言葉を三つの翻訳ソフトにかけて、どれがいちばん優れているかを検討しなさい。
New Year’s Eve, with the London Eye as the backdrop, still continues to draw media coverage from around the world and, of course, the huge crowds.
第12回講義 解答と解説
(1) ロンドン・アイを背景にした大晦日は、今もなお世界中のメディアの取材を受け、もちろん大群衆が押し寄せています。(DeepL) △
(2) ロンドンアイを背景にした大晦日は、世界中から、そしてもちろん、大勢の群衆からのメディア報道を引き寄せ続けています。(グーグル)×
(3) ロンドン・アイを背景にした大晦日は、世界中のメディアや、もちろん、大勢の人々の注目を集め続けている。(みらい) ○
New Year’s Eve, with the London Eye as the backdrop, still continues to draw media coverage from around the world and, of course, the huge crowds.
文全体の動詞はcontinuesですので、その前部が「主語」、後部が「目的語」となります。その目的語に注目すると、その中の動詞draw(引き寄せる)の目的語が2つあります。だから、「メディアの取材 (O1) と 巨大な群衆 (O2) を引き寄せる」となっていないと正しい和訳とは言えません。そうなると、(3) が最も優れた和訳となります。(2)は明らかな誤訳。(1) は「やや意訳」と言えます。
———————————————————————————————————–
私は第5節で「翻訳ソフトは確かに便利な道具であるが、ときおり出てくる誤訳を見破る日本語力と英語力が必要である」と述べたが、上記の文はまさにその英語力が問われる実例と言えるだろう。英訳のときに「埋め込み文における主語の省略」がひとつの関門だったように、和訳においては、今後のさらなる検証が必要だが、現時点では「分配よみ」が苦手ではないかと私は考えている。
ただ、最近わたしが翻訳ソフトを活用して取り組んだ和訳においては、文構造の問題よりもむしろ背景知識の欠如がより大きな障壁になっているような気がしている。この件については稿を改めて別の機会に論じたい。翻訳ソフトの英文がどのように修正されて日本語として自然で読みやすい文に変わっていくのか――その過程を検証する中で翻訳ソフトの問題点が明らかになってくると思う。
最後に私たちの研究所が運営している『翻訳NEWS』のサイトについて紹介しておきたい。
まず、どんなふうに翻訳ができあがるかを説明すると、まず所長の寺島隆吉先生が定期的に興味深い記事のリンクをいくつか紹介する。するとその中から翻訳スタッフが自分のやりたい記事を立候補で選んで下訳する。このとき翻訳ソフトを活用する。この下訳(第1次原稿)を他のメンバーが点検して編集長へ送り、最終点検を経てアップロードされる。
このサイトを覗いてもらえば分かるが、どの記事もおそらくは皆さんが見たことも聞いたこともない情報ばかりだと思う。私自身もいつも「え、本当なの!?」といつも驚かされている。テレビや新聞で得られる内容と比較・検討すると、物事を批判的に、かつ多面的・複眼的にとらえられるようになる。このサイトには現在、数十個の翻訳が掲載されているが、以下には「コロナ禍」の関連記事を3つだけ紹介する。(2020/11/11)
COVID-19対策マスクは人道に対する犯罪であり、子ども虐待である ―― あるウイルス学者の証言 http://tmmethod.blog.fc2.com/blog-entry-432.html
「ヨーロッパの都市封鎖措置はコロナそのものよりも多くの人を死に追いやる」――ドイツの大臣が警告 http://tmmethod.blog.fc2.com/blog-category-62.html
イタリアの国会議員はビル・ゲイツを「人道に対する罪」で調査するよう要求している ――そして、その理由は? http://tmmethod.blog.fc2.com/blog-entry-322.html
<参考文献> 新井紀子(2018)『AI vs. 教科書が読めない子どもたち』(東洋経済新聞社)
最近のコメント