今日は土曜日なので本来は過去記事を再掲するのだが、予定を変更して、機械翻訳について先ほどTwitterに連投したことをまとめておくことにしよう。
週明けの月曜日にしてもかまわないのだが、「鉄は熱いうちに打て」ということで。
この「鉄は熱いうちに打て」は格言で、英語では Strike the iron while it is[it's] hot. と言う……と私は習ったし、そのように暗記したが、最近は Strike while the iron is hot. とすることが多いようで、手元の辞書(『ジーニアス英和辞典 第5版』)でもそのようにエントリーされている(ironの項の用例を参照。p. 1131)。
この2つの言い方に関して、「なるほど、strikeという動詞が他動詞か自動詞かってことですね」……などという話を始めてしまうとまた終着点に行きつく前に当ブログ規定の4000字を使い切ってしまうので、涙を飲んでそこは無視して先に行く。うちにあるProverb辞典などを見る作業も、今はしない。
で、こういった、決まりきった表現の英語と日本語のペアというものは、機械翻訳にはあらかじめセットされている。ニューラル翻訳でも、もととなる対訳集の中にこういうのがある程度の量、含まれているだろうし、実際に、やたらと称揚されている例の機械翻訳エンジンに投げてみても、このような結果が得られる。
一方、もう一つのメジャーな機械翻訳に同じ日本語文を投げるとこうなる。
ここで、「この場合、strikeとhitは相互に入れ替えることができるのかどうか。いや、意味としては全然通るんだけど、成句として」みたいなことを掘り始めると、また道に迷って沼にまっしぐらということになって、本題にたどり着かなくなってしまうので、今は措いておく。いや、措いておかねばならぬのだ。措いておくぞ。俺は措くぜ。
ここでさくっとわかるのは、同じ機械翻訳(ニューラル翻訳)でも、DeepL翻訳とGoogle翻訳は中身が違うということで、例えば誰かが一方をほめていたとして、だからといって他方もほめているということにはならない。DeepLがうまく出力できることを、Googleが失敗する場合も多々あるし、その逆もあるだろうが、そのことは機械翻訳(ニューラル翻訳)全体の能力・性能の話というよりは、個別のエンジンの能力・性能の話である。
それでもなお、機械翻訳(ニューラル翻訳)全体のこととして、「昔に比べれば段違いで役に立つようになったね」ということがある。
特に、ある特定の分野で、以前全く使い物にならなかったものが、そこそこ使えるようになってきたという局面では、そこにいる人たちの間で「以前は全く使えなかった」という共通体験があるからよけいに「すごい、こんなに使えるようになっててえらい」という新規の体験の衝撃が刺さりまくることになるだろう。そのことは、分野の外からも十分に理解できるし、当然のことだし、むしろその喜びは分野の外でも共有されているということは強調しておきたい。
しかし、それでもなお、その「以前はダメだったが、今はそこそこ使えるようになってきた」ものが、「何にでも使える魔法の道具」的に諸手を挙げて無邪気に称揚されている(ようにしか見えない)のを見ると、うちらサイドからは「ちょっと待ってください」と言わざるをえない。それが良心だし、それが学問的誠実さというものであろう。そして、それは決して「新技術を認めないかたくなさ」「偏狭な心のあらわれ」などではない。ましてや「英語ができる自分の自慢」(最近の日本語表現でいう「英語マウント」)などでは全くない。
機械翻訳(ニューラル翻訳)がいかに使えるかという話題が頻繁にバズっているTwitterでは、私たち「英語屋」サイドがそれに対してネガティヴな内容の何かを述べたときに、そこが伝わる/伝わっているのかどうかが疑問であり不安なのだが、翻訳者や英語教育者など「英語の専門家」と呼ばれる立場にある人々が機械翻訳(ニューラル翻訳)に懐疑的な内容の発言、と言うより、もっと正確にいえば機械翻訳万能論(「機械翻訳があるんだから、もう人間の翻訳者はいらないし、英語を勉強する必要もない」みたいな流れ)に異議を申し立てる発言をするのは、単に「自分の仕事が危うくなるから」ではない。「それは本当に『翻訳』になっていますか」という問題があるからだ*1。
その具体的な例を、今日、英語講師の田中健一さんがTwitterに投稿していらした。
DeepLで論文を読むのは、同意できませんね。 pic.twitter.com/ts7V6mQDxg
— 田中健一/ある英語講師 (@TNK_KNCH) 2021年11月18日
【11月22日・追記】ブログへのツイートの埋め込みだと縦長の画像は切れて表示されてしまって肝心なところが見えないから、画像だけまた別に埋め込んでおく。
【追記ここまで】
田中さんには下記のご著書がある。中学校で習った範囲の理解と定着がイマイチ不安な高校生、また「英語が苦手」という自覚がある大学生、大学院生から社会人まで広くお勧めできる内容の、高校で習う範囲までをカバーした問題集で、知識の習得・定着を目的とした人が効率よく学習できるよう考えられている。2冊で1つのシリーズだが、「入門」の次に「基礎」に進むという使い方を前提としており、書店では「高校学参」のコーナーにある。
で、田中さんが投稿しておられる "I couldn't agree more." という英文は、この「基礎」の範囲には入っていないが、大学受験の文脈なら「難関校対策」の参考書・問題集の「基礎」(「ステップ1」など)に入る質(というか「レベル」)の英文であり、社会の中で第二言語・外国語としての英語を(どんな形ででも)使っていこうという人なら、「それ知らないのは、ちょっとやばくね?」というような基本的な事柄である。
だが、逆に言えば、本腰入れて英語を使う必要のない人にとっては「知らんかった」という事柄であるかもしれない。仮に習っていたとしてもわかりづらいから、試験のときには「捨てて」しまうような項目かもしれない。ちなみに私自身も高校のときはこの《can not + 比較級》がわからなくて泣いてたクチである。
以下、今日ツイートしたこと、特にこのスレッドの内容を書けばよいのだが(何ならツイートを貼り付けるだけでもいい。でもそうするとはてブで「読みにくい」と文句を言われて、それに☆をいっぱいつけられるという叩きにあうかもしれない)、どうにも言語野がおかしくなってしまったようで、日本語がうまく書けないので、しばらくお時間をください。丑三つ時くらいに書きあがると思います。
と、ここまで書いて、ああ、このエントリのタイトルが思いつかない……
さて、"I couldn't agree more." という英語を「同意できませんね」と出力する*2ような、自称「翻訳」エンジンは、「いれたてのおちゃ」を「入れた手のお茶」と変換する日本語変換システムと同じ程度に使える道具である。つまり:
便利ですが、結局その言語をちゃんと知らないといけないんですよね。
— Matsuoka Apollo (@MatsuokaApollo) 2021年11月18日
今回のこの例文についていえば:
"I couldn't agree more" を「同意できません」と出力するのは、お示しのような、いわば小手先の問題ではないのですよ……。(田中先生が示されている例の何がどの程度ダメなのかを理解できる英語運用力のない方は、このツールは使わない方がよいと思います。) https://t.co/UbvCrgeEPn
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
ここで私が参照している@OpenSolaris2010さんが示しておられるDeepLの画面には、「同意できませんね」という出力結果と並んで「私も同感です」という出力結果がある。これら2つは意味が完全に正反対だ。ということは、英語は度外視して日本語のこの文面だけでも、普通に考えれば、これらのうち1つは間違い(誤訳)であると結論できるだろう。では、どちらが誤訳なのか。それを判断することができるのは、この英文を正確に読む能力がある(つまり、文法や語法の知識がある)人だけである。
わかっただろうか。
Twitterなどで学者の皆さんが「すごい」「これがあれば英語が苦手でも英語論文が読める」「研究に不可欠」と口々に賞賛しているDeepLというツールは、基本的に、英語は読めるけれど、全部自分で読むのはかったるい、というような人が補助的に、なおかつ個人的に使うなら、まあ何とか使えるだろう、という程度のものだ。文構造にかかわる語順はそのままにしておいて、単語を置き換えれば基本的に何とかなるという言語間(例えば英語とフランス語)の翻訳においては、ずいぶん前からこういう質は実現されていた。それが、技術の進展と開発者の方々の努力にともない、日本語にも当てはまるようになった、ということだ。
だから、現在のニューラル翻訳は、それが実用化される前の英語から日本語への機械翻訳と比べれば、まさに雲泥の差といえるくらいの性能の差がある。その点は素直にすごいことだ。
しかしそれは、まるっきり音痴だった歌手が、トレーニングと経験を積んで何とか音程はとれるようになった、くらいのことで、その歌手が圧倒的歌唱力で人を感動させるようになったわけではない。努力はすばらしいが、それと結果、完成度とは別である。
機械翻訳(ニューラル翻訳)は便利なツールだし、実際、私も自分に読めない言語は機械翻訳を使って英語にして、個人的に、そこに何が書かれているのかを把握する、ということは日常的にしている。ガザ地区からのアラビア語のツイートを見て、「気持ちのよい晴れた一日、のんびりビーチで過ごしています」という内容の文面である、ということが確認できるのは、Twitterに内蔵されているGoogle翻訳のおかげだ。決してこの技術に対して敵対的・否定的なスタンスではない。
しかし、これはあくまでも補助的な道具にすぎず、それにすべてを任せるわけにはいかないのだ。
そして実際、今現在これについて「すばらしい」「不可欠」と称揚している方々も、私と同じように、補助的な道具としてしか使っていないはずなのだ。ただ、それをそう言わない(あるいはそのようにとらえていない)だけで。
「補助的な道具」というのはどういうことかというと:
論文読むのは基本的に斜め読みなのでDeepLで問題ないと思いますよ。もちろんこういう問題があることを認識した上で、ですが。
— あすとる (@astor330) 2021年11月20日
翻訳レベルで話をすればまだニンゲンが介在しないとやばいです。
そう。「斜め読み」である。
一口に「読む」といってもそれには程度・質がある。
例えば医学分野で新薬に関する研究論文を読むとして、「この論文は何を扱っていて、どういうプロセスで、どんな結論か」をざっくり把握するための「読み」(それが「斜め読み」である)と、投資判断をする資料としての「読み」は、質的に異なる。
自分たちがその論文で批判されている場合に、どう批判されているのかを正確に読み取るための「読み」もまた異なるし、どのように反論できるかといったことを検討するときの「読み」も違ってくるだろう。
そういった、質的に異なる「読み」があるときに、「斜め読み」になら使えるツールが、ほかの「読み」に使えるとは限らない。
「斜め読みと精読が違うなどということは当たり前だ、何を言わずもがななことを……」と思われるかもしれないが、Twitterはその前提(学問の場での前提)を共有していない多くの人々に開かれた場である。そこでは、自分たちの間で共有されている前提というものは存在しない。話者は「斜め読みをする」ことを「読む」と言っているかもしれないが、読者はそれを「精読する」ことだと受け取るかもしれない。
しかも、Twitterではほぼ誰も発言の文脈など見ない。140字に切り取られたかけらだけがすべてとなる。Twitterというのは、そのことへの配慮が必要な場である。「140字に入っていないことは、存在していない」という奇妙な世界だ。
だから、Twitterでの発言は、自分の意図通りに他者に読んでほしいのであれば、リアル世界でのそれと違い、しつこいほど前提を確認しなければならない。なおかつ140字という驚異的な短さで語る必要もある。正直無理ゲーだが、それでもそうするよう努めねばならない。そうしなければ発言はどんどん勝手な方向に行ってしまう。
また、「研究者がDeepLを使ってするのは斜め読み」ということについてさらに詳しく見て、「斜め読みできるのは、その分野についてしっかりした知識がある場合のみ」ということも強調しておくべきだろう。
研究者が学術論文を読むときは、扱われている事柄に関して読み手(研究者)自身に予備知識が十全に備わっているので、仮に肯定を否定として出力しているようなひどい例が部分的にあっても、DeepL程度の流暢さ(「精度」ではない*3)があれば、読み手自身が「ここは機械翻訳の誤訳だろう」と補正できる。
これは、一般的なテクストを一般人が読む場合には当てはまらない。ふつうは、機械翻訳が誤っていても、読み手が補正することはできないのだ。逆に、DeepLのような流暢な文面は、流暢であるがゆえに「誤訳」にも気づかずに流してしまうことになる。
上で田中健一先生が示しておられる "I couldn't agree more." のような文ではそれがとても簡単に起きると思われるが(相槌として発される「そうですね」が「そうですかね」であっても読み流してしまうだろう)、それよりももっと面倒そうな例を、当ブログでは過去に扱っている。ご一読いただければと思う。
hoarding-examples.hatenablog.jp
「論文を読む」という行為に係る特殊性は、どれほど強調しても強調しすぎるということはない。DeepLを便利に使っている研究者の皆さんには、Twitterのようなアカデミアの外に開かれている場では、それを強調するよう努めて意識していただければと思う。
なぜなら、Twitterで研究者が何かを称揚することは、その研究者の専門分野が何であれ、専門分野・アカデミアの外で漠然と「プロ(専門家)がお墨付きを与える」ことになるからである。
そして「プロのお墨付き」は、それが何の「プロ」なのかを厳密にする必要があるということも認識されていないところで、ものすごい影響力を持つ。うさんくさいサプリや節電装置(と称するもの)や浄水器、空間除菌装置などの例を見るまでもないかと思う。
あるサービスが、「研究現場で導入されている」ということは、サービス提供者にとってとてつもない実績である。そして、「斜め読みに便利」程度のものが「学問に使われている」ことになってしまい、「うちなんかよりよほど厳密性が必要な研究の場で導入されているのなら、うちでも……」と考える社長や自治体の長が出てきても、不思議ではないのがリアルの世界だ。偉い人のその判断の結果、いいかげんな「翻訳」が世間に出回り、極端な話、run away from the riverが「川から離れて逃げてください」ではなく「川へ逃げてください」と出力されていても誰も気づかず……ということが、現実に、起こりうるし起きている。
どうか、慎重にお願いします。
以上、論理的・倫理的に「No」と言うこと、不正確なものについて「それは不正確だ」と指摘することが、「批判してばかり」とレッテルを貼られて断罪されるのが常態化している今、かなりビビりながら書いた。
■補足1: "I couldn't agree more." の類例について、文法的解説:
元の "I couldn't agree more." に見られる《can not + 比較級》の構文については、拙ブログのエントリ: https://t.co/qKFThCKBol でわかりやすくなるよう自分なりに工夫して取り上げてありますので、よろしければご一読ください。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
■補足2: 「こんな口語的な表現は論文には出てこない(から問題ない)」論に対して:
「こんな口語的な表現、論文には出てこないですよ」論者のみなさん、この表現は「口語的」なことがポイントなのではなく、英語らしい論理そのものの構文であることがポイントで、それが理解できているかどうかがカギなのですよ。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
ああしまった、「英語らしい論理」みたいに読めるけど、「英語らしい構文」に「論理そのものの」を入れ込むときに失敗しちゃった感じです。基本的に日本語でも論理(ロジック)としては同じです。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
■補足3: 似たようなロジックの構文も見てみた件:
どうよ、これ。DeepL翻訳。 pic.twitter.com/EgtbXQ8Gjw
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
これなんか完全にカオス。DeepL翻訳。機械翻訳(ニューラル翻訳)が「文意」など考えていないということがよくわかる例。 pic.twitter.com/xTXP1rCgx1
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
「こんな口語的(文芸的)な表現は論文には出てこない!」論者のみなさんへ。ほれ。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
実際、"can't be stressed too much" は(「理系」の)学術論文でも見ますね。 pic.twitter.com/M0JlyjBic0
DeepLに "can't do ~ enough" のありがち例文を投げてみたらカオスだった。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
"I can't recommend it enough." だと示されている4パターンすべて誤訳(否定肯定が逆)。
この文の目的語を代名詞でなく"the book" にすると2パターンが肯定、2パターンが否定。
カオスにもほどがある。 pic.twitter.com/QVBn7Z7ijh
2パターンが肯定で2パターンが否定の場合、「英語ができない人は正しいものを選べない」くらいならまだましで、その人が「英語ではこの同じ文が肯定の意味を持つことも否定の意味を持つこともある」と考えてしまうこともありうるわけですよ。そうなるともう、害しかない。
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
■補足4: だれもGoogle翻訳の話などしていなかったのだが……
“I couldn't agree more.” Google Translate だと「私はこれ以上同意できませんでした。」どっちもどっち https://t.co/zQzOdXkfaG
— Haruhiko Okumura (@h_okumura) 2021年11月20日
田中先生は「Googleはいいぞ」という文脈で発言されているわけではないので、ここでGoogleを持ち出すのもどうかと思いますが、それ以前にこの2例は「どっちもどっち」ではないです。DeepLは肯定を否定として出力した完全な誤訳で、Googleのは内容は誤りではないが読んでも意味が取れない性質の悪訳です https://t.co/exUTwEmmyu
— nofrills/文法を大切にして翻訳した共訳書『アメリカ侵略全史』作品社など (@nofrills) 2021年11月20日
※「誤訳」か「悪訳」かは、中原道喜先生の定義による。
※当ブログ規定4000字の倍以上、8600字。
*1:だから私は、あれらの翻訳エンジンがやっていることを「翻訳」とは呼ばない。「入力」に応じた「出力」でしかない。「なんとか翻訳」という名称である以上は「翻訳」をしているのだと思ってしまうのは自然なことなのだが、あれらが「なんとか翻訳」を自称していること自体、この上なく羊頭狗肉であると思う。
*2:繰り返すが、DeepLのやっていることは「入力に応じた出力」であり、「翻訳」では断じてない。「翻訳」のプロセスも「入力に応じた出力」ではあるが、そのプロセスが全然違う。
*3:機械翻訳が出力した日本語だけを読んで、奇妙なところがあれば気づけるくらいの流暢さがあるのはすごいことだし、それゆえに研究者の間での評価が高いのだろうと思うが。