Hoarding Examples (英語例文等集積所)

いわゆる「学校英語」が、「生きた英語」の中に現れている実例を、淡々とクリップするよ

【再掲】「精度の高さ」が売りのウェブ機械翻訳 (DeepL) は、実際どのくらいのものか。

↑↑↑ここ↑↑↑に表示されているハッシュタグ状の項目(カテゴリー名)をクリック/タップすると、その文法項目についての過去記事が一覧できます。

【おことわり】当ブログはAmazon.co.jpのアソシエイト・プログラムに参加しています。筆者が参照している参考書・辞書を例示する際、また記事の関連書籍などをご紹介する際、Amazon.co.jpのリンクを利用しています。

このエントリは、2020年9月にアップしたものの再掲である。この分野は「技術は日進月歩」と言われ、本稿は再掲であるがゆえに内容が古びているかもしれないが、現在広く使われている機械翻訳というものはこういう性質の技術であるということに変わりはない。

-----------------

今回は、ちょっと趣向を変えて、ネット上で「精度が高い」という売り込みが完全に定着し既成事実化している、誰でも自由に無料で利用できる機械翻訳についての実証試験的なものを。

といっても、昨日、Twitterに投稿したものをまとめておく、という感じだが。

発端は、田中健一先生がDeepL翻訳に投げた "There are cases where honesty does not pay" という文の英→日翻訳結果がぐだぐだだったこと。それを受けて次のようにツイートしたら、けっこう反応があった。

念のため書いておくが、私は機械翻訳絶対反対という立場ではない。実用に足るものがあれば積極的に使っていくべきだと考えているが、現状、一般的に話題になるものは「実用に足る」レベルでは全然ないのだ。

 

よく「精度が高い」と言われるものは90%だとか95%だとかいう、一見「ほぼ100%と言っていいんじゃね」という数字を掲げて喧伝されているが、90%ということは10語に1語間違えているということだ。自分の手元にある日本語漢字変換で、変換10回に1回間違えているものを「精度が高い」と見なせるかどうか、考えてみてほしい。場合によってはそう言えるかもしれないが、では試験の解答をその漢字変換システムに任せられるだろうか。取引先へのメールを任せられるだろうか。そういうことである。あるいは、遮光カーテンや日傘のショップやメーカーが出している「99%遮光」の説明画像を見てみてもいいかもしれない。「99%」は意外とザルだというイメージができるだろうから。

ともあれ、田中先生がアップしたこの文例については、@yunod さんが以下のように追加検証をされている。

 

 

 

 

 

句読点の有無で出力(翻訳結果)が変わるのは、15年前の機械翻訳でも「あるある」事例だった。15年前の機械翻訳は、基本的に、文法(シンタックス)に基づいた解析ができなくなってしまうと、単語の羅列で意味不明なものしか出力できなくなってしまうという質のものだ(文法解析ができたとしても、出力結果は悲惨なものだったが)。

ともあれ、この「句読点の有無」について別の文例で検証してみよう。文例としては、DeepL翻訳にアクセスした画面であらかじめ表示されていたダミーテクストを使ってみる。

 

 

こんな単純な文でさえ、これだけのゆれが生じてしまうものを、安心して使えるかどうか、信頼できるかどうか、よく考えてから賞賛していただければと思う。

 

さらに句読点の有無などよりずっと重大な例。

 

 

こういう流暢な誤訳、つまりその文自体では意味が成立している場合は、出力結果(翻訳結果)だけを読んだときには「誤訳」だということがわからないので、意味不明の単語の羅列を出力してくれる翻訳エンジンより、いっそう悪質で厄介である。ただし翻訳エンジンの側には悪意は一切ない。むしろ、善意の塊、「世の中を便利にするもの」として開発され、無償で使えるように公開されているものだ(さらにいえば、無償で使えるようにしてあることでますます文例が集まり、さらに良くなる、つまり「精度が上がる」とされている)。

重要なのは、ユーザーがそれを認識すること、認識したうえでどうするかということである。

 

最後に取り上げた "it had been busier during the evening than it had been at any time since the start of lockdown." の文法解説もここでやってしまいたかったが、残念ながらもう文字数が3700文字を超えている(そんなに書いた気はしないが、Twitterの埋め込みがけっこうあるからだろう)。300字で文法解説はできないので、その解説は次回に回すことにする。

 

※3830字

 

f:id:nofrills:20201006171926p:plain

 

 参考書:  

通訳翻訳ジャーナル 2020年7月号

通訳翻訳ジャーナル 2020年7月号

  • 発売日: 2020/05/21
  • メディア: 雑誌
 
機械翻訳:歴史・技術・産業

機械翻訳:歴史・技術・産業

 

 

 

 

当ブログはAmazon.co.jpのアソシエイト・プログラムに参加しています。筆者が参照している参考書・辞書を例示する際、また記事の関連書籍などをご紹介する際、Amazon.co.jpのリンクを利用しています。