DeepL小説、Grammarly小説の未来(7)ー AI翻訳で出会った現象 2/3

 

3.DeepLの不思議な振る舞い

しれっと一文飛ばす

右側の翻訳欄の文章をよく見てみると、左側の入力文のうちの1つの文の訳が全く欠落していることがある。

理由はいろいろあるのだろうが、一つはうまく訳せなかったのかなと思わせるもの。元の文がその一つの文自体の中で矛盾した構造になっていて、意味をなさないような場合は飛ばしてしまうようだ。

他の例では、左欄にペーストした英語のパラグラフの中の、一つの文の末尾のピリオドの前に、余分な半角のスペースが1つ入っていた。それに気づいてスペースを削除すると、欠落していた文の訳が右側の翻訳文の中に現れた。

また、私は会話文の括弧にはダブルクォーテーションマークを使ったが、その最初の「”」のあとにスペースを入れないと、日本語に訳してくれないなんてのもあった。

あれだけ大胆な意訳をしてくれるのに、妙に細かいところにこだわるものだなあと不思議な感じがする。

前に出てきた訳と違う

これは仕方ないというか、AIたる所以だろう。むしろAIの長所とも言えると思う。つまり常に学習をしているのか、それともいろんな翻訳の可能性を提示するために、意図的に揺らぎを与えられているのではないかということだ。

また、元の文のほんの一つの漢字をひらがなに変えただけでも、訳文が異なってくることは普通にある。

正反対の意味の翻訳をする

これは注意すべき点だ。なぜだかわからないが、noとかnotなどの否定の言葉が入っているのに、それを全く無視した肯定の意味の翻訳を、ごくまれにだが出すことがある。また、noやnotを使わない文でも、意味を逆に捉えて翻訳しているケースも見つけた。

随分前に2つの例をスクリーンショットで残してあったが、今同じ文章を入力すると正しい翻訳をするようになっていた。学習をしたのか、それともあの時は大量の翻訳をさせられて疲れていたのか?

とある文字列に対して妙なフレーズが出てくる

これも注意すべき点だが、お世話になったDeepLの名誉のために言っておくと最近は全くない。一年前、翻訳を初めてすぐの頃の話だ。

具体的には忘れてしまったが、ひとつは、たしかクォーテーションマークと1つ2つのキーを入力すると妙なアスキーアートのようなものが翻訳欄に現れた。

もう一つは、翻訳の中に全く関係のない3行ほどの文章がでてきたことだ。これも同じ文章が出てくるのを何度か経験した。実はこの文章は最初に一括翻訳したファイルに残っていたので、今見てみた。なにか、カスタマーサービス用の文章みたいだ。

しかし、最近は出現しないと言ったものの、今度はこの残っていた文章をコピーしてDeepLに翻訳させてみたら、これまた妙な全く関係のない文章が翻訳欄に現れた。

このブログを書き始めるにあたって、あらためてDeepLの利用規約を読んでみてわかったが、前にも書いた通り、無料版に入力されたテキストはAIの訓練にも使用されるそうだ。さらに、ユーザーが施した翻訳文の修正も使用されるらしい。

一年前といえば、DeepLの日本語サービスが始まってからまだ一年。利用者数もいまほど多くなかっただろうから、その頃に無料サービスを集中的に利用した人の影響が残っているのかもしれない。

つづく

 1 2 3 4 5-1 5-2 6-1 6-2 7-1 7-2 7-3 8 

アダムの選択(亜東 林)

 

手のひらの中の彼女(亜東 林)

 

シライン(亜東 林):改訂版

 

LIARS IN SPACE (Rin Ato):シライン英訳版

英訳の経緯はこちら

 

DeepL小説、Grammarly小説の未来(7)ー AI翻訳で出会った現象 1/3

これだけ大量の翻訳をやっていると、いくつか興味深い経験もした。特にAIならではと思われるものがいくつかある。

やはり、100回同じインプットをすれば、100回同じ答えが返ってくるこれまでの機械とは違うのだ。きっと、AIは日々新しいことを吸収しているのだ。

1.Grammarlyは上品

初期の頃はGrammarlyのwebエディターの上で随分長い時間を過ごしたのだが、やはりガンガンと新しい翻訳を出してくるDeepLのような派手さが無い分、印象は控えめだ。

お茶目だなと思うことがあったのは、たまに全部指摘をクリアして、これでもう大丈夫だと修正文全体をコピーをするような段になって、ポツリと指摘の赤線を出してくることだ。

きっとその時々でサーバーの混み具合が違い、必要なチェックの深度に達する時間に差が出るのだろう。また、DeepLもそうだが、時間が経つと同じ文章でも指摘がわずかに異なって来ることもあるようだ。AIが進歩しているということだと思う。

たまーに、この指摘はおかしいかなと思うものは確かにある。それから、Grammarlyが間違いを指摘し、提案してきた修正案の通りに修正すると、別の間違いの指摘と提案が現れ、それを採用するとまた別の間違いの指摘と提案が現れ、それを採用すると最初の間違いの指摘に戻るという、ループのような現象もまれにあった。

でも、自分ではこれは絶対にGrammarlyの判断がおかしいと思っていたものが、ふと気づいた修正、例えばどこか離れた所にコンマを打つとか、複数形のsを一つ取ってみるとかで、スッと指摘の下線が消えてしまうことがある。

その理由がわかった時、ああやっぱりAIは賢いと感心することになり、翻訳が進むにつれ、私は文法の面では徐々に謙虚になっていった。

2.柔軟な翻訳をするDeepLとやや固いGoogle翻訳

DeepLは大抵の場合、和文英文とも、かなり崩れた文でもなんとか無理して翻訳してくれる。文章の趣旨をつかんでそれに合った自然な文を創造してくれているようで大変ありがたい。対してGoogle翻訳はやや固い。直訳に近い翻訳をすることもある。

ただDeepLの場合その柔軟さが行きすぎてしまうのか、英文のチェックをしていると、どうも日本語訳がおかしいのではないかというものにもたまに出くわす。自分が知っている英語の知識からして、決してこんな訳にはならないだろうというものだ。

そんな時は、Google翻訳にもかけてみる。するとこちらの方が、ぎこちなくともかっちりと訳してくれるので、自分の考えが正しかったということがわかって安心するのだ。

だから、翻訳作業をやっている時は、常にDeepLとGoogle翻訳のウィンドウを立ち上げておいて、疑問があったり、不安がある場合にはGoogle翻訳にもかけて確認するということをしていた。

つづく

 1 2 3 4 5-1 5-2 6-1 6-2 7-1 7-2 7-3 8 

 

アダムの選択(亜東 林)

 

手のひらの中の彼女(亜東 林)

 

シライン(亜東 林):改訂版

 

LIARS IN SPACE (Rin Ato):シライン英訳版

英訳の経緯はこちら

 

DeepL小説、Grammarly小説の未来(6)ー 翻訳初期の問題点 2/2

 

2.男性言葉、女性言葉が使えない

これは実は英訳をやってみるまで全く気づいてなかった。日本語版の会話文の中では、「オレ」と言えば男だし、「〜よね」と言えば女だし、これで話者の区別をつけていることが多かった。

二人の会話、あるいは少人数の会話であれば、◯◯が言った、とか、彼女が話した、とかいちいち書かなくてもだいたい話者の区別はつけられる。

でも英語だとそう簡単にはいかないのだ。念のために英語でも男性女性の話し方に区別があるかどうか調べてみたのだが、あるにはあるが、どうも微妙で日本語のようなはっきりした区別はつけにくいようなのだ。ましてやネイティブでもない自分にそんな高等技が使えるわけもない。

ということは、話者が誰だかよくわからなくなってしまう場所には、日本語版にはなかった、◯◯が言った、彼女が話した、を会話の後か前にいちいち付けていかなければならない。

これは結構ショックだった。翻訳をしながら、いちいち会話文の場所に書き込むという作業が発生した。しかも、その付け加え方がよくわからない。いくつかの英語の本を見てもあまり統一されてるとも言えない。

結局、日本語の鉤括弧にあたる” “内の最後はピリオドにせずにコンマに変え、そのあとにsaid ◯◯.と書くというルールだけ覚えて会話文の後に置いたり、会話文の前後の語り手の文として書いたりと、一番負担のかからない形でやった。

 

3.語り手が語る言葉の時制

これは一番悩んだことかもしれない。この物語の語り手は一応客観的に語るのだが、たまに主人公と準主人公の主観が乗り移るような奇妙な存在として描いてある。その奇妙さの表現も含めて、語りの時制をどうすれば良いのかがわからなかった。

日本語版では、あまり考えることもなく過去形と現在形が混じり合った形で書いていた。日本語の場合には、過去形だけで書くとおかしな文章になってしまうからで、これはわりと普通のことだと思う。DeepLもそこそこ忠実に日本語の時制に合わせた訳をしてくる。

しかし、英語ではそうもいかないようだ。ネットで調べてみると、少なくとも昔は過去形で書くのがスタンダードだったらしい。

でも現在はそれほど画一的ではなく、特に臨場感を感じさせるような場面には現在形を使うこともあるそうだが、どうやら一つのパラグラフの中で混じって出てくるような書き方は避けた方がよさそうだった。

ちなみに、現在まで通用する普遍的な事実を書く時には現在形を使うというのもあり、これは納得できる話だ。

そこでどうしようかと思ったのだが、初期の頃は割と自由にやってしまおうと思っていた。なので、躍動感を出す場所ではどんどん現在形を使って書いていた。

しかし翻訳が進み、いろんな経験を経るにつれ、心配になってきて保守的に過去形を多用するようになってしまった。

が、後期になると溜まっていたフラストレーションが噴き出したようで、やはり思った通りにやろうと何か所かを現在形に戻したりもした。パラグラフの中で混ぜてしまった部分もある。

一番悩んだのが冒頭の一文で、最初は現在形。もちろん日本語版も現在形になっていた。しかし、ここは過去形に変えた。冒頭で違和感を持たれるのも嫌なので。

 

4.その他

日本語に主語がない

日本語は結構あいまいに主語のない文章も書く。特に小説なんかはそうだろう。そこはDeepLがテキトーな主語を入れてきたりするのでその修正は必要だ。

数字

英文では文の冒頭にアラビア数字を持ってこないようだ。確か、Grammarlyが指摘してくれてそのことを知ったように記憶するが、いま試して見たらなんとも言わなかった。ちょっとハシゴを外された感じ。

あと、10以下の数字はアルファベットで書き下せということらしい。

いずれも絶対ではないが、検索すれば説明してくれている人がいる。

人物名と性別

実は主人公は女性なのだが、付けた名前が最近は男性に多い名前だったらしいのだ。そんなこと全く知らなかった。

それで何が起こるかというと、DeepLがその主人公にheとかhimとかを使ってしまうのだ。まあ書き換えればいい話なのだが、ひょっとすると、前後の文との関係で翻訳の精度が落ちてしまうのではないか、という気もする。

日本語版の前後の文の中では、その主人公を指して彼女という言葉を使うこともあるからだ。その両者の関係がわからないと、翻訳も違ってくる可能性があるということだ。

今回一括翻訳前の日本語文の前処理としては、DeepLに馴染むように鉤括弧「 」を”  “に変えただけだったが、もしかすると主人公は花子などの典型的な女性の名前に変えておいた方が良かったのかもしれない。

しかし、異なる名前であの作業をやるのも嫌だなあ。悩ましいところだ。

 

 1 2 3 4 5-1 5-2 6-1 6-2 7-1 7-2 7-3 8 

 

アダムの選択(亜東 林)

 

手のひらの中の彼女(亜東 林)

 

シライン(亜東 林):改訂版

 

LIARS IN SPACE (Rin Ato):シライン英訳版

英訳の経緯はこちら