2024年04月18日

文脈と逐語訳

文章、つまり我々の認識は言語でなされる。
しかしその言語に表れていない文脈が、
隠されていることがある。

我々は見えないが見えている文脈によって、
発する言葉を少なくして、エネルギーを最小化する。

このことが、機械翻訳で暴かれた例がおもしろいので。


過去にピロリ菌除去の治療を受けたことがありますか?
○なし
○あり

を外国人が機械翻訳して困っている例。

〜本文訳省略〜
○ A japanese pear
○ An ant

あほかよ。
https://x.com/paprikahhh/status/1776744645755908598

ここは当然、
○ No
○ Yes
という選択肢になるはずだが、
「なし」を梨、「あり」を蟻として訳しているわけだ。



人間ならばこの間違いを犯さないのに、
機械はこれをする。

つまり言語とは、逐語訳だけではできなくて、
背景文脈による強い規制が働いていることを、
人間ならわかるが、機械はわからない、
ということを示唆する。

医療行為の経験を聞いてる文脈なんだから、
ないです、あります、あるとしたらどれくらい前とかどの程度か、
を問診している、
という文脈なので、
選択肢はY/Nしかあり得ない、
という「予測」をしてないことになるね。

もっとも、
最近のディープラーニングでは、
質問の後に答えがあるパターンを学習してるので、
文脈ではなくパターンでY/Nにたどり着く可能性は高い。
文脈を理解してなくても、
パターンでいけるかもしれない。

この解答欄が特殊なのは、
Y/Nの順ではなく、N/Yの順なこと。
このパターンは滅多にないから、
文脈による判断ではなく、学習パターンになかったものは、
誤りがちなのだろう。


ところで。

文脈から切り離し、
逐語訳だけをヤイヤイいうのは、
マスコミやネットの得意技だね。
最近それがようやく「切り取り」ということで認識されてきた。

切り取りは愚かな行為であり、
バカのすることだ。
この阿呆な翻訳と本質はおなじなわけだ。


逆に、
脚本論的にいえば、
名セリフというのは短いものが多い。

それは、背景文脈込みなんだよね。

T2の、
I'll be back.
がなぜ名セリフかというと、
あのターミネーターの「2」が作られる?!
という文脈で使われたから。
そうじゃない限り、この有名な言葉は意味をなさない。

ちなみにこのセリフ自体は、
ちょっと行ってくるわ、すぐ戻る、
という普通の場面で使われてるだけなのよね。
ガッカリしたのと同時に、
名セリフかどうかを決めるのは文脈なのだな、
と理解したことを思い出す。


セリフで全部語ろうとしている阿呆な脚本家は、
逐語訳しかできない機械と、
切り取りするバカと、
対して変わらぬレベルということさ。
posted by おおおかとしひこ at 11:08| Comment(0) | TrackBack(0) | 脚本論 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック