文章、つまり我々の認識は言語でなされる。
しかしその言語に表れていない文脈が、
隠されていることがある。
我々は見えないが見えている文脈によって、
発する言葉を少なくして、エネルギーを最小化する。
このことが、機械翻訳で暴かれた例がおもしろいので。
過去にピロリ菌除去の治療を受けたことがありますか?
○なし
○あり
を外国人が機械翻訳して困っている例。
〜本文訳省略〜
○ A japanese pear
○ An ant
あほかよ。
https://x.com/paprikahhh/status/1776744645755908598
ここは当然、
○ No
○ Yes
という選択肢になるはずだが、
「なし」を梨、「あり」を蟻として訳しているわけだ。
人間ならばこの間違いを犯さないのに、
機械はこれをする。
つまり言語とは、逐語訳だけではできなくて、
背景文脈による強い規制が働いていることを、
人間ならわかるが、機械はわからない、
ということを示唆する。
医療行為の経験を聞いてる文脈なんだから、
ないです、あります、あるとしたらどれくらい前とかどの程度か、
を問診している、
という文脈なので、
選択肢はY/Nしかあり得ない、
という「予測」をしてないことになるね。
もっとも、
最近のディープラーニングでは、
質問の後に答えがあるパターンを学習してるので、
文脈ではなくパターンでY/Nにたどり着く可能性は高い。
文脈を理解してなくても、
パターンでいけるかもしれない。
この解答欄が特殊なのは、
Y/Nの順ではなく、N/Yの順なこと。
このパターンは滅多にないから、
文脈による判断ではなく、学習パターンになかったものは、
誤りがちなのだろう。
ところで。
文脈から切り離し、
逐語訳だけをヤイヤイいうのは、
マスコミやネットの得意技だね。
最近それがようやく「切り取り」ということで認識されてきた。
切り取りは愚かな行為であり、
バカのすることだ。
この阿呆な翻訳と本質はおなじなわけだ。
逆に、
脚本論的にいえば、
名セリフというのは短いものが多い。
それは、背景文脈込みなんだよね。
T2の、
I'll be back.
がなぜ名セリフかというと、
あのターミネーターの「2」が作られる?!
という文脈で使われたから。
そうじゃない限り、この有名な言葉は意味をなさない。
ちなみにこのセリフ自体は、
ちょっと行ってくるわ、すぐ戻る、
という普通の場面で使われてるだけなのよね。
ガッカリしたのと同時に、
名セリフかどうかを決めるのは文脈なのだな、
と理解したことを思い出す。
セリフで全部語ろうとしている阿呆な脚本家は、
逐語訳しかできない機械と、
切り取りするバカと、
対して変わらぬレベルということさ。
2024年04月18日
この記事へのコメント
コメントを書く
この記事へのトラックバック

