という、変換泣かせの課題を思いついたので。
油絵の中に作者のサインを書くとか、
看板の文字をレタリングするなどを想像すれば、
そんなにあり得ない文ではないことは分る。
MS-IMEで変換してみた。
まずは連文節で一括変換。
(入力) かかれたえのなかにかかれたもじ
(出力) 描かれた絵の中に書かれた文字
意外といけるやんか。最長一致法はなかなかやるね。
絵、文字という後ろから効く要素を拾ってるのは意外だった。
前からしか情報を拾ってないと思ってたよ。
案外優秀。
でもここまで一気に打つことってそんなにない。
もう少し短い単位で変換していってみる。
以下、スペースで区切られたのが入力した単位。
(入力) かかれたえ のなかに かかれたもじ
(出力) 描かれた絵 の中に 描かれた文字
2度目の「かかれた」が前のものを引っ張ったね。
しかし最長一致だとうまくいったのに、
なぜ「かかれたもじ」だと「書かれた文字」のように正しく変換しないのだろう?
文字はまず書かれるものであって、描かれるものではない、
という判断はないのだろうな。
不思議。
(入力) かかれた えのなかに かかれたもじ
(出力) 書かれた 絵の中に 書かれた文字
「かかれた」と「え」を変換単位として分けてみた。
案の定、「かかれた」が確率的挙動になっている。
執筆しているときは、絵のことが頭の中に浮かんでいるから、
そのときに「かかれた」を使うなら、
100%「描かれた」を想定して入力する。
それが「書かれた」に変換されるからイラッと来るんだよなー。
比較のために、
azooKeyのニューラル変換でもやってみた。
(入力) かかれたえのなかにかかれたもじ
(出力) 書かれた絵の中に書かれた文字
おい! ニューラルやAIはどこに行ったんだよ!
(入力) かかれたえ のなかに かかれたもじ
(出力) 書かれた絵 の中には 書かれた文字
まあ一回「書かれた」になったら一生これかもね。
あとニューラルを使ってて気になるのは、
「のなかに」を変換したら、勝手に助詞が貼りついて、
「の中には」なんて変換しやがるところ。
ちなみに第二候補は「の中にも」になってて、
「の中に」は第三候補だった。
余計なことをやるのもAIの感じがするよなー。
(入力) かかれた えのなかに かかれたもじ
(出力) 書かれた絵 絵の中には 書かれた文字
あー、勝手に変なのをくっつけるやつがもう一個発動した。
「かかれた」から「書かれた絵」になってやがるぜ。
しかし、一生「かかれた」が「書かれた」にしかならないの、
過学習みたいな現象だよな。
ちなみに候補には「描かれた」は出てこずに、
もっと小さな文節に切っているものしかなかった。
書の次は掛、係、架、罹、懸、欠、ときて、
ようやく描だった。
僕がAIを信頼しないのは、こうした一意な動作をしない、
シュレディンガーな動作しかしないところだ。
少なくともカナ漢字変換はエキスパートシステム的な、
if thenで一意に決まる要素があるはずなのだが、
なんでAI変換を推す人は、これを良しとしているのだろう?
まあ、AI変換はおいといて、
結局、書くと描くは、文節の切り方によって、
まったく異なる挙動を示す、
シュレディンガー要素を含んでいることが分る。
日本語は不思議だね。
絵のことを頭にいれていたら、先行する「かく」は、
描くに絶対になるし、
文字のことを想定していたら、先行する「かく」は、
書くになるわけだ。
こういう後方から効く同音異義の決定法があるんだなー。
また、これは口語的というよりは、
文語的なものだと思う。
書かれた文章にはあるが、口で言う言葉にはあまりない。
後ろから効かせることは口ではあまりないと思うので。
(もっとも、こんな風に後ろから既定するやり方は、
うまい文章とはあまり言えない。
しかし先行する漢字で後ろを規定するやり方は、
係り結びのようではある。
たとえば「描かれた油」で、油絵を示す事ができる。
やや高度な手法ではあるが、
美大ではふつうに使う言葉だよな)
まあとにもかくにも、
現時点では、
MS-IMEで一括変換するか、
漢直を使うしか、
この文を正しく一発で書くことができないわけ。
日本語を一発で正しく書きたい。
ただそれだけのために、
こんなに不安定なマシンを使って、
シュレディンガーに対応していかないといけない。
そんなばかな。
むしろ、これをばかなと言わない国民がばかなのか?
2026年01月20日
この記事へのコメント
コメントを書く
この記事へのトラックバック

