2026年01月21日

【薙刀式】ことば、確率挙動、厳密性

ことばには不思議な性質があり、
曖昧性と厳密性があるところだと思う。

僕がLLMを作動原理とするAIや、
ニューラル変換、ライブ変換を信用していないのは、
ことばの曖昧性はうまくいっても、
ことばの厳密性は適用できてないからだ。

ことばの厳密性とはどういうことかというと、
数学や法律や知識全般である。

これは厳密に決まっている(ないし決めた)ことであり、
それが真実であるとして人類は動いている。
今後更新されるとしても現時点では厳密に扱う。

ことばの曖昧性とは、その表現は一意ではないことだ。
1+1=2と書いても、
「いちたすいちはに」と書いても、
一つの要素と一つの要素を足したら二つになる、
と書いても間違いではない。
厳密性を保ったまま、表現に関して曖昧性をもてる。
(あ、あと2×3と3×2は積に関する可換性から同値な)


また、意味の曖昧性もある。
「今日はいい天気ですねえ」は、
天気がファインであることだけでなく、
気分がいいことも含むし、
恋人とデートしているときは、
「あなたが好きです」と言っていることに等しい。

逆に、渇水にあえぐときならば、
恨み節や皮肉になるだろう。

言葉の示す意味以上に、
人間は意味の多義性、曖昧性をつねに使っている。
「ぶぶづけ食べていきなはれ」は、
「帰れ」の婉曲だと理解できるどうかを試すことばだ。



さて。
LLMの確率的挙動は、
曖昧な表現を使いながら、
意味の厳密性を外している。

LLMだけでなく、もっと単純な統計的挙動によるもの、
たとえばマルコフ過程によるものや、
量子力学的挙動による量子コンピューター計算もそうだろう。

アインシュタインが「神はサイコロを振らない」といったのは、
物理学(=数学を用いて自然界を把握する学問)は、
厳密性のある部分だけを扱うべきだ、
と言いたかったのかもしれない。


話が抽象的になってきたので、
具体例を出す。


僕はAIの限界を探るために、
時々いじめて遊んでいるのだが、
gemini(Google検索からできるAIモード)に、
「薙刀式」を尋ねてベンチマークにしている。

するとね、作者が毎回違うんだよ。
(直後に聞くと同じ答えになるので、定期的に聞いている。
時計アイコンから前のセッションを呼び出せる)

以下にその記録。数字は出現回数。

3 大岡俊彦氏 「大岡俊彦の作品置き場」というブログで公開されています。
2 大岡俊彦氏 (出典不明)
1 大岡俊彦氏 「新・落とし穴」で継続的に更新されています。
2 大城泰造氏 「大城泰造のブログ」で公開されています。
1 大木氏   「大木のブログ」で公開されています。

なんだよ、新落とし穴って。
誰だよ大城泰造って。大木は名前すらねえじゃん。

3/9 完全正解
5/9 正解ではあるが、付帯状況が不足
6/9 名前は正解だがブログ名がまちがってるので±
として、半分くらいしか正解しないし、
厳密性で取れば1/3しか合わない。

これが知性か?

厳密な知識が必要なものに対して、
これだけの低い正解率なものを信用できるだろうか?


逆に、曖昧なものは強い可能性がある。
厳密性は関係ないからね。
「ざっと要約して」とか、
「大体こんな感じを抽出して」なんかは強いはず。
ただしそれもあってるのか、
上の推定から信用するべきかはかなり危険な気がする。

見逃してはいけない情報が含まれていたとしても、
それは重要ではないと判断して捨象する可能性もあるだろうな。


なぜAIが絵を描いたり文章を書いたり音楽をつくったり、
曖昧な芸術分野で先に成果を出したか、
分かるだろう。
確率的挙動は曖昧性と相性がいいわけだ。



さて。

漢字変換にこのAIを使うべきか?


僕は無理だと思っている。
「絵をかく」のは「描く」だし、
「字をかく」のは「書く」だ。

これは3/9とか5/9とかの世界ではなくて、
100/100の世界である。
1億回変換しても一度も間違えてはいけない。
100%の世界だ。

人間だから間違うよな、は許されても、
機械で法則で厳密で動いているものならば、
許されないものである。


ちなみに量子コンピューターの演算結果は、
どうやって信用するのかを調べたことがあるんだけど、
ノイマン型よりも圧倒的に速い演算例しかさせていないので、
100回くらいやって(それでも圧倒的に速いから)、
それで一番多いものを結果として採用しているらしい。
まじか。多数決なんや。

今のところノイマン型では難しい課題しか与えていないから成立しているが、
通常計算になったらつねにシュレディンガーがやって来るのか?
それはやばいな。
電車の到着時刻は確率分布を取ってしまう。
1/3くらいの人は乗り継ぎを失敗する。


じゃあLLMもニューラル変換も、
100回くらい演算させれば、収束するかな?
そしたら厳密性しかできなくて、
曖昧性のあるものを扱えなくなるかな?
ざっくりいうと、ドイツ人みたいになるかな?
(ドイツ人に関する偏見が混じっています)

むしろ絶対失敗できない厳密な原発事故をつくるのは、
ドイツが得意なのだから、
ドイツ人、LLMつくってみてくれよ。


ことばの厳密であってほしい部分は、
エキスパートシステム
(if thenの集合体。これは現在のIME)でやるべきで、
あいまいな部分はLLMでやればいいんじゃないか、
って思うじゃない?

でもこの割り振り問題はフレーム問題といって、
「問題のフレーム(問題の外から見た判断)をどうとらえるか」は、
AIが一番苦手とするところなんだよね。
厳密性があるところから曖昧性があるトンネル効果によって、
フレームが一瞬崩れるから、
量子コンピューターもノイマン型以外の演算ができてるようなもんだ。


僕は今のLLMベースのAIはバブルだと思ってて、
それは曖昧性しかないからだ。
厳密性が必要な知性というジャンルには、
原理上歯が立たないだろう。
今も検索はAIノイズに犯されかかっている。
間違った知識があいまいなまま広まるのは、
人類の危機まである。

人類の知性の集合体の本をネットに明け渡した瞬間、
曖昧な知識に溶けてしまって、人類は勝手に滅亡するかもしれない。

先日も、「変換キーのキーコード」を調べるのが面倒なので、
AIに頼ったらKC_INT3と答えてコンパイルしたら間違ってた。
正解はKC_INT4。
こうした厳密性が必要なものは、AIを信用するべきではないし、
こうしたノイズを広めることに対して責任を取ってほしい。
賠償をやり始めたら5秒でOpen AIはつぶれるかな?


もしニューラル変換が広まっていくと、
原理上「絵を書く」という表現が広がってしまい、
日本語が汚染されることになるだろう。
(iPhoneのクラウド変換は誤変換が蓄積されて、
アホの展覧会みたいになっている)
「昔は区別してたんだけど、今はどっちもあるねー」
なんて人たちばかりになるに違いない。

それをことばの変化と捉えるか、
漢字で同音のニュアンス違いを表現できる、
日本語の特性がうしなわれたと感じるかだな。
僕は後者の側で、それが日本語の美しさのひとつだと思うからだね。



というわけで、
僕はライブ変換とニューラル変換を信用していない。
とはいえ、
エキスパートシステムベースの、
MS-IMEは阿呆すぎる。

ATOKはどうなんだろう?
ここまで踏み込んで議論しているIME論が見つからないので、
「日本語の変換はべんりですー」みたいなアホみたいな感想は置いといて、
もっと厳密な評論を探している。
○○は変換できるが○○は変換出来なかったなどの、
豊富な例が欲しい。


漢直の可能性は感じるものの、
それを常用して文章を書くには、
脳負荷がどれくらいになるかわからない。

僕は文章を書きたいだけで、
漢字をただしく表記したいわけじゃないからなあ。
間違ってたらあとで直せばいいや、くらいだし。
(じゃあ現状のがーっと書いてあとで再変換する、
みたいなことが一番なんじゃないのか?という疑問を常にもっている)


10年かけてデジタル日本語入力を研究してきたが、
分かったことは、他人の脳内と僕の脳内はだいぶ違うことだ。
他の人が便利だといっても信用しないほうがいいかもしれない、
と身構えさせるのに十分な時間を過ごしてしまった。

脳内発声のある人のやり方、
突き刺し打ちの人のやり方、
ロウスタッガードの人のやり方、
腱鞘炎未経験の人のやり方、
意味を考えずに早打ちしたいだけの人のやり方、
ブラインドタッチできない人のやり方は、
僕と違うことがわかっている。

大量に書く作家のやり方は、
参考になるかと思って調べもするが、
あまりにもデジタルに関して無頓着なので情報量0だ。
せいぜいHHKBはいい!とかだもんなー。

ばね交換するために30gからテストする、
みたいな話をしてるのは、俺とラクダエンさんしか日本にいないのでは?
二人ってなんだよ。もっと作家ばね交換しろよ。

話がそれた。



というわけで、
ことばの厳密性が欲しいときに、
LLMという確率的挙動はあまりにも不安定で信用ならない。

少し前、まだ一度に扱えるトークン量が少なかったころ、
「日本で二番目に高い山は?」とAIに聞く方法論があった。
剣岳とか奥穂高岳とか、有名な山を答えるだけであった。
(正解は北岳)
今はトークン量が増えて、検索機能もついたので、
「日本の百名山」みたいなのを検索して根拠にするようになったので、
大体答えられる。

しかし「四番目の山は?」に対しては「間ノ岳」などと、
誤りを返してくる。
奥穂高岳と間ノ岳が同じ高さで3位なので、
4位はない、が正解。

この、ないものに対してない、
と答えられるだけの厳密性を持っていないので、
曖昧性で返してくるんだよな。
適当に答えやがって。

このへんがハルシネーションの原因になっている。
トンネル効果を持つのはいいのだが、
今トンネル効果を使うべきか使わないべきかの判断ができないからね。



僕はことばを曖昧に使いたいし、厳密に使いたい。

IMEがそれに答えられる道具になるのか、
あまり希望を持っていない。

(少なくとも今MS-IMEの管理権限は中国にあり、
日本が手を出せない状況になっていることはたしかだ。
アジア全域を中国に任せた、というのが大義名分らしいが、
アメリカらしい、アジアはみんな一緒だろというおおざっぱを感じるね)

僕はIMEをつくるほどの文法知識もないし、
プログラミング能力もない。
なので、今あるものを最大限労力を減らして、
うまく付き合っていく方法論を構築するしかない。



薙刀式の編集モードでは足りないから、
僕は百式漢直を作り始めているといえる。

それもなー。使えるのかなー。
同音異義のイライラはだいぶんいいけれど、
常用するのはまだ無理かもね。
まだ夢のような方式にはたどり着いていないのが現在地。

薙刀式と自作キーボードは、
かな入力までは夢のような方式だ。
だけど変換なんだよな、夢が色褪せるのは。
posted by おおおかとしひこ at 15:07| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック