機械学習というネーミングは悪手だった。
機械のイメージは、「人の出来ないほど正確な、大量の」を意味するからね。
「何回繰り返しても正確な結果を出す」みたいなことのアナロジーにも使える。
あいつはまるで精密機械だ、って感じにだ。
だから、「ビッグデータによる機械学習」は、
「大量に、正確な、辞書や百科事典をさらに強化したような、
絶対間違わないデータをそろえた学習」
だと勘違いさせているのではないか?ってちょっと思ったのね。
実際にそのような意味はなくて、
マシンラーニングの直訳なんだよね。
マシンというのは、コンピュータが、という意味だ。
もう少しいうと、
自動データベース更新なんてのも機械学習かもしれないけど、
これらはデータベースと呼ばれる。
マシンラーニングには入らない。
今のAIの文脈での機械学習は、
ニューラルネットワークを用いた学習を意味していて、
決してデータベース的な登録と削除と上書きを意味しない。
ところが、このニューラルネットワークの学習の様式を知らないと、
データベース的な学習だと勘違いして、
つまり精密機械をイメージして、
誤解することがままある。
「人工知能はいずれ全世界を学習してしまう」とか、
「私の人格を学習している」など、
AIに対する恐れはこのことからきていると思う。
だが実際には、
AIのニューラルネットワークは、LLMを基本アルゴリズムとしている。
それはつまり、確率的な学習しかしていないことになる。
何かと何かは結合率○%である、の大規模なやつにすぎない。
知識や学習というものは、これとこれは100%正しい、
これとこれは0%である、
というふうにありなしで存在する。
0と1しか知らなかったコンピュータのイメージで見ると、
この01が知っていることと知らないこと、
という風にイメージしてしまいがち。
しかしLLMによる学習は、
○%という結合率による学習である。
アマゾンのある商品を買ったら、
この商品を買った人はこれも買っています、
という程度の確率論をもっとおばけにしたもの、
と思うのが一番正しいと思う。
実際には単語単位、語単位、文単位、文章単位、問答単位などで、
溶け合った確率雲としてネットワーク内に持っているわけ。
「ただしさ」が保証されるのは、文法的な正しさくらいじゃない?
それもたまに間違うこともあるかもしれないね。
知らないことをAIに聞くと、
かなり自信満々で答えを返してくれる。
その自信っぷりから、きっと正しいのだろう、
と思い込んでしまう。
だけど、良く知っていることをAIに聞いてみるといい。
だいぶ間違っていることを答えてくる。
先日も、「薙刀式の作者は誰?」と統計を取ってみたら、
9回聞いて3回しか正解しなかった。
2回はブログ不明になり、
1回は「新・落とし穴」で公開されているという、
聞いたこともないブログ名を答えた。
2回は大城泰造で「大城泰造のブログ」で公開と答え、
1回は大木氏が「大木のブログ」で公開と答えている。
確率的挙動、と僕が言う意味が解るだろう。
つまりは量子コンピュータの挙動に近いということだ。
量子コンピュータは量子効果をつかって計算する機械だが、
量子効果があるので、毎回シュレディンガーの猫の挙動を取る。
つまり、計算させているのに毎回違う答えを出してくる。
それがあっているかどうかは、人間が検算するんですって。
人間が検算しなくてもノイマン型コンピュータに検算させる手もある。
なぜなら、答えが分っている計算は、ノイマン型でも検算できるからだ。
で、もっとざっくりした検算のめどは、
何回も計算させて、一番多かった答えだと目測をつけるらしい。
薙刀式の作者は?という10の問題に対して、
3/9という確率で大岡俊彦だから、「大岡俊彦です」
と答えるようなアルゴリズムになるわけ。
そんなもの、学習でもなんでもないよね。
学習というのは、100%になるまで鍛え上げたもので、
一度マスターしたら二度と間違わない、
忘れてたら別だけど、というものであるはずだ。
機械というイメージは、
常に最新の形容をされてきた。
精密機械は、第一産業革命の結果、到達した最新機械のイメージだ。
情報革命が起こっても、基本的にはこの機械の挙動をイメージしてきた。
顧客情報や売上帳は、このイメージの機械にやらせていることである。
だけどAI革命が、機械というものを、次の段階に押し上げた。
量子力学的な、確率的な挙動をする機械としてだ。
おそらく、両者の機械を同じマシンとしてイメージできないと思う。
アーキテクチャが違いすぎるからね。
確率的に回転数が上がるエンジンなんて、危なかしくて、運転できるかよ。
毎回同じ挙動を取るから、こっちも命を預けられるんだよ。
確率的にしか来ない電車をあてにして、朝早い移動なんてできるかよ。
つまり、機械学習という名前は、機械のイメージが上書きされるまで、
上書きされることはなく、
昔日の機械のイメージで語られるかぎり、
誤解され続けるだろうということだ。
AI学習、ニューラル学習、LLM的学習、
などと名前を変えるべきだ。
そうすれば、
「AIは確率でしか動いていない」ということがよくわかるというものだ。
GoogleのAI検索はまじで迷惑だ。
間違っていることがかなりある。
これで被害を被った人もいるかもしれないし、
被害と気づかないまま、
知識がまちがって更新されている人もいるかもしれない。
文化に与えた損害は、かなりの被害額だと僕は思っている。
もっとも、バカなら、まったく気づかない、
というのがこの問題の厄介なところだ。
僕はAIがこわい。
バカがあってると判断するケースが続出することがね。
2026年03月01日
この記事へのコメント
コメントを書く
この記事へのトラックバック

