カナ漢字変換を使うかぎり、
この二つの候補は絶対に一意に確定しない。
日本のバットがある
二本のバットがある
今僕は「二本」を出したかったが、
IMEは「日本」を出した。
まあ、世界に誇る日本の職人のバットの話かもしれないが、
普通は数詞が先に出てくるだろうな。
こういう「ふつうそうですよね?」
というのはニューラルなら行くのかな?
何も前に文脈がないときは、普通二本だと思うよな。
前にイチローが渡米したときの話とか、
バットの国別の特徴を書いているならば、
日本が優先的に候補に出てくる文脈はありえる。
この差を、今のところIMEは吸収できていない。
だから毎回シュレディンガーのパチンコ候補を引くことになって、
思考に雑音が入って来るわけだ。
今ワンショット漢直では、
日本 XCV+/ 変+VZ
二本 SDF+, 変+VZ
と、ちょっと負荷の高い運指に当てられている。
ただ、「にほん」と打って変換するギャンブルと、
どっちがいいか、というキワにいる感じだな。
こういうキワの戦いを、
今やっている。
言葉ごとに、
「打てるなら漢直のほうがいい」
「これをとっさに打てるわけないから、
カナで行ったほうがいい」
がある気がしていて、
なるべく後者を削りたい。
そうすると、自然に漢直を使うようになるはず。
その、一意な気持ちよさとかをどう評価するかが難しい。
「一意」はすでに確実に漢直を使っているね。
SDF+M 変+O
なので、
シュレディンガーで「一位」や「市井」の群れの中から選ぶより、
はるかに脳に直結している。
これは、言葉ごとに異なる挙動だと思う。
たくさん打って、発見していくしかなさそうだ。
こういう検討を、
おそらくT-codeやTUT-codeはやっていないと思われるので、
手ごね方式の一番いいところ、
「煮詰める」をやっていくことにしたい。
2026年05月27日
この記事へのトラックバック


「日本のバットがある」ですね。
日本語の“普通”が多種多様すぎて、
本当の意味でニューラルにならないと、
今後もカバーしきれないかもしれないですね。
「以前にこのファイルで確定した文脈から影響をを受ける」
を実装しないと難しいと思います。
それがない場合、「ニュートラル」という文脈になり、
二本が優先、横書きなら2本もありえて、
その次に日本じゃないでしょうかね。
ちなみにエディタの縦横状態もIME側で取得できないんだよなー。
縦書きでの数字記法とか全然違うのになー。
少なくともここ100回くらい確定した候補を覚えておいて、
アメリカとか大リーグとかあれば、
日本が先に出ても誰も文句言わないけどなー。
入力範囲までしかニューラルが効かないのは、
限界が狭い気がします。
エディタとかの文字を入力できるアプリケーション自体にIMEを実装するのが、
ファイルとか、縦書き横書きの状態とか、
いろいろ簡単に連携できそうですし、
なんだかんだ言って現実的な可能性がありますね。
カナ漢字変換って、つくづく文章を書くのに向いてないですね。
なるほど、システム構成としてはそうなってるのがいいんだろうけど、
そうすると検索テキストボックスですらIMEが働かなくなるのかー。
テキストを書く場所が膨らみ過ぎたんですかねー。
その昔、一太郎というエディタの中にATOKはいたけれど、
ATOKは独立したんですよね。
エディタ内以外にも日本語を書きたくなったのと、
一太郎が非標準になったがゆえの生き残り策でもあったんでしょうね。
誰かうまい解決法を考えて……
次の候補が「ある」
以前「或」を入力した後、優先的に表示されることが多くなりました。
流れ弾が飛んできた笑
なんで「或」……
「名詞+がある」ならせめて「有る」「在る」だろうに……
どういう構文解析してるんだ……
そんなミクロのことを「学習」と呼んでるのだろうか……