2026年02月26日

【薙刀式】なんでたまに変換履歴がリセットされてんだろ(IME)

変換履歴がリセットされやすい語がある気がする。
僕の環境だと、「間隔」。


多分僕のボキャブラリーでは、間隔を使うことはそんなにない。
いつも「かんかく」から使うほうは、「感覚」のほう。
そういう感覚がある、とか、
その感覚からしたら、とか、
感覚的な表現とか。

だから、「間隔」はむしろ使わないほうのことばで、
「かんかく」から変換する例だと、100対1くらいで、
感覚なんだよね。

にも関わらず、
しばらくは「感覚」が第一候補に出ているんだけど、
少ししたらなぜか「間隔」が第一候補に出てしまう。
なんか学習がどこかでリセットされている感覚になる。

なんでだろう。
アプデのときにそれが起こりやすいことは感覚的に理解している。
でもそういうのがない時にも、
「間隔」が出る確率が上がるんだよね。


仮説として考えられるのは、
学習には限界があり、
しばらく使っていない学習効果は消えて、
現在の有限個の学習結果だけを運用する、
というモデルかなー。

だから久しぶりに「かんかく」を使うと、
「間隔」という辞書定義の第一順をだすのでは、という。

でもこれが当てはまらない単語もある気がする。
久しぶりにこの単語を変換するなー、と変換したら、
前のやつを覚えているパターンもある。
なんなんだ、何が違うのだ。

さらに考えられるモデルとしては、
メジャーな言葉とマイナーな言葉で処理を変えていて、
メジャーな言葉はしばらく使わないとリセットされて、
マイナーな言葉はずっと学習を記憶している、
という感覚かなー。

「かんかく」はメジャーな語扱いされていて、
これはしばらくするとよりメジャーな言葉の学習のために、
リセットされて元に戻る、
メジャーな言葉だから、普通こっちで使うよね、
という「配慮」?

……としか思えない挙動に、
たまにイラッと来ることがある。



百式に「感覚」と「間隔」の打ち分け、採録したろかな。
そこまで重要な語でもない気がするが……
現在の百式の収録熟語は、少し前の俺の誤変換イライラ集、
だと思えるが、
新しいイライラがあるたびに収録をしていたら、
すぐに二百式になりそうだ。

使い勝手を設計した関係で、
ひとつのキーに15漢字も入らないことが分っているので、
うーん、拡張するには逆手も許容するといいかなあ、
などとすでに次のことを考え始めている?



MS-IMEの挙動、まじで分らん。
公開してくれれば、こっちで対処法を考えられるというのに。
文字を書く重要部がブラックボックスになっているって、
頭おかしくない?


僕の環境では「間隔」がそれにあたるのだが、
他の人ではまた異なる語がそれになるのだろうか?
まったく同じ挙動ならば再現可能なのだが、
再現できないランダム性に、またイライラしてしまうね。
posted by おおおかとしひこ at 11:49| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック