2025年04月25日

【薙刀式】膠着語母音省略

とでも呼ぶやり方をラクダエンさんが考え始めている。
https://x.com/catfist/status/1915547192947015876
実際の挙動をシミュレートしてみる。


挙動はライブ変換的になるということ?

入力: atuku
仮表示: 熱く
続き候補: ない して なる 語る …

みたいに続き候補窓があればいいのかね。
これで続きの字を決まり字で選べばいいのかしら。

入力: atukun
仮表示: 熱くn
続き候補: ない なる ならない なれ

入力: atukunai
仮表示: 熱くない
続き候補: わけがない と 情熱 お湯

入力: atukunait
仮表示: 熱くないと
続き候補: は いう おかしい の

入力: atukunaith
仮表示: 熱くないとは
続き候補: 言ってない 言っても ありえない

入力: atukunaithitt
仮表示: 熱くないとは言って
続き候補: ない も る た ね なの 、

入力: atukunaithittm
仮表示: 熱くないとは言っても
続き候補: 実は違う だ ねえ

入力: atukunaithittmd
仮表示: 熱くないとは言ってもだ
続き候補: よ ね ねえ が し

入力: atukunaithittmdy
仮表示: 熱くないとは言ってもだよ
続き候補: ? 。 ッ …

みたいなことだろうか。

最初に「熱く」に変換された場合をまず想像してみた。
これであってれば確定、
最初に「暑く」に変換された場合、
ここで初めて変換を押して、熱くに変える。
最初に「篤く」に変換されてもここで変換して選択か。

それとも、
「あつく」の時点で変換をかけて「熱く」を選択した時に、
続き候補が出て、
そこからは決まり字だけ入れて変換中文字列をどんどん伸ばしていく、
みたいなことかな。
続き候補にないものは普通に続きを入力(自動確定なし)して、
確定するまで変換中文字列は一括変換できる状態を保持すれば、
予測精度はどんどん上がっていきそう。


入力: atukun
仮表示: 熱くn
続き候補: ない なる ならない なれ

のときに、rを入れれば、

入力: atukun
仮表示: 熱くnr
続き候補: なる ならない なれ なれど なりました

なんかに変化して、またこの中で決まり字を選ぶ的な。


大体こんな感じかな。
これが働かないようにもしたいとすると、
予測キーを定義して明示的にこのモードに入る手もあるか。

いずれにせよ、
IME設計のレベルなのかねえ。


昔krで「これ」を打てないか、
と妄想したことがあるのだが、
かれ から くる きる
など母音省略だけだと候補たくさんあるなー、
と気づいてあきらめた。

上の方法ならば文脈依存なので、
ある程度構造的に絞れそうな気がする。


あとはライブ変換的にチラチラするのが鬱陶しいかもしれないので、
予測開始コードをたとえば*にさだめて、
atuku*naithittmdy変換
で、
暑くないとは/言ってもだよ
(文節区切りを/で示した)
と変換されて、あとはいつものように、がいいのかなー。

一意に変換されないものがあったら適宜候補から選べばいいから、
まだマシかもしれない。
上の例では、
mdyで「までよ」があるのに気づいた。
なので、「言ってもだよ」「言ってまでよ」
から選ぶ必要がある。
前からの文脈からは「言ってもだよ」だけど、
MS-IMEのレベルだと前からの文脈関係ないこと多いよなあ。


あと人間からすると、*で開始するのは難しいから、
母音省略を*で代替した瞬間からこのモードに入る、
と定めるほうが使いやすそう。
atukunait*hittmdy変換
この位置だと直感的だと思う。

このやり方だと、
繋ぎ候補に「語る」「情熱」「お湯」みたいな、
こういう文脈でよく使う動詞、名詞、縁語を入れるのは、
難しいかもな。



一意に決まるものか、検討できるのかな。
総当たりで調べるしかない?
そうでない場合、アホな候補が出るたびにイライラしそう?
posted by おおおかとしひこ at 14:24| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック