2023年05月22日

【薙刀式】混ぜ書き変換の原理

おお、なんか混ぜ書き変換が動いてる。
https://twitter.com/kanchokker/status/1660213400562196485?s=20


実装はGoogle日本語らしい。
乱暴に言うと、
全混ぜ書きパターンを辞書登録してるわけだ。

なるほどこれなら、
一部漢字一部ひらがなでも変換できて、
かなり便利になりそう。

さらに部首合成も似たようなアルゴリズムで実装してるらしく、
ふむふむ、と思う。

で、
混ぜ書きってDvorakJでも出来るよ、
というメモをしておく。


DvorakJでは出力する文字に漢字をそもそも選べるので
(薙刀式の固有名詞モードや、編集モードの記号部分はそれで実装)、
いきなりひらがな漢字を混在でIMEに渡せる。

僕はこれを利用して薙刀漢直を作ろうとしたけど、
入力パターンが多すぎて、
漢字を絞る段階で止まっている。

これはqmk_firmwareからは出来なくて
(US前提なので2バイト文字がそもそも送れず、
単キーコードしか送れない、で理解はあってるかしら。
Unicodeを送れないかと思ったんだが、
受け側を何で受けるかもありそうで、
よく分からず調べていない)、
それゆえqmk薙刀式では記号部分を直送りできず、
wincompose経由を選んでいる。

で、
なんかわからんがDvorakJからは漢字ひらがな半角文字、
なんでもIMEに送れるので、
これを利用すればいけるはず。
(カタカナだけはひらがなになってしまう。なんでやろ)


膨大な混ぜ書き辞書を作る苦労は想像に余りある。
漢字をIMEにそもそも渡せれば、
変換は結構うまくいくのでは。
(IMEは読みに再変換してまた変換するのかしら)



そうそう、
「片手の2キー押しながら、逆手の2キーを順次押し」
(編集モードを拡張しようとしている)
がうまく実装できないので、
途中で止まってたことを思い出した。

それぞれアルファベットはそのキーのコードとして、
+D+F-J+D+F[
でも、
+D+F-J[
でも、
「DFを押しながら、Jの次に何かを押す」がダメだったんよなあ。

どなたかDvorakJでこれに成功した人がいたら、
ソースコード教えてください。


辞書登録方式以外にも、
うまくIMEへ漢字が送れたらいいのだが、
Google日本語だとまた仕様が違うのかな。
(上の話は全てMS-IMEで確認です)
posted by おおおかとしひこ at 13:29| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック