2022年11月19日

【薙刀式】自キ界隈で文字配列が発明されない理由

みんなあれだけキーマップをいじって、
色々な新しい物理動線を開拓してるというのに、
そういえば自キ界隈から新しい論理配列が、
あまり提案されてこない。

Eucalynは自キブーム前からあったし、
Harmony、オオニシ配列(仮)くらいかな。
それもローマ字英字共用で、日本語専門はなかったと思う。



大きく分けると、
自キ界隈で、文字配列が自作されない理由は二つあると思う。


ひとつには、
自キ使用者にエンジニアが多いこと。
プログラミングや英語ドキュメント用に英字、
コメントや日本語ドキュメント用にローマ字、
と両方必要なため、
日本語専門配列はあまり歓迎されないのかも。

それよりも大きな要素としては、
「ショートカットはqwertyを前提としている」点かな。
ZXCV、QASあたりだけではなく、
色々なエディタや環境(Vim、emacsなど)によって、
よく使うショートカットがずれるのはちょっとなあ、
と思っている人が多いと思う。

僕は、英語はqwertyで、
日本語は専用配列で、
などと考えているが、
うーん、それほど日本語に執念がないし、
という人が多いのかもね。

もちろん、日本語を重視する人はそこそこいるけど、
そういう人はなぜかJP配列ないの?になってしまう。
いや、変換無変換全角半角ほしいか?
などと僕は思ってしまうが、
US印字の見た目から、
これはUS配列→日本語向きじゃないと、
反射的に判断してるのだろう。
いや、それはもはやUSを離れた独自配列なんだけど、
「JPじゃないのはUS」みたいに見えてるかもね。

で、じゃあ日本語専門の人は、
親指シフトなどを使うかというと使ってなくて、
99%はqwertyローマ字だと思う(観測範囲)。

Eucalynが数例から30の間くらい、
Dvorakが数例、Colemakが数例、tomisukeが数例、
親指シフトが数例、飛鳥が一例、
薙刀式が10弱(僕の熱心な普及活動もあり)、
といったところだろうか。

特にカナ配列を訓練するだけの必要性と習得するモチベと、
自作キーボードを作ったり改造したりするモチベの、
両方の熱心さを持つ人はまあレアというべきなのかもしれない。



二つ目の理由としては、
文字配列設計には独特の知識が必要だから、
だと思う。

まず文字の単体使用頻度(1gram統計)を、
手に入れなければならない。

以前はDvorakJPのページにアップされていたが、
いつの間にか404になってしまったので、
手軽に英語とローマ字の使用頻度を入手できなくなってしまった。
また、2gram、3gram…の連接頻度は、
特に転がってないんだよな。
英語は調べてない。ローマ字のそれは、関心がないのだろうか?

カナ配列設計者は、
141Fさんの10万字統計や、
kouyさんの100万字統計を使用している。
とくにkouyさんのものの、2gram統計を僕はよく参考にしている。
カナの二連接はアルペジオを重視する運指設計に、
とても必要だ。

長年やってると、ああこの連接はこれくらいの頻度だな、
なんてことが感覚として身につくからいいんだけど、
右も左も分からない人は、
頻出連接100で考えればいいと思う。

あるいは、打鍵理論もあるよね。
「どういう運指が『良い』のか?『悪い』のか?」
については沢山の仮説や検証がある。

左右交互打鍵は良い、
アルペジオ打鍵が良い
(外→内、内→外の速さは指によって異なる)、
同指連打は遅い、
とくに段越えは遅い、
などなどの経験則から、
ある程度の方向性はあるけれど、
バッティングしたときにどれくらいの比率になるかは、
「打ってみた感じ」が決めるからなあ。

機械的な評価関数もいくつかあるけれど、
その基礎になる理論が確立されたわけではないし、
パラメータチューニングの根拠はカンだしなあ。

個人の手による評価は、
万人の手の平均からどれくらいずれてるかも不明だ。
平均を取り平均でやれば平均的なものになるかもしれないし、
ある程度「こういう手のタイプ」があるかもしれないから、
この手のタイプはこのような評価になる、
みたいな傾向があるかどうかすら、
まだわかってない。


一応僕の計測だが、30×30キーの二連接について、
すべての900パターンを測定したデータはあるので、
貼っておく。
http://oookaworks.seesaa.net/article/490739021.html?1668828864


なので、
「分からないところだらけで、
なんとなくの理論のまま手作業で作っていく」
ことが配列設計の現在地だと思うんだよね。

で結局それには、
日本語のたくさんの知識と経験が必要な気がする。

そこと、「自作キーボードやってみたい!」
という層の、重なりがあまりないのだと思う。


僕なんかはヘンテコで、
小説を書きたい→論理配列を作る→物理キーボードも最高にしたい
という目的ドリブンだから具体は沢山変わっていくのだが、
物理キーボードから入った人は、
目的が異なるだろうからね。

でも、
「配列には興味があるけど、
どこから手を出していいのか分からない」
という人は沢山いそうな気がするんだよな。

そういう人には「薙刀式がベスト」かどうかはわからんので、
色々調べてねというしかないんだよなあ。
とりあえずEucalyn、新JIS、月を勧めてるけど。



そもそもqwertyに問題を感じないと、
配列に興味を持たないかもしれない。
また、qwerty以外に配列がたくさんあることすら、
認知されていない可能性がある。

なので僕はイベント用に、
薙刀式の印字キーキャップを作りたいのだが、
配列が確定していないという罠がある…
(薙刀式Tシャツ作ったんだけど、
そこに印字されてるやつはv14と15の間に生まれた、
今使ってないバージョンなんよね…)


配列を変えよう。
しかしどのようにすれば分からない。
自キの民ならば、keymap.cをいじる事はできるけど、
具体的な設計理論を知らないのではないだろうか。
だから配列何も分からんになるんだろうなあ。

そうした配列設計の基本みたいな記事、
アドカレで書いても怒られないかしら。
暇ならやってみたい。
posted by おおおかとしひこ at 13:02| Comment(4) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
ご無沙汰しております。
ブリ中トロ配列のリポジトリに、1-gram, 2-gram の頻度表と定量評価ツールを置いてあります。
コーパスはBCCWJ(全体で1億430万語)です。
https://github.com/mobitan/chutoro/tree/main/tools

実は去年、もっとしっかりした開発支援ツールを作りかけたんですけど、2-gramの元データがダウンロードできなくなったりして頓挫しています。
https://github.com/mobitan/kana_arranger

こないだ国語研のワークショップで聞いてみたら、共同研究を申請すればコーパスを自由に使えるらしいです。
https://www.ninjal.ac.jp/research/cfp/#JUP
Posted by mobitan at 2022年12月03日 03:20
>mobitanさん

もろもろ情報ありがとうございます。
そのツール群が何をするためのもので、
何を食わせたら何が出てくるのかわからんのですが、
分かる人には使える道具のような気がします。
(そもそもgithubの使い方がわからん)

もちろんプログラミング使える人は使えばいいと思うけど、
そもそも配列設計において必要なのは、
その統計結果をどう利用するかからだと思うので、
もっと単純な結果があればいいだけなのになあ。
機械計算しない配列設計だと完全手作業だから、
わかりやすい頻度表さえあれば、
もっと配列作りをやる人が増えると思いますね。

ぱっと検索して引っ掛かるのは精々1gramだから、
もっとNgramがゴロゴロ転がってる環境になりたい。

そもそもコーパスとかgramとかの専門用語を使わなくても、
配列づくりができるようになるべきだと思うんです。
コーパスを見てる人はBSやカーソルキーの頻度を見てないし。
Posted by おおおかとしひこ at 2022年12月03日 08:23
なるほど。こうして見れるようにしたほうが親切でしたね。

頻度表 https://mobitan.github.io/kana_arranger/freq-list.html
連接頻度表 https://mobitan.github.io/kana_arranger/freq-table-bccwj.html

Posted by mobitan at 2022年12月04日 02:20
>mobitanさん

さっそくありがとうございます。
こういうものが、
配列をつくるための基礎データだと広く知られると、
「現行配列は不条理では?」
「では条理とはなんやろ?」
と思う人が出てくると思うんですよね。
Posted by おおおかとしひこ at 2022年12月04日 18:04
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック