次の薙刀式の動画の為に基礎資料をつくっとこ、
なんてつくってみたら、
案外面白かったので、ここで議論してみたい。
50音と頻度について。
まずはなんの変哲もない50音の表だ。
薙刀式で使うカナを扱うため、
長音、句読点、促音を選んでおいた。
これらの頻度と、文字の級数の平方根を一致させる。
つまり、
文字の面積と頻度が比例するようにすると、こうなる。
濁音、半濁音、小書きを清音に含めている。
「い」「う」「ん」が大きくなるのは予想していたが、
濁音の頻度が高い、
「か」「し」「た」「て」「と」あたりも結構主張してくる。
「は」「の」「な」「ま」「よ」「も」あたりもなかなか。
「よ」は小の「ょ」のほうが頻度が高い、珍しいカナだ。
で、この二つを重ね合わせたのが以下。
50音の表は便宜上並べてあるだけだと分っているが、
実際に頻度と合わせてみてみると、
こんなに頻度がばらばらのものを便宜で並べているんだなあ、
ということがよくわかる。
一番頻度が低い「ぬ」なんて見えないよ。
そして私家版で迷っている、「ね」「む」「ぬ」なんて、
ノミの部分なんだなあ、ってこともよくわかる。
「ー」なんか頻度としてはこんなに大したことないのに、
カタカナ語では最頻出のカナに化けてしまうのは、
なんだか理不尽だなあ。
これほどまでに、カナというのはばらつきがあるんだなあ、と、
視覚で理解できる。
50音表って実用の表ではなくて、学者のためのものでしかないんだなあ。
ていうか、なんで今までこういうものを誰もつくってこなかったんだ?
文字の頻度に比例した大きさの文字ブロックがあれば、
それを並び変えるようにして考えを詰めていけば、
配列設計も楽だったかもしれないのに……。
(大規模な文字統計が、
141Fさんやkouyさんによるものまで、
なかったのかもしれない。
ちなみに上の頻度は計算の楽な141Fさんの10万字統計から)
で、薙刀式(配列は、完成版からねむぬを動かした私家版)
を視覚化してみたのがこちら。
ううむ。見事に中央にデカイ文字が集中しておるわ。
J位置の「あ」は頻度的にはこんなに貧弱であるが、
第一の文字がここにあることは、薙刀式の看板のような考え方だ。
その代わり濁点をJにおいてあることで、頻度調整をしている。
濁点はJのほうが圧倒的に大きく、「い」くらいの大きさであることがわかる。
なるほど、Jを一番使う配列になっているわけだね。
とくに目立つのはBSとエンターであろう。
僕のタイプカウンターの数字から、
それぞれ8%程度と見積もった。
これはそうとうデカイ。
いうんとか言ってる場合ではないくらいだ。
こんなにデカイキーをデフォルトのままにしているのは、
やはりおかしいと思うなあ。
(もちろん人によってはもっと低い頻度でしか、
BSやエンターを使わないという人もいるだろうが、
それでも2%ってことはないだろう)
ちなみに省略したが、
スペースキーはもっと使う。
シフト用としてだ。
変換としてのスペースの頻度が測定できていないため、見送らざるを得なかった。
上の図は左右対称格子配列でつくったが、
薙刀式はもともと左ロウスタッガードでつくられた。
なので右手人差し指伸ばし下段(N)をわりと使い、
左手人差し指伸ばし下段(B)をあまり使わないような、
非対称性がある。
あるいは、左薬指は、中段よりも上段を使う。
これは「き」のよくある連接「てき」「きて」「でき」を、
アルペジオで打つためだったりする。
あと何故か小指中段は、単打よりもシフト文字のほうが大きい。
単打をアルペジオなどで使うためなんだけど。
また、シフト文字の中では頻度の高い、「の」「ま」を、
FJのシフトに置いていて、
人差し指重視の設計思想が垣間見える。
面積が頻度に一対一対応していると、
どれをどれだけ使うか、
とても直観的でわかりやすい。
他の配列でもこれをつくろうと思ったが、
濁音、半濁音、小書き同置の配列用に頻度を換算してしまったので、
他を再計算するのがたいへんめんどうだ……。
薙刀式は頻度計算が楽なことよ。
で、これだけ均整がとれていて、
なおかつアルペジオなどによくつながり、
なおかつ清濁小拗外同置って、よく考えれば薙刀式すごい。
どうやってそんなに整理できたのか分らない。
もう一回やれと言われても無理だと思う……
余裕があったら、他の配列でもつくってみるかも。
2021年08月08日
この記事へのコメント
コメントを書く