2024年01月06日

【薙刀式】頻度統計という見方

Twitterから。
> 親指シフトって、日本語で頻出する音を研究して配列考えたとか言ってるけど、そんなの頻出する単語が変われば頻出する音も変わるわけでさ。
> 少なくとも、暗黒の竜騎士・冥王バルブドザレフ13世なんて名前を打つことは考えてないと思うわけよ

もちろん、
「暗黒の竜騎士・冥王バルブドザレフ13世」
が頻出する文章など考えたものでないことを念頭に、
この反論が書かれたのだろう。

ところが、
「連接」という立場からは、
このヘンテコな名詞ですら、
わりと頻度統計に従った単語なんよね。


暗黒の竜騎士・冥王バルブドザレフ13世

をひらがな化する。

あんこくのりゅうきし・めいおうばるぶどざれふ13せい

それぞれの連接を見よう。
「・」「13」はとりあえず置いておく。
(薙刀式ではこれらの連接も考えているが、
親指シフトは考えていないため)

各カナの連接順位を見てみる。
根拠はkouyさんの100万字統計2gram。
数字は出現回数。

あん 771
んこ 1118
こく 1041
くの 1291
のり 574
りゅ 501
ゅう 5998
うき 1736
きし 721

めい 1300
いお 565
おう 789
うば 233
ばる 81
るぶ 86
ぶど 38
どざ 1
ざれ 0
れふ 59

せい 4724

ざっくり1000より出るものをメジャー、
未満をマイナーとして、
メジャー連接を上段に取ると、

 んこくの ゅうき
あ    り   し

めい          せい
  おうばるぶどざれふ

という分析になろう。
「暗黒の竜騎士」「冥王」「世」
などといった言葉は、
ほぼメジャー連接単語といってよい。

一方、バルブドザレフという外国の固有名詞は、
ほぼ日本語の連接にない音の推移を持っていることがわかる。


さて、
連接のことを考えたカナ配列には、
新JIS(連続するものを左右交互に)、
新下駄配列(統計基準)、
飛鳥配列(カン)、
薙刀式(日本語で重要な語と、統計基準と、カン)
の配列がある。
(とくに設計思想の解説で細かく書いてあるのはこれくらい?
他にあったら教えてください)

親指シフトでは、
連接まで考えてカナを組んでないはずだ。
漢字熟語二文字目を右手にした以外は、
1gram頻度、つまり単純な1文字の頻度で組んであるはず。

なので、
「親指シフトでは『暗黒の竜騎士・冥王バルブドザレフ13世』が、
非常に打ちにくい」
は正しい批判だ。

ところが、上の4配列では、
バルブドザレフ以外の、
日本語でメジャーな連接を持つ言葉は、
打ちやすい部類に入るのだ。


さらに薙刀式でいえば、
こうした、
文章統計から外れがちな連接を持つ固有名詞
(文章の流れとは異なる流れをつくり、
わざと目立つことが固有名詞の特徴だろう。
だから統計と真逆の流れになるはずだ)
に関しては、
「固有名詞モード」を用意して、
固有名詞+はを押すと、
バルブドザレフが出るように登録することを推奨している。

この人物が沢山出る架空ストーリーでは、
頻出するだろうが、
出ない他の文章では全く出ない。

だから、ストーリーごとに頻出固有名詞ファイルをつくり、
都度読み込み直すことで対応している。


なので、
バルブドザレフを「は」のカナだとすれば、

うは 1384
とメジャー連接なので、

 んこくの ゅうき
あ    り   し

めい  は      せい
  おう

と、概ねメジャー連接ばかりで打ててしまう。

薙刀式に関しては問題なさそうだね。



メジャー連接を打ちやすくして、
マイナー連接よりも楽に速くすることが、
新JIS、新下駄、飛鳥、薙刀式の設計思想なので、
ほとんどの日本語はこうして打ちやすくなる工夫がある。

これに比べて、
親指シフトのような旧式、つまり1gram頻度しか考えていないものは、
打ちづらくなってしまうことが予想される。



キーボードのキーを、1個1個押すことを想定しているのは、
キーボードを打ち慣れていない人の先入観にすぎない。

キーボードを打つということは、
数キー(今の僕だと5〜7)を一気にじゃらっと打つことなので、
それに適したキーの配置、言葉の流れになっている配列が、
モダン連接配列だといえよう。

上の4配列の中では、
新JISは左右交互率が高く、
打ちやすいが最高速はアルペジオなどを使っていないので天井がある。
新下駄、飛鳥、薙刀式は片手連打のうち打ちやすく高速な、
アルペジオを多用してることで知られる。


どの連接をどんな運指に落とし込むかは、
配列の設計方針によって色々あるため、
動画で確認するのが早いだろうか。

新JISを継承した月、月光と、
新下駄、飛鳥系列であるかえであすか、薙刀式、
および親指シフトについては、
KIH2023の動画で収録してあるため、
指と言葉の対応性については、
つぶさに観察できるよ。


言葉の流れと指の流れの一致こそが、
モダンな配列の設計方針の基礎だと思う。
1gram頻度だけじゃ、太刀打ちできないよね。
posted by おおおかとしひこ at 13:31| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック