パラメータを変えた場合の計算例も出たよ。
https://x.com/kanchokker/status/1720464702004994505?s=20
うーむ、薙刀式は新下駄に勝てない。笑
まあでもいいところで拮抗してる感じで、
大負けしてるわけじゃないからヨシとしよう。
たとえばqwertyローマ字で計算できないのだろうか。
だいぶいいぜ、になりたいなー…
僕の小説を元にしたデータだと、
流石に薙刀式が勝つのは順当か。
元文章の偏りがあることが推測されるので。
たしか10万字〜15万字くらいだったと思うが、
カナに変換して20万字も行ってないだろうから、
大数の法則で平均化されるには、
20万字じゃ少ないのか、
それとも文体は偏り続けるのか。
(kouyさんのデータは、
様々なタイプの文章の100万字だし)
ちなみに小説文だと、
「」が結構出るんよね。
別の小説で、これも13万字くらいだったと思うけど、
「」をword内で検索させたら、
約3000回ずつ出た記憶。
6000字カギカッコだとしたら、
5%近くカギカッコを打たなきゃいけなくて、
それって拗音より出現率が高いわけだ。
薙刀式に編集モードがあってよかったなあ。
新下駄にも「」の記号はあるけど。
これがqwertyローマ字だったら、
あの辺鄙な「」を小指で取れってんだぜ、6000回。
小指の方が取れるわ。
まだ配列道に入る前だったんだけど、
「」エンター←を一連のシークエンスとして、
人差し指中指でやってて、
会話のたびにこれやるの、
無駄だなあとずっと思ってたんだよね。
おそらく小説と脚本は、
日本語文章の中で最も「」が出るタイプの文章だろう。
論文、論説文、記事、ブログなどに比べて、
語尾表現も違うんだろうなあ。
あと固有名詞ね。
特定の名前が何百回も出てくるから、
その頻度に統計が振られると思う。
なので薙刀式は固有名詞モードで対応している。
そのことによって、
特定の打鍵シークエンスで疲れないようにしてる。
なんだかんだいって、
のにいるとが健闘してるのが興味深い。
漢直と組み合わせる前提だろうけど、
かな配列としてもそこそこ戦えるのがすごい。
2023年11月04日
この記事へのトラックバック
ところで、「バーチャル俺が新配列を使ったら2」のほうで挙げられていた、
同時打鍵から単打に移行 = +20
単打2連接が同時打鍵と重複 = +40
2キー同時打鍵 = +40
SandS 同時打鍵 = +40
SandS 離し = +40
先押し後離し = +50
3キー同時打鍵 = +50
を使って計算をしてみました。この数字は、「単打を100としたときの時間」ということなので、
2連接運指時間表の900種の平均時間にそれぞれの数字を係数として掛けたものを採用してみました。
具体的には以下のような数字になります。
meanFingeringCost=6.16 # 2連接運指時間の平均
decomboShiftCost=1.23 # 同時打鍵から単打への移行コスト
preventComboCost=2.47 # 単打2連接が同時打鍵と重複している場合に、単打2連接として判定させるためのコスト
comboShiftCost=2.47 # 第2モーラが2キー同時打鍵の場合のコスト
sandsComboCost=2.47 # 第2モーラがSandS同時打鍵の場合のコスト
sandsDecomboCost=2.47 # SandS同時打鍵から単打への移行コスト
fprtComboCost=3.08 # 第2モーラが先押し後離し打鍵の場合のコスト
tripleComboCost=3.08 # 第2モーラが2キー同時打鍵の場合のコスト
このときの各配列のスコアは次のようになります。
(運指時間の左手補正なし)
薙刀式: 7.47
新下駄: 7.40
のにいると: 7.14
ちょっと「SandS同時打鍵から単打への移行コスト」が大きすぎる気もするのですが、これを 「同時打鍵から単打への移行コスト」と同じにすると、
薙刀式: 7.29
になりますね。
のにいるとの成績が良のは、たとえば「う」を裏表両面で、さらに複数箇所で定義しているからかもしれません。
定義が複数あった場合は、それらのうち最小コストになるものを選択して計算しているので。
あと、文字キー同士の同時打鍵には先押し後離しを採用しているので、これにより文字キーのロールオーバー打ちが可能になって、
preventComboCostが0になっているのも大きいかと思います。
qwertyローマ字もやってみたいですね。「しょ」=「SHO」だとして、ローマ字打ちの人は、S,H,O を微妙にずらした同時打鍵的に打ってると思うので、その辺の感覚を取り入れたいと考えています。
あと、親指シフト、月なんかもやってみたいのですが、こちらは2モーラではなくて2gramになりますね。異種格闘技戦みたいです。
大変興味深いテストをありがとうございます。
異種格闘技戦のルールづくりはいつも揉めるんですが、
UWFの分裂の理由もよくわかるというもの。笑
qwertyローマ字に関しては、
900連接の単純な連結でいいような気がします。
2モーラ評価でやるにしても、
SHOUは、
SH、HO、OUの合成でいいと思いました。
同時押しとはいえ順番があるので。
(それにある程度係数をかける?)
月配列に関してもこの方法で評価可能と考えます。
SandSに関しては先押しかつ押しっぱなしという、
比較的厳しい方法(その代わり連続シフトできる)なので、
遅めに見てもいいかなーと思っています。
でもちょっと初期係数を変えると結果が変わりそうなので、
初期値敏感性がありそう。
それにしても毎度毎度新下駄は強いなあ。
限定的な条件で勝てるのは、
自分文体のときと、SandSを軽めに見積もった時だけか…