https://note.com/myomyomyo4256/n/n96e151037b28
これ、単打面片手連接が、
どれだけ頻出連接をカバーしているか、
という調査でいいのかな。
連接には色々ある。
2連接でいっても、右右、左左、左右、右左と、
4パターンある。
左右交互打鍵がよいのだ、などと従来言われてきたが、
実際のところは片手連続のうち、
とても速くて楽な連接と、全然ダメな悪運指があることが分かっている。
おそらくこの調査は、
アルペジオ(片手連続のうち良運指のもの)を定義しにくいため、
「よく出る連接なら良運指に仕込んでるやろ」という期待のもとに、
単打面の片手連続が頻出連接をカバーしている率を、
調査したものだと思われる。
で、2連接だけじゃなくて、
さらに片手3連接も、という感じかな。
調査につかった連接資料が、
「WIKIであることから、である調が多め」という偏差と、
「漢字をのぞいたひらがなの連接」という偏差があることに注意。
文体の偏りはある程度仕方ないが、
カナ配列の設計には、
漢字熟語を打ちやすくするための連接も想定されているから、
漢字以外だけで勝負するのはどうなんやろ。
(ちなみにkouyさんの100万字統計でやってみたらまただいぶ変わるかもしれない。
5gramくらいまであったはず)
でも試みとしてはなかなか興味深いので、
薙刀式を中心に見ていくか。
薙刀式の面白いところは、
カバー数が少ない、
つまり連接パターンを多く単打面に採用していないにも関わらず、
カバー率、つまり統計的な総和が大きいことだ。
つまり、「よく使う奴だけに厳選しておいてある」
ということが言える。
まんべんなく置いていては、キー面(実に27しかない)
が足りなくなるから、
下のほうはカットして、上の方だけに残存したものだ、
ということが言えるだろう。
で、僕は右利きなので、
右手を多く使うように設計されている。
案外2連接ではトップ200以外は左右がそろっているのに驚いたが、
それ以外では右手の連接が多いのはまあ設計通り。
3連接ではさらにその傾向が強まり、
右手しか3連接したくない、という意思が伝わって来る。
これは、僕が左手が苦手で、なるべく連続したくない、
ということの意思の表れのような気がする。
「連接しても2回まで」と無意識に思っているようだ。
そのかわり、
「右手なら3連接しても出来るよね?」と思っている、
という感じかな。
興味深いのは、他の配列だ。
実のところ、僕から見て、
「これはマスターしにくい配列だ」
と思う配列と、
「これは使いやすい」と思う配列に、
はっきりと二分されていることに気づいた。
JISカナ、新JIS、親指シフト、新下駄が第一グループ。
飛鳥、ことのはが第二グループ、
(のにいるとは配列図が複雑すぎてよく理解していない)
二つの差を分けるのは、
上で述べた「左手連続を使わずに、
使うなら右手連続のみとする」という点だと思う。
僕にとっては、「左右のバランスが取れている」のは、
「左手に負荷が大きすぎる」ととらえているようだ。
新下駄も左手が苦手で挫折したし、
親指シフトも左手が納得いかなかったし、
新JISも左手の「して」とか「こと」とかが苦手だった。
なんか気に食わないなー、という無意識の裏には、
左手連続2連接、3連接が多かったから、
しかもよくあるやつを打たされていたから、
ということが言えそうだ。
逆に、飛鳥に僕が共感値が高いのは、
右手を連続させることに注力しているからかもしれない。
ことのははsvalkeyboardを打ったことがないから、
実感としては想像しにくいんだけど、
でも右手に連接が多そうだなあ、と思った記憶がある。
「手の感覚」というのはとても大事で、
単打頻度(単純なヒートマップ)では測れないなあ、
と思っていたのだが、
連接も評価に入れるとこの無意識を客観的に測れるかもしれない。
左手連続を嫌いながらも、左手は1文字なら打つ、
みたいなことができるはずで、
それを薙刀式や飛鳥やことのはが採用している、
と考えられる。
JISカナは濁点の阿呆さと小指外のあまりにもの多さに切れて、
すぐに触るのをやめたけど、
それでも使っていたら、左手連続が多すぎて、
もっと切れてたかもしれないなあ。
左手を連続してもいいか?よくないか?
というのは、利き手と非利き手の差が開いているか?
という問いでもあろう。
僕は自分の左手が自分の右手の1/1000くらいしか器用じゃないと思っているので、
開きがかなりある方じゃないかと自覚している。
右手が器用じゃない人は、右手と左手の格差はあまりなくて、
新下駄や親指シフトを受け入れやすいのかもしれないなあ、
と想像した。
清濁別置のようなマスターが難しいものでなければ、
僕は飛鳥使いになっていたかもしれないなあ。
飛鳥理論が複雑すぎたよな。
完成版の飛鳥のみ取り出して、全カナの位置の意味の解説を聞きたかったなあ。
そしたら、ひょっとしたら薙刀式は誕生しなかったかもしれない。
(まあ30キーに入っていない段階で使いこなせたかは知らないけど)
全然違う方向からのアプローチで、
なかなか興味深い調査であった。
基礎研究のデータ集めのような資料だ。
月やシン蜂蜜小梅も見たかったが、
とりあえずおつかれさまでした。
2025年01月23日
この記事へのトラックバック
>どれだけ頻出連接をカバーしているか、
>という調査でいいのかな。
はい、概ねその通りです。
単打面のみだと集計できない部分もあったので、ことのは以外にはいくつかの条件をつけました。
この調査方法には欠点も多いですが、なかなか面白いデータが取れたと思います。
漢字を含んでいない理由は、文章の6割から7割がひらがなで構成されているので、あえてそこを重点的に調べようと思ったからです。
時間に余裕があれば、他の配列や漢字込みのグラフを作るかもしれません。
>基礎研究のデータ集めのような資料だ。
これもその通りです。
今後何かに使えたらいいな〜と考えて積み重ねのひとつとして掲載しました。
特に「論理配列に興味があるけど、右も左も分からない……」といった方にも分かりやすいように作りました。
誰かが何かしらのワードで検索してこの記事にたどり着いたとき、少しでも役に立てそうな情報を提供できたらな〜と。
なるほどー。
最近ググっても昔の記事が消えてたりして、
貴重な記事になるかもですね。
漢字込みはできれば見てみたいなー…
やるとすれば、漢字(ひらがな化)2連接データベースには拗音と長音符が115種類、3連接データベースには139種類含まれているので、ことのは以外の配列は今回と同じく全てのシフト面や同時打鍵込みの集計条件でいけそうです。
ことのはのみ拗音面と記号面を追加することになりますね。
あとは拗音の入力判定をどうするかです。
今回は「しょ」「きゅ」などの形だけでなく「ょう」「ゃん」「ゅう」といった入力に対応するため、どの配列でも連続で2文字書ければOKとしていました。
漢字込みとなると「しゅう」「いじょ」「っきょ」などを全てちゃんと書けていないとダメとするか、前回と同様に連続2文字で良しとするか難しいですね……。
個人的には、漢字込みのデータベースに照らし合わせるのであれば、全て入力できなければ不可にしたほうがいいと思うのですが……悩みどころです。
手作業とはお疲れ様です……なんかスクリプトを組んでるのかと思ってた……
誰か組める人、引き継いで!
色んな条件変えて検証することもできるでしょ!
拗音混じりの連接の入力判定については、「前回のように様々な入力方法を尊重した集計(部分一致)」と「完全一致以外認めない集計(完全一致)」の2パターンを用意します。
部分一致は前回の調査以上に正確性が犠牲になりますが、完全一致も用意することで参考値としての公平性を保てるんじゃないかと考えました。
いつ完成するか分かりませんが、でき次第ご連絡いたします。
月配列のグラフ作成は可能です。
ですが、シン蜂蜜小梅配列は配列図を見ても一部の入力が理解できませんでした。左右の分け方についても自信がないのでグラフ制作不可ということで……。
それと、新下駄配列の全てのグラフに誤りがあったため修正しました。
原因は右手側で集計されるはずのデータが左手側に混ざっていたことと、一部データに重複と欠落があったためです。
これによって、左手側のカバー数が本来の数値とはかけ離れた値になり、左右のバランスが異常な割合になってしまいました。
誤った情報を提供してご迷惑をおかけしたことを深くお詫び申し上げます。
もう一点付け加えますと、修正後のグラフは「左右のバランスが取れている」ので、「左手に負荷が大きすぎる」と感じる点に変わりはないと思われます。
シン蜂蜜小梅は拗音(と外来音)の8×3マトリックスがちょっとややこしいですよね。
右手のイ段カナと左手のヤイユエヨを組み合わせ、
ただし上中下段で、右手の単打面、左親指面、右親指面の指定、
と理解すると大丈夫かと。
原型の蜂蜜小梅のアーカイブがわかりやすいのでは。
http://8x3koume.na.coocan.jp/8x3koume256/index.html
ただこれが右手なのか左手とするかはなんとも。
2週間くらいで月配列とシン蜂蜜小梅配列のデータが完成すると思います。
掲載については制作者さんに許可を貰ってからになります。
おつかれさまです。
月配列は2-263に関しては読み人知らず状態なので、
シン蜂蜜小梅の141Fさんしか追いかけられないと思います。
2ちゃんねる発祥ですからさすがに制作者さんの特定は不可能ですし、実質フリー素材のようなところがありますね!
おまけでことのは以外の単打面データも追加しました。
漢字カタカナ込みのデータは3月から4月頃に完成すると思います。