2021年11月26日

【薙刀式】濁音のあとに何が来やすいか調べた

濁音で始まる漢字の二文字目を中心に、
濁音のあとには「い」「ん」などが来やすい気がしている。
実際のところ統計的にどうなのか、調べてみた。


kouyさんの100万字統計、2gramを使用。
「濁音から何に繋がるか?」の集計。

トップ20でしめす。
漢語二文字目に来る、
いうんきくちつっが多いのではないかと予想していた。★で示す。

 1 ん 10986 ★
 2 い 9021 ★
 3 、 6401
 4 ょ 5714
 5 う 5307 ★
 6 す 4772
 7 あ 4522
 8 し 4399
 9 き 3868 ★
10 か 3491
11 っ 3434 ★
12 は 3424
13 く 3092 ★
14 の 2752
15 も 2537
16 つ 2495 ★
17 に 2217
18 ゅ 2202
19 て 2060
20 ら 1981

経験値通り、「ん」「い」が飛びぬけていた。
やっぱそうなんだなあ。
漢語の二文字目は、
もともと頻度の低い「ち」を除きランクイン。
しかし予想よりランキングは低く、
和語のものが多そうだ。


特定の二連接に偏ったものとそうでないものがあり、
一個一個抽出していくと。

 1 ん 10986 ★
げん2106 ぶん2046 ぜん 1579 だん1178 じん1129 ばん933 でん577(小計9908)
と、ほぼ漢語用だろうことが推測される。

なかでも「げん」が一位なのは意外だな。
薙刀式は「け」がかなり迷って、
初期は右手にいたり、左手にいたり、わりとさまよったカナだが、
この漢語対応で困っていた記憶もあるな。

 2 い 9021 ★
「ん」ほど漢語まみれでもないが、上位が
だい2750 がい2318 ざい1369 ばい843 でい563(小計7000)
なので、漢語が多いのは確か。
「い」というカナの性質上、和語にも繋がりやすいと思う。

 3 、 6401
が、2486 で、1910
の2トップ。その下に、
ば、612 ど、562(小計5552)
が控える。
だが、で、それで、ならば、せば、など、けど、ほど、
とかのつなぎの語が多いだろう。

 4 ょ 5714
これは圧倒的に拗音しかない。
じょ4319 ぎょ1211(小計5530)
和語は擬態語くらいしかないので、
ほぼ漢語使用と考えられる。

 5 う 5307 ★
どう 2854 ぼう661が2トップで、
あとはまんべんなく分布。
「どう」は漢語にも使うし、「どうなんだ」など和語でも多用する。
後者のほうが多い印象。
「ぼう」は意外だよね。
「ほ」の中でも「ほう」と並んで、うにつながりやすいわけだ。
「がう」「ばう」などはなんだろうと思うが、
「したがう」「あらがう」「うばう」「かばう」などの動詞終止形ならば分る。

 6 す 4772
です3497
の一強。
「です」「ます」は配列設計でもかなり初期のほうに決定するべき重要な連接だよね。
それ以外に、逆に「す」の出番ってそんなにないかもね。
薙刀式では「する」という動詞を、動詞の中核の言葉として特別に優遇、
三大アルペジオにいれている。

 7 あ 4522
であ1951 があ1623 ばあ508(小計4082)
二強は、「である」「がある」に使われる連接であろう。
薙刀式ではこの二つは異常に打ちやすくなっている。
「ばあ」はなんだろ。「場合」とかかな。

 8 し 4399
でし1233 だし595
あたりが頭抜けている。
「でした」「そうだし」「出した」みたいな使い方が多いだろう。

 9 き 3868 ★
でき1652
が抜けている。
「出来」で使われることが圧倒的に多いだろう。
薙刀式ではもちろんアルペジオだ。

10 か 3491
がか620 じか601 だか487 でか406
あたり。和語だろうか。
「がかった」「がかり」「だから」「でかい」「じかに」はこの中でも多そうだが、
このへんに来ると、
特定の言葉ではなく、頻度の波に埋もれていくのだろう。

11 っ 3434 ★
だっ814 じっ703 がっ691
「だった」「じっと」「上がった」「がっと」「がっつり」
などに使われるだろう。
漢語よりもこちらの方が多そう。

12 は 3424
では2023
の一強。

13 く 3092 ★
がく1012 ぼく387 どく360
「ぼく」は特異的にある連接だろう。
一人称がどれくらいへりくだる文章かによるけどね。
公僕や撲殺や素朴よりも使われるだろうし。

14 の 2752
どの718 での340
の二強。
「どの(名詞)」「などの」「それでの」
なんかの複合的に使われることが多い、つなぎの語同士の連携っぽいね。

15 も 2537
でも1385 ども589
の二強。圧倒的に「でも」のつなぎの語に使われているわけだ。
「ども」も複数のものに使う接尾語で、
これも薙刀式ではつなぎの語扱いしている。

16 つ 2495 ★
じつ794 がつ438
によく使われるが、全体的に分布している。
漢語メインだろう。

17 に 2217
「でに」が多いかなと思いきや、埋もれている。
まんべんなく分布している感じ。

18 ゅ 2202
じゅ2041
一強。

19 て 2060
べて347
がトップで、これもまんべんなく連接するみたい。
「じて」とかが多いかと思ったが、
つなぎの語である助詞、「て」につながりやすいことは想像できる。

20 ら 1981
がら558
が突出しているが、まんべんなくあるようだ。
「ながら」「仕事柄」などに使われて、
やはりつなぎの語っぽい使われ方をしていると予想する。



ということで、なかなか興味深い結果になったと思う。

配列設計において、
濁音の設計は同置なのか別置なのか、
清音の次に重視されて、配列の構造の別れ道になる、
重要な部分である。

濁点をつけたり、
濁音シフトにする配列では、
そのあとの展開のほうが重要だと考えたので、
濁音の前はまだ調べていない。



で、やっと本題か。
薙刀式特有の調査をしてみた。

左右に分けて、
左手の濁音キーJと、
右手の濁音キーFのあとに何か来たときに、
アルペジオになっているかどうかのチェック。

アルペジオになっているときに★をつける。
【左手+Jから】
ん 7414 ★
、 5918
ょ 5714 同時シフト
う 5152 ★
す 4477 ★
あ 4397 同鍵JJ連打
い 4602 ★
し 3376
き 3288
は 3186

上位陣はおおむね右手アルペジオになっていて、
ここが薙刀式の気持よさになっていると思われる。

【右手+Fから】
もともと濁音は圧倒的に左手に多いので、
右手カナの濁音はおまけ的になっている。
い 4530
ん 3865
け 1416 ★
っ 1282 人差し指連打
。 1236 人差し指連打
か 1008 同鍵FF連打

Jからの右手アルペジオに比べて、
あまり出来がよくない。このへんが左手だなあと思う。

その中でも「だけ」が突出して使われていて、
たしかに「け」は苦労したなあという記憶があるんだよね。
けど、だけで、あたりの前後が苦労するポイントになってるのか。

「あまり上手じゃない人は、同指連打を好む」という経験則があるから、
左手なら左人差し指連打は悪くない、
と僕が無意識で判断しているかもしれない。



もちろん、「濁音のあと」という特殊な状況下での調査だから、
それ以上の清音との矛盾や駆け引きがあると考えられる。

にしても、そんなところから見てみると、
新しい運指効率などを考えられるかもしれないなあと思った。

とくに薙刀式の左手カナの濁音(J同時押し)からのアルペジオは毎度打ちやすいので、
そこは加点ポイントになっているな。
頻度的に見ても、なかなか妥当だと思った。


ちなみに使ったエクセルファイル貼っておきます。
大元はkouyさんのファイルで、必要なところだけ抜き出して並べ直しました。
さらに詳しく見たい人はどうぞ。(開発者向け)N-gram_2_濁音のあと.ods
posted by おおおかとしひこ at 12:21| Comment(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。