2026年03月30日

【薙刀式】活用形の頻度ってないよね

百式で一番使ってるのはたぶん「思」なんだけど、
「思う」が多いのか「思わない」が多いのか、
それともほかの活用形が多いのか気になってきた。


「思」はNJに当ててあるのだが、
Nからの2打を打つならNMの方が打ちやすい。
にも関わらずNJになってるのは、
「思う」 NJLを打ちやすくするため。

でも「思う」という動詞を使うときに、
「思い」や「思った」の方が出るとか、
そういう統計があったらいいのになー、
なんて思った。

ひらがなの統計だと「重い」とかと区別できないから、
漢字ごとの統計かー。
ひらがなとか「想い」は無視するとすれば、
単純統計はできそうだな。

色々見てるとこの程度の統計プログラムは、
AIコーディングできそうだな。
自分の原稿と、ここのブログの文章と、
大量にサンプルはあるしなー。

特に漢字周りの統計は、
「そもそもなんのために使うの?」
があるから、そんな統計がなさそう。
漢直配列づくりに必要なんです……



そもそも既存の漢直の配字基準がわからんすぎる。
T-codeはランダム(ただし新聞頻度の参考はある)、
Phoenixは漢字コード順(おおむねあいうえお順らしい)、
しかわからん。

G-codeを調べようとしたら、パッと調べられなさそう。
https://w.atwiki.jp/japanese_keyboard_layout/pages/7.html
もずいぶんリンク切れだなー。

「にこにこ」というのは聞いたことがなかったが、
PC-98用……か……
誰も復元できなさそう……

こんな感じで、新参者には厳しすぎる世界、漢直。

なんとなく空気感的には、
「そもそもコード化が目的であり、
なめらかに高速に書いていくことへの設計」
なんてなさそうな気がするんよなー。
posted by おおおかとしひこ at 13:58| Comment(2) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
動詞の原型(走る)とかで締めくくる文章は多くないので、大事ですよね。

 ひらがなで考えると子音は何行か、というのもでてくるのでしょうけど、ひらがなに直した連接があるでしょうから、おっしゃるように漢字の切り口でまとまったサイトなりデータがあるといいですね。
 活用形まで収納したのがステノ系列だと思いますが、先日zmk版メジロ式を実装し終えたことでこれから覚える前に満足してしまいました(笑)。
Posted by @PTclown at 2026年03月31日 22:07
>@PTclownさん

カベウチドリさんがNgramカウンタを作ってくれたようなので、
それを利用して自分の文章を食わせようかなと思ってます。

「思う。」の終止形は「〜だと思う。」の形で文章にはかなり使われるので、
どんなもんやろと気になったんです。
大規模なコーパスは公的機関が取ってますが有料なので自分でやるかー的な。
Posted by おおおかとしひこ at 2026年04月01日 00:39
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック