2025年02月11日

【薙刀式】日本語の語彙

調査によるのかも知れないが、
日本語の日常語…5万語
英語の日常語…3000〜4000語
だそう。

は?めっちゃ日本語複雑なんですけど。


「日本語は複雑である」
という主張を疑う人は誰もいないが、
その理由に、
「ひらがな、カタカナ、漢字が混じるから」
というのはとても簡単な理由に過ぎず、
「英語の基礎語彙より10倍以上あるので」
のほうが大変さがわかるのでは???


https://tbski.net/english-deutsch/
によると、
必要最低語彙数(85%がわかる語彙。
出現頻度込みだと思われる)というのがあって、

イタリア語スペイン語フランス語とか、ラテン系の言語は1500とか2000語
英語は3000語
ドイツ語は5000語
日本語は10000語


ですってよ。この場合は3倍の開きかー。
しかし、ラテン系バカじゃん。
スペイン語が世界で最も話されてる言語だそうだが
(第二言語としての用途があるらしい)、
バカでも使えるから、とりあえず話すのに使えるんだろうなー。


で、英語ネイティブの人の語彙数が、
3〜5万語なんだそうです。
それでも日本語の日常語5万に比べると少なそうだ。



ちなみに、
https://www.kecl.ntt.co.jp/icl/lirg/resources/goitokusei/vocabulary_test/php/login.php
によると、
俺の語彙13万って出た。
6万とか10万のテストは受けたことあったが、
NTT研だから一応信用しよう。

同ページによると、
 【 語彙数の目安 】
中学生:20,000語〜57,000語
高校生:32,000語〜61,000語
18歳-20代:43,000語〜74,000語
30代:58,000語〜84,000語
40代:66,000語〜91,000語
50代:72,000語〜96,000語
60代:74,000語〜100,000語
70代以上:76,000語〜104,000語

らしいので、わしゃ老賢者かよ。

(テストは数分なのでやってみて。僕はテスト1〜3全部やってこの結果)

日常語とは、おおむね中高生くらいの言語っぽいな。



上と下を比較するとさ、
qwerty英語が3000語使えればいいのに対して、
薙刀式は13万語使う必要があるわけよ。
40倍のスペック(何が)が必要なわけだ。

ネイティブの英語5万語と比較しても、
僕はそもそもその2.5倍のスペックが欲しいわけ。

もちろんIMEの力を借りないと無理だし、
それを操作する体系も込みになる。



誰もこのレベルで、
日本語入力システムを設計してないのではなかろうか?

せいぜいqwertyに毛が生えたものレベルで、
キーボードを認識してるのだとしたら大変な過ちだ。

日常語で数倍、語彙数で2倍開きがあり、
文字数でも26vs2000の、
ふたつの言語を、
qwertyで仲介してるの頭おかしい。


もしこうしたことが、
キーボード設計者、IME設計者、エディタ設計者などに、
知られていないのだとしたら、
大きな前提の不足なのではないか?

そしてこのことは、
親指シフトのあたりからの50年の歴史をみても、
共通認識になってないのではと推定する。



いいから13万語のボキャブラリーをスラスラ書ける道具を出せよ。
ねえからつくってんだろうがよ。
紙とペンの手書きでしか無理じゃん。

僕はずっとキーボードに不信感を持っていた。
俺に足りてないやつが作った道具ではないかと。
不信感はようやく確信に変わったようだ。

乱暴にいうと、
僕より国語力の低い人(半分くらい?)が作ったものが、
僕が押し付けられたキーボード入力だったわけだ。
俺は頭悪すぎるとずっと怒っていたが、
なんだよ俺が頭良過ぎただけかよ。
こんなところで孤独に絶望するのかよ。



さて、
薙刀式×自作キーボードは、漢直を融合するのか。
まだ答えはわからない。




(追記)
ちなみに広辞苑の収録語数が25万語、
岩波国語辞典の収録語数が6.7万語。
俺、岩波国語辞典の倍知ってる計算かー。ほんとかな。
posted by おおおかとしひこ at 13:12| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック