次の300熟語を同様にマッピングしてみた。
1-300と重ねるとごちゃごちゃになりすぎるので、
2枚目のレイヤーということで、
1-300と重ねることを想定している。
なお青丸で囲んだ字は、1枚目と共通の位置。
予想としては、
1-300のネットワークが、
より複雑に、関係性が増えてくるだろう、
と考えていたので、
大体予想通りになる。
なので、最終的にはこれらを全部まとめて整理できた図が、
欲しいと考えている。
(グラフ作図問題的な話だけど、
たぶん平面にきれいには書けないだろうから、
なるべく分かりやすくでしかないだろう)
興味深いのは、
wikiだから、という傾向があるのは承知していたが、
それでも「漢字熟語というものはどのようにつくられたか」
が如実に現れてる感じがすること。
周知のとおり、
多くの熟語は明治期に、
西洋に追いつかんとしてつくられた。
(それが出来が良いから中国にも逆輸入されているそうだ)
それがwikiの頻度にもわりと現れてて興味深い。
まず1-300では、
国家、政治機構、学問、戦争、組織、軍隊、建築、機械、
の分野がとても多かった。
産業革命を経て、近代国家が成立して、
富国強兵して、世界大戦へと進む時代に、
たくさん熟語がつくられたんだなーとよくわかる。
(これで近代史と絡めて論文すら書けそう!)
次の301-600では、
物語や言葉、映画や音楽の、文化的なものが増える。
産業関係の言葉も豊かになる。
鉄道、道路関係も増える。
また、電気関係が増えてゆく。
なるほど、電気系は建築機械の次の時代の産業だ。
土地関係の言葉が急に増える。一段下と思われてるのだろうか。
漁業農業植物系は、まだほとんど見えない。
工業優先だったんだなーとよくわかる。
こうした日本人の無意識の歴史みたいなことが、
熟語に刻まれている感じがして、
めちゃくちゃおもしろいと思ったな。
また、文化系では、
新聞、雑誌系がまず多く、熟語と紙面の関係性を思わせる。
つまり印刷と運送は近代が生んだものだなーと。
新聞はまだ近代をやってるんだな、とか。
写真、映像系はこれに次ぐ。
映像系になるとカタカナ語が増えるだろうから、
演劇と共通部分が熟語として残る感じ。
なるほど、文化と漢字の蜜月期があるようだ。
意外と配信、通信系がここにランクインしてきて、
インターネッツならではかもしれない。
あと傾向としておもしろいのは、
大のほうが小より、
長のほうが短より、
勝のほうが負より、
加のほうが減より、
よく使われていること。
反対語の概念ではあるが、
増えよ地に満ちよという生物の特徴を示しているように思う。
また、集合を示す言葉、
会社や社会関係の言葉もとても多い。
慣習のムラ社会から、近代の契約関係に移行したときに、
熟語がたくさん作られたのではないか?
あと固有名詞ね。
1-300では国家単位、大都市であった。
日本、中国、東京、大阪、京都、明治、大正、昭和、平成。
301-600になると、地方都市、周辺国が入ってくる。
米国、韓国、台湾、横浜、古屋(名古屋の一部であろう)、
沖縄、奈川(神奈川の一部であろう)、福岡、九州、欧州、
千葉、愛知、神戸、関東、東北。
これらの固有名詞ぐらいは、
漢直でスムーズに打てた方がいいよね?
なんてことに気づく。
熟語とはなにか?
という本質に少し迫れたかもしれない。
僕が漢直配列に求めることは、
このようにして、
「漢字をどう整理したか」という設計思想だ。
それがどの漢直にも記録がないので、
「ランダムな文字列を力づくで覚えろ」
という乱暴なものに見えている。
薙刀式が、カナとは言葉を編むものであるから、
言葉とはどのようなことをするためにあるのか、
すなわち主張である、
などのように整理しなおしたのと同様の、
「整理」という知性を見たいのだが、
どうも先行する漢直にそれが見当たらない。
(あったら教えてください。
奏コードのアルペジオには興味あるのだが、
概念とは関係なさそう)
で、ないからつくったろ、なのか、
「そもそもこういうものである」
を少なくとも調べたいのだ。
601-900くらいまで2gramを調査したら、
次は3gramを見てみるかな。
たとえば「被害」と「被害者」の関係とかね。
「者」は3gramが沢山ありそう。
また、訓読みと和語の関係はどう調査するのがいいだろう?
悩ましいぜ。
2025年02月14日
この記事へのコメント
コメントを書く
この記事へのトラックバック