岡さんの2連接データを、とりあえず上位300までを繋げてみた。
手書きでめちゃくちゃ見にくいのが申し訳ないが、
おもしろかったのでそのまま載せてみる。
まるで脳細胞のようだ。
真ん中から右上にかけて、めちゃくちゃ繋がり始めている。
そろそろ紙の限界だから、
これをもっと分かりやすく整理する段階に来てる。
部、学、国あたりが連接が多いのは、wikiっぽいね。
左下のあたりにクラスタがあって、
大戦、戦争、戦闘、戦後
みたいにまとまってて、戦争の記事多いんだろうなあ、
などと想像する。
小学校で習う字が、たくさん連接を持つのではないか?
という仮説をもって眺めてるのだが、
まだ300程度では見えてこないね。
500〜1000ぐらいになると、それぞれがもっと繋がり始めると思う。
さて、これらを15ずつのクラスタにうまく分けられるかなー。
おそらくだけど、
こんな風に「熟語を打ちやすくしよう」なんて考えた漢直はあるまい。
デジタルのデータ取りがしやすくなった現代ならでは、
の方法論だろうか。
(結局図を書いて考えるのは人間なのだが)
岡さんに感謝。
そろそろ清書して、500くらいはやってみたい。
でも予定だと500漢字くらいだから、それでおしまいなんだろうか。
それとも、「重要語」を厳選するべきか。
真の姿が見えてこないので、コツコツやるしかあるまい。
2025年02月11日
この記事へのコメント
コメントを書く
この記事へのトラックバック