Visual Studio Code上で動くアドイン、
小説アシストnovel-writerには、
小説文の中の品詞を自動色分けする機能がある。
これ、薙刀式のいうところの、
話題の語と繋ぎの語を、視覚化するのに役に立つかも、
と思ったのでやってみる。
以下の写真は公式ページのもの。これを解読してみる。
色と品詞の対応は以下かな。
ただ所々におかしな分類になってるところもあるよう。
名詞…水色
助詞…ブルーグリーン
助動詞…ピンク
動詞…マゼンタ
句読点…白
副詞…オレンジ
形容詞…紫
接続詞…出てきてないので不明
数詞…暗い紫
助数詞…暗い水色
(所々挙動が変? 国、島が入ってたり、
時間を助動詞に入れて三刻の刻が入ってないなど)
フリガナ…グレー
カッコ類…オレンジ
()…赤
「」内は色が明るくなる仕様?
で、これらのうち、
助詞、助動詞、句読点は繋ぎの語、
それ以外を話題の語として、
色分けし直してみた。
(実際には語尾部分なども含めるが、とりあえずこれらだけでやってみた)
これは一目瞭然だ。
まず元。
次に繋ぎの語だけ抽出したもの。
所々に必ず出てくることがわかる。
そして全て薙刀式ではとても打ちやすい位置にあるカナ、
アルペジオしやすいものばかりとわかる。
(単打、シフト含めてほぼ人差し指と中指)
逆に、話題の語だけを残したもの。
これだけを並べても意味がわからなくもない
(オレ、メシ、食う、みたいな、原始的な言葉になる)。
これらの「概念の塊」を、
繋ぎの語で繋いでいく、
という日本語の構造がよくわかる図となった。
さらに話題の語を白、繋ぎの語を赤でしめす。
この図の方がさらに分かりやすいかな。
さらに品詞分解だけではない、繋ぎの語と思われるものを赤にした。
これが実感に近いかな。
薙刀式がなぜ使いやすいか?
日本語の接着剤であるところの、
繋ぎの語が打ちやすいからである。
薙刀式は、
話題の語は文章によって異なるものだから、
それ自体を打ちやすくすることをメインにはあまり考えていない。
(もちろん、統計頻度による2gramはある程度打ちやすくなってはいる)
その代わり、
上の図のように定期的に、
数文字置き=ひとつの話題の語のあとに現れる、
どんな文章でも現れる繋ぎの語を、
打ちやすくしよう、という設計思想になっている。
このことで、
「思考を繋ぎやすくなる
(概念を繋ぎやすくなる)」
ことを目的としている。
これは日本語特有の構造だ。
英語における、単語間のスペースに相当するかも知れない。
英語における最頻出アルファベットは、
Eよりもスペースであろう。
だからこそUSキーボードでは、
どのアルファベットとも連接しやすいように、
あれだけの長いバーになっているわけだ。
それと同様の頻度のように、
繋ぎの語は現れる。
日本語の場合はスペース一択ではなく、
様々な種類があるというわけだ。
思ったより「た」「だ」が多いのは、
過去形で書く小説形式特有だね。
現在形で書く脚本形式や普通の文章だと、
また変わってくるだろう。
いずれにせよ、
単語(話題の語)を繋ぎの語で繋いでいく、
日本語の構造に着目して「打ちやすさ」を考えるべきでは?
と僕は思う。
2024年08月19日
この記事へのコメント
コメントを書く
この記事へのトラックバック