2022年11月20日

【薙刀式】英語とローマ字を4gramで比較したい

英語とローマ字を同じ配列でニコイチにするべきではない、
と僕は考えているが、
それを一発で論証するには、
英語とローマ字の4gram頻度が分かれば分かる、
と思った。


前記事のカタカナ語の連接頻度から想像するに、
一文字あたりの頻度を比べたとしても、
あまり意味はないと思う。

言葉というのは「文字の流れ」のことだから、
異なる言語は、
音の流れも文字の流れも違うのだ、
を示したいならば、
最低2gramの頻度比較が必要だと思う。

しかしローマ字というのは2文字(弱)で1カナのペアで、
日本語の流れは2カナでようやくだから、
4gramで比較すればいいじゃない、
と思ったわけ。


ローマ字派閥からは、
「一つのカナを二つの指でほぼ同時押しする感覚だから、
脳内ローマ字変換などないのだ」
という反論があるが、
カナ派である僕は、
「一文字単位を打つのが配列ではなく、
数文字単位の流れで打てるかどうか」
を気にしている。
脳内ローマ字変換があろうとなかろうと、
その数文字単位の指の動きが、
もつれずにスムーズであればあるほど、
配列として優秀だと思う。

そしてその要求に対して、
qwertyローマ字は極めて効率が悪く、
親指シフトは大したことがなく、
薙刀式はアルペジオが多くて打ちやすく、
新下駄や飛鳥も指の繋がりがアルペジオなどで確保されている、
と考えている。

日本語の音の流れは、
最低でもカナ2gramで評価するべきで、
つまりローマ字にすれば4gram頻度表がいる、
ということだ。

もちろん、ローマ字は1カナあたり1.7打だから、
4gram頻度だと2.4カナほどになってしまうが、
まあしょうがない。
本題は、英語との比較である。

英語の音の流れが日本語と異なることは、
耳では明らかで、
文字でも明らかだろう。

そしてその二つの言語の、
よく出る連接を打ちやすい指で流れ良く打てることが、
新配列に求められる設計だ。

はたして、
英語日本語のニコイチ配列は可能か?
という問いにおいて、
まず基礎であるところの、
その両者のことばの流れを、
比較してる議論がないなとおもったわけ。



英語日本語共用配列には、
DvorakJP、Eucalyn、Tomisuke、
Harmoney、大西配列、オオハシ配列(仮)などがある。

これらが二つの言語の4gramを、
こういう指の流れで打てるから、
両方で優秀なのだ
(あるいはどちらかが弱い)、
などのように議論したい。

つまり僕は、
二つの言語を一つの配列で賄える、
ということは、
100%可能と思ってなくて、
○%程度は可能だけど、
みたいに考えたいわけだ。


「qwerty配列を覚えれば、
ローマ字でも英語でも打てるようになる」
と時々バカがいうので、
それをまずは棄却したい。

現在の僕の結論は、
ニコイチqwertyでやれることは、
十徳ナイフが現実で使える程度だから、
その程度でよいならばそれもよし、
十徳ナイフでタイパーになるのはキツいぞ、
専門的にガッツリやるなら、
そんなものを卒業して楽で速い専門道具を使え、
である。

で、今、専門道具を並べてる武器屋がないから、
そのための基礎調査をしたいんだよね。


統計調査用のスクリプトくらい書けるようになるべきなのだろうか。
ざっと調べた感じ出てこなかったので、
うーむ自分で4gramやるしかねえのか…


4gram頻度を調べることで、
両言語の間には共通点がほぼないことは炙り出されるだろう。
そして、たとえばトップ100程度の4gram、
そのふたつ、計800連接を、
一つの配列でスムーズに打てるかが肝になるだろう。

このような実証試験がないので、
ニコイチ配列は信用していない。

いや別に、同じ配列で、
英語もバリバリ打って、日本語もバリバリ打ってる、
動画で見せてくれても構わないが。



(多言語対応配列というのは、
世の中にどれくらいあるんやろ。
たしかdqmaniacさんがInterSterno用に、
多言語用の配列を作ってたはず。
特に追及したい興味はないんだけど、
qwertyの運指の保存しながらのアレンジだった記憶がある。
qwertyがバリバリ打てる人用のものだね)
posted by おおおかとしひこ at 10:09| Comment(0) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック