2017年10月15日

【カタナ式】言語サンプルによる文字頻度の差異

たとえば日本語カナサンプルで考えたとしても、
標準語と関西弁では、
文字頻度も連接頻度も全然違うと思うんだ。


たとえば関西弁では、「や」の比率が有意に跳ね上がるだろう。
「そうやん」「せやねん」「せやろか」
「そうやで」「なんでや」「ええやん」「素敵やん」
などが増えることは容易に予測できる。

標準語の「やん」なんて、
「ヤング」「病んでる」くらいしか出番がなさそう。
それに比して、関西弁では「やん」連接は頻出2グラムの上位に入るだろう。

地名の影響もあると思う。
関西特有の地名は、
他の地方とは違う音韻の特徴があると思う。
具体的には調べていないのだが、
関西に帰ると、関西っぽいネーミングというのがあるのに、
気づくものだ。

イントネーションやリズムの差異が、
その言語で聞いてて気持ちいいものの差異を決定するだろうね。

あと擬音も増える気がする。


勿論、関西弁のIMEはないから、
文字入力は標準語に比べて時間がかかることになる。
これは地方差別であるとも僕は思う。
特有語尾変化などに対応したIME、あってもええやんけ。



さて本題。
これらの思考実験でわかる通り、
言語によって文字頻度は異なる。
標準語と関西弁の差異で、わりとありそうだ。
実際、関西弁話者は、関西弁の文字うちに困難を覚えている。

で、英語と日本語で同じアルファベット配列を共用する意味って?
というのが本題だ。

覚えるのが楽だから、というのはこの際置いておこう。
ふたつの頻度や連接の差異がある言語を、
同一の配列で打つことは、愚かだと思わないのか?

QWERTY配列でローマ字を打つことに、
なんの意味があるのだろう?
それを使い続ける人は、
言葉の差異について何も考えたことがない、
物書き以外ではなかろうか?

いや、日本人は自国の言葉にもっと敏感になっていい。
そもそも「声に出して読みたい日本語」が売れたりと、
言葉自体に興味がないわけではないのに、
いざ入力配列となると、
無思考極まりないのが現状ではないだろうか。

あるいは、殆どの人はQWERTYローマ字に疑問を持たないのかね?

僕はマトリックスのネオのように、疑問を持ってしまった。
この世界は間違っているのではないか?


こうしてたどり着いたのがカタナ式による入力だ。
今のところ快適。
もうすぐマニュアル&ドリルが出来上がるので、
そろそろ最新版を発表しようと思っている。

僕はデジタルにおいて失語症だった。
言葉を素直に打てなかった。

QWERTYローマ字は何故、
頻度も音の流れも異なるふたつの言語を、
同一の配列で共有するのか?
その不合理に僕は異を唱えたい。
もともと二か国語を母語とする人間として。


で、関西弁配列つくろかな。そこまでせんでもええか。
posted by おおおかとしひこ at 15:42| Comment(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。