2022年06月19日

【薙刀式】自作IMEか…

Pythonで2000行と言われると、
Python勉強しようかなって思っちゃうね…
(俺はどこへ行こうとしてるのか)
https://shiki.esrille.com/2022/06/hiragana-ime.html


「出来るだけ漢字の量を増やす」
というのが現在のIMEのアルゴリズムだ、
と言う主張には深くうなづく点がある。

ワープロが日本の文体を壊す、
という運動がワープロの初期にあったことを、
もう誰も覚えてないかもしれないね。

もちろん、新技術に関するヒステリーという側面もある。
たとえば電話が誕生した時、
幽霊や妖怪が喋っていないかという疑心暗鬼があった。
だから「幽霊や妖怪は同じ言葉を繰り返せない」性質を使って、
「申す申す」と最初に言い、
相手が「申す申す」と答えられないなら、
幽霊と繋がっている証拠だ、
という確認シークエンスが生まれた。
「もしもし」の語源だ。

この二回繰り返すのは、日本にしかない習慣
(未確認)で、ローカルで誕生したマナー。

今初手で使う人はいるかな。
僕はまだ電波が途切れそうなときに「もしもーし」って言っちゃう。

これと、ワープロ誕生時のアレルギーは、
とても似ているかもしれない。
ただでさえキーボードのキーはたくさんあり、
車の運転よりも複雑だと思われたわけだ。

英文タイプライターであればそんなに複雑ではないだろう。
ところが日本語には漢字とカタカナもあった。
変換というIMEがそこで必要とされたのだろう。

さて、ワープロが日本語を壊す、
という運動では、
「漢字ばかり使って、偉くなった気になる」
という主張が主になされた。

書けない漢字が書けちゃうから、
漢字含有量が多い文章が書けて、
自分の能力が拡大した気になるというやつだ。

僕は大学で初めてWnnに触れたが、
その時も同じことを思った。
初期の頃は言葉としては知ってるが漢字は書けない言葉を、
よく文章に入れ込み、
その後わざとひらがなに開く箇所を設けたりした。
理系の研究室だったため、
「君の文章は情念が強い」と評されたこともある。
たしかに研究者用のスタンダード文体から外れていただろう。


日本人が手書きで書いてきた言葉よりも、
飾りが多く、等身大よりもハッタリ合戦になる。
当時の手書き作家たちは、そのことを危惧した。

そして数十年がたち、そのようになったと思う。

ひらがなで書くのは恥ずかしいと思う気持ちがあり、
硬い文章のほうが偉いという風潮がある。

僕はビジネスメールでも、
「よろしくおねがいします。」とか、
「いけるとおもいます。」とか、
わざとひらがなで書くことがある。
僕の職業は硬質な文体で書くべきでないと考えるからだ。

とくにメール文章は、
言文一致運動からどんどん外れて、
独特の硬質文体になっている。
それを口のレベルに戻したいので、
僕は比較的柔らかい言葉で書くようにつとめている。

とはいえ、漢字を使えば使うほど、
情報を圧縮できる利便性は捨てられないので、
「論じる」ときはやっぱり漢字は増えてくる。


これらを使い分けるには、
タイピングの効率を上げることがいいと僕は考えた。
文字数/秒を上げ、コントロールしやすいように機能キーを配置すれば、
IMEの調教をしながら文章が書けると。

それ自体は成功しつつあり、
とはいえ速度は手書きを超えても、
感覚が手書きをまだ超えていない。

漢直をやればいいんじゃないかとも思ってたが、
IMEを自作できれば、超えられるのかな?

最長一致法は聞いたことはあるが、アルゴリズムはよく分かっていないため、
ソースコードを読めるほどPythonに慣れる必要があるかな?

いや、そもそも僕はどんなIMEが欲しいんだろう?
読みを入力して漢字が出るものが欲しいのかな?
多分そうじゃなくて、
漢直系が欲しいんだと思っている。


現代日本語が漢字まみれなのには、
二つの理由がある。

・IMEが出来るだけ漢字を混ぜること
・qwertyローマ字で打つと、
 「せっかくここまで苦労して打ったのに、
 漢字くらいにしないと割りが合わない」と思うこと、
 つまりひらがな入力のコストが高すぎること

だと思う。
とくに後者が深刻で、
「このコストはひらがなに見合わない」と無意識に思えば、
ひらがなはどんどん減ってゆく。

そのコストを下げたのがフリックで、
だからフリックの方が、
みんな自然な文体を書いてるんじゃないかな。

梅棹文体は、
その感覚で普通の硬い文章も書こうぜ、
ってことだけど、
僕はそれは別の文体で書きたいので、
そこまで賛成するわけではない。

だから、フリック並みにひらがな効率がいい、
論理配列薙刀式を、運用してる感じだな。

僕のメールにひらがなが増えたのは、
フリックと薙刀式を使うようになってからだもの。


「確定キーをいちいち押さないといけない」
のがダメなのは、確定キーが遠いからだ。
それが親指やVMにあれば、
大した労力にはならない。
もちろんひらがなIMEになればもっと減っていいかも知れない。

それよりも、そもそも漢字を減らしてひらがなを増やそうと思えるような、
ひらがな入力コストがまず問題じゃない?って思う。

カナ入力の新配列にすれば、
それはある程度叶えられる。

あとは機能キー、そもそもIME、
と、徐々に本丸に近づくことになる。


で、
キーボードでIME経由することが、
合理的な日本語入力方式なのかな?
もうフリックでいいような気がしているが、
あとはエディタと再変換とかが充実すれば、
実はフリックでいいのでは、
という気がしなくもない。

ちなみにこの文章は布団の中でフリックで書いた。
薙刀式を使えばもっと楽に書けるが、
薙刀式は布団の中では使えないからね。

フリックの射程はやはり短い。
文節単位の変換が効率が良くて、
一文入力したらまともに変換しやしない。
そのへんを解消して、
文節移動や文節伸張、言葉の学習などにも対応すれば、
もうほぼ机の上と変わらなくなるはずだが…

Python2000行はiPhoneに組み込めるのかな。
その辺もわからんが、
IMEの自作をやれるなら、
やりてえなあ。

その前に仕様を固めないと話にならないね。
IMEは何をやってるのか、
そのソースコードを紐解く所からやらんといかんのね。
そのモチベと、創作するモチベだと、
前者にエネルギーを使う余裕はなさそうだが。
posted by おおおかとしひこ at 09:13| Comment(4) | TrackBack(0) | カタナ式 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
iphone app でカスタムキーボードの
HAYTE (早手)が再変換できて
ひらがなimeに近い操作性があります
フリック入力方式です。

Posted by キー坊(仮) at 2022年06月20日 05:25
>キー坊(仮)さん

へえ、あるはあるんだな。
情報ありがとうございます。

そういわれて思い出したんですが、
iPhoneにしてから随分になるけど、
Androidのフリックは文節持ってた記憶…
もうどんなだったか覚えていない…
Posted by おおおかとしひこ at 2022年06月20日 09:14
>通りすがりさん

情報ありがとうございます。
昔の「情報処理」といえばこんなんばっかでしたね。
ノードとか状態遷移表とかあるんだろうな。
基本はチョムスキーの生成文法やな、などと思ってた20年前が懐かしい。
cでポインタを使えばコードが綺麗になる、
のあたりでもういいやと思った記憶を思い出した…

腰を据えてやるときは参考書にします。(やるのか?)
Posted by おおおかとしひこ at 2022年06月22日 13:52
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック