このブログを検索

2016年8月19日金曜日

ローマ字テーブルのテスト

Globish1500語を使って、カスタマイズした Google日本語入力のローマ字テーブル をテストした。カタカナ語の入力が楽になるように、かつ、日常の日本語の入力も問題なく出来るように考えて作ったので、こうやってブログの記事を書くのにもカスタマイズ版を使っている。

このカスタマイズ版を使い始めて、通常の日本語の入力でもこれは便利と思ったのが n を一度押しただけで「ん」が入力され、r を一度押しただけで「ー」が入力されること。「ん」を入力するのに nn と押す癖はもうなくなった。(nn が「んん」になってしまうから)

テストは、Globish1500語のリストに発音記号と対応するカナを加える事で行う。アクセントの無い音節は半角カナで表現した。元のリストは1500語丁度だったけど、同じ綴りでアクセントと発音が異なる単語は別の単語扱いをしたので11語増えて1511語になった。

スプレッドシート形式にした[Globish&VOAwordbook]を公表する。単語のリストにも著作権は認められるのだが、これはGlobishの創始者が無料で公開しているものを利用しているので問題はないと思う。
後日談: Globishに加えて、VOA Special English Word Book という単語集にある単語を追加した。
このリスト中の単語の文字総数は8062字、そのカナを入力するのに要したアルファベットの総数は245文字減った。

これは、普通のローマ字変換では子音字を入力するのに有りもしない u とか o とかを打つ必要がある(例: supureddosi-to 「すぷれっどしーと」…カスタマイズ版でも変換可能)のに対して、カスタマイズしたローマ字変換ではそれが不要(spreddsirt 「すぷれっどしーと」)である事が大きい。

そして、英語の綴りと入力文字が完全に一致するものが141語もある。又、c x も使うと一致する率が更に向上するのだが、発音記号との対比が分かり難くなる事と 音節のアクセントの有無をカタカナの全角と半角で書き分けるようにしたから、x が使えない場合( k と s を分ける必要が出て来る)もあったので、このリストでは止めておいた。

テスト中に幾つかの問題点を見つけて修正したので、このカスタマイズでかなり完成に近づいたと思う。