このブログを検索

拡張文字の説明


アクセント記号の入力

仏語・独語・スペイン語・ポルトガル語・イタリア語・ラテン語・ピンインの入力に必要なアクセント記号のある文字は全て合成された文字が定義されているので、それを入力出来るようにした。バックスラッシュで始まり、アクセント、次に文字か記号の入力となる。
  • a、i、u、e、o、A、I、U、E、O については、アクセント記号8種類では全てを定義。コマンドはアクセント記号の形からの類推で決めた。大文字にするには母音小文字を連打する。代表例として a で説明。
    • \' a → á ピンイン第2声、アクサン・テギュ
      • \'aa → Á 以下他のアクセント記号でも同様なので割愛する。
    • \`a → à ピンイン 第4声、アクサン・グラーブ
    • \va → ǎ ピンイン第3声
    • \-a → ā ピンイン第1声、長母音
    • \ua → ă 短母音
    • \^a → â アクサン・シルコンフレックス
    • \~a → ã チルダ付き母音
    • \:a → ä トレマ、ウムラウト、ピンインの母音(ü)
  • ü については、それに声調記号が付くので、ピンイン第1声から第4声までのアクセント記号を加えた ü も定義している。中国語のピンイン入力方式では、このピンインには v が割当てられているので、拡張文字の入力にも採用する。
    • \'v \`v \vv \-v → ǘ ǜ ǚ ǖ とそれらの大文字(vを連打)
  • y のトレマが仏語にあるので、それも定義。
    • \:y \:yy → ÿ Ÿ

特殊文字

各国語の入力用に定義している。バックスラッシュで始まる。(これとは対照的に、和文固有の記号の入力はバックスラッシュ無しで始まる。)

大文字にするには小文字の入力コードの最後の文字を連打する
    • 仏語 æ Æ œ Œ ç Ç ‹ › « »
      • æ は、a と e の合わせ字、 œ は、o と e の合わせ字なので、それぞれ \ae と \oe で定義している。
      • æ は、発音記号でも使われるので、その関係で \q も定義している。
      • ç は、字としては c だが、発音は s と同じ。しかし、歴史的には cz であった事から \cs と \cz で定義している。
      • ‹ と › は第2引用符として用いられる。 \< と \> で定義している。
      • « と » は第1引用符として用いられる。 \<< と \>> で定義している。 
    • 独語 ß ẞ
      • ss の合わせ字。大文字は正書法で最近認められたらしいので追加した。\ss で定義している。
    • スペイン語 ñ Ñ ¿ ¡
      • ñ は、形から \~n 発音から \ny 仏語・イタリア語の綴りで \gn ポルトガル語の綴りで \nh を定義している。
      • ¿ と ¡ は形と意味から当然に \? と \! で定義している。
    • イタリア語・スペイン語の助数詞 男性 º 女性 ª
      • ローマ字かな変換で、xo ぉ 、 xa ぁ と変換される連想から、\xo、 \xa で定義している。
    工事中


    英語の発音記号

    元々、こぶりローマ字変換は英語の発音をかなで表現する手段として開発した。従って、英語発音の発音記号の入力もサポートしたかった。

    発音記号を大量に入力する場合には、専用のローマ字変換テーブルを使う方が便利なのだが、日本語入力とは両立できない(変換テーブルを入れ替えて使う)ので、日本語文章中に使いたい時の為に特殊文字として定義しておく。


    そのコマンドは、英語発音の発音記号を入力する専用のローマ字変換テーブルのコマンドと統一させるのが良い。この専用のローマ字変換テーブルを解説した[発音記号の入力]を参照の事。

    この専用のローマ字変換テーブルのコマンドは英大文字で始まるか、或いは ' か ` で始まるように定義している。

    しかし、ローマ字変換テーブルの中に英大文字が含まれると、Google日本語入力の「シフトキーでの入力切り替え」機能が使えなくなる。
    英小文字で始まるアルファベットを入力したい場合もあるから、「シフトキーでの入力切り替え」機能のご利益は小さい。しかし、ハングルの入力用の辞書で入力を英大文字から始まる様式にした時に、この機能が役立つと分かった。
    そこで、こぶりローマ字変換では「シフトキーでの入力切り替え」機能は活かすことにして英大文字から始まるコマンドは p\ と 英小文字に置き換える事にした。また、' と ` で始まるコマンドにも頭に p\ を付ける事にした。

    コマンドの頭の p は発音記号を表す英語の phonetic alphabet の頭文字から取っていて、色んな種類の文字セットのコマンドがお互いに干渉しないように付加している。