しかし、ネットで手軽に個人が情報発信出来るようになった昨今は、紙媒体とはちがって編集者がいないので、自分で間違いを正したり、組版ルールを知って、適切な文字を使うようにする必要が出てきた。
その為には「約物(記号類)」に何が必要かを知り、それらの多くがキー入力出来るようにする。
フォントの問題
ユニコードが普及したので扱える文字コードの制限は無くなったと言えるけど、実際にその文字が表示出来るためには、その文字のフォントが必要。日本語フォントについては、JIS X0208 (最近のフォントでは X0213)で定義された範囲でしか表示される保証がない。
日本語フォントに無くても別のフォントを表示する場合もあるが、字体がバラバラになる点が問題。例えば、上付きの数字 ¹²³⁴⁵⁶⁷⁸⁹⁰ では、¹²³ が JIS X0213 の定義範囲、⁴⁵⁶⁷⁸⁹⁰ は範囲外なので字の大きさが異なる場合があったり、分数 ¹²³⁴⁵⁄₆₇₈₉₀ のような表示で下付きの数字は全て範囲外の為、分子と分母で字の大きさが異なったりする。
それでも、これらの文字は特に科学分野の表現等には不可欠であるから見た目が悪くなっても使わざるを得ない。将来的には、必要なフォント全てを含んだ日本語フォントのセットを(フリーのフォントを利用して)作り出したいと思っている。
日本語フォントに無くても別のフォントを表示する場合もあるが、字体がバラバラになる点が問題。例えば、上付きの数字 ¹²³⁴⁵⁶⁷⁸⁹⁰ では、¹²³ が JIS X0213 の定義範囲、⁴⁵⁶⁷⁸⁹⁰ は範囲外なので字の大きさが異なる場合があったり、分数 ¹²³⁴⁵⁄₆₇₈₉₀ のような表示で下付きの数字は全て範囲外の為、分子と分母で字の大きさが異なったりする。
それでも、これらの文字は特に科学分野の表現等には不可欠であるから見た目が悪くなっても使わざるを得ない。将来的には、必要なフォント全てを含んだ日本語フォントのセットを(フリーのフォントを利用して)作り出したいと思っている。
キー入力出来る文字の少なさ
今迄の日本語入力では、かな入力もローマ字入力もどちらも 欧文なら(IMEをOFFして) ASCII の印字可能文字の範囲、和文なら ひらがな(とその変換で得られるもの)以外は- 読点( 、)と句点( 。)
- カギ括弧(「」)
- 中黒(・)
しか入力出来ない。(これらの記号は半角カナも用意されていて特別扱いらしい。)
ASCII で用意されている約物もキー数の制限があるから欧文の印刷で使われるものよりも数段少ない。マイナス符号がハイフンと共用されているし、引用符の左右の区別もない。
その結果、プロの校正を受けていない文章では (文字コードはちゃんと用意されているのに!) “引用符” とすべきところを "引用符"、2−1+3 とすべきところを 2-1+3 としている場合が多い。
ASCII で用意されている約物もキー数の制限があるから欧文の印刷で使われるものよりも数段少ない。マイナス符号がハイフンと共用されているし、引用符の左右の区別もない。
その結果、プロの校正を受けていない文章では (文字コードはちゃんと用意されているのに!) “引用符” とすべきところを "引用符"、2−1+3 とすべきところを 2-1+3 としている場合が多い。
この、「キー入力出来る文字の少なさ」を解決する方法の一つはローマ字変換にそれらの約物も含めて定義する、もう一つは 別の言語のキーボードを使う方法である。
英文以外の言語では ASCII の範囲ではその言語で使う文字が足らない(アクセント符号付きのアルファベット等)ので、AltGr キーやデッドキーを利用してキーボードで ASCII 以外の文字や約物の入力が出来るようになっている。
これらの言語のキーボードで定義されている約物は可能な限り取り入れる。
横書きに於ける句読点の問題
縦書きでは ( 、。) と決まっている句読点だが、横書きでは ( 、。) ( , . ) ( , 。) のやり方がある。
個人的には ( 、。) が最も読みやすいと思う。欧文の標準に合わせる ( , . ) も理解できる。最後の ( , 。) という何とも不思議な組み合わせは「公用文作成の要領」という内閣が1952年に出した通達による。
学会の投稿規定などで、どの形式の句読点を使うのか指定される場合がある。Google日本語入力ではプロパティで {( 、. ) の選択も加えて} 句読点の形式を指定出来る仕組みがあるので、この仕組が使えなくなるようなローマ字変換の定義をしないようにする。
個人的には ( 、。) が最も読みやすいと思う。欧文の標準に合わせる ( , . ) も理解できる。最後の ( , 。) という何とも不思議な組み合わせは「公用文作成の要領」という内閣が1952年に出した通達による。
学会の投稿規定などで、どの形式の句読点を使うのか指定される場合がある。Google日本語入力ではプロパティで {( 、. ) の選択も加えて} 句読点の形式を指定出来る仕組みがあるので、この仕組が使えなくなるようなローマ字変換の定義をしないようにする。
続く