漢字コードについて
■入力コードと出力コード
pTeXが扱える漢字コードは、pTeXの実行ファイルを作成するときに決定され、
それは、pTeXを起動したときに表示される、つぎのようなバナーに示されています。
This is pTeX, Version 3.1415 p2.1 (EUC) (C version 6.1)
バージョンp3.0.4以降では、実行時に-kanjiオプションによって、
扱う漢字コードを指定することができます。
このとき、括弧内には-kanjiオプションに指定された(省略時はデフォルトの)
漢字コードが表示されます。
This is pTeX, Version 3.1415-p3.0.4 (euc) (Web2C 7.3.9)
バナーのカッコ内に示されている漢字コードは、画面やログファイルなどに
出力される漢字コードであることに注意をしてください。
入力できる漢字コードとの関係は、つぎのようになります。
バナーに表示される文字列
EUC SJIS JIS
内部コード EUC SJIS EUC
入力 EUC/JIS SJIS/JIS JIS/EUC
出力 EUC SJIS JIS
DVI JIS JIS JIS
■カテゴリコード
pTeXでは、2バイトコードのカテゴリコードを、つぎのように設定しています。
カテゴリ 意味
16 第一、第二水準の漢字(16区〜84区の文字)
17 カナ、アルファベットなど(3区〜6区の文字)
18 その他の和文記号(1,2,7,8区の文字)
なお、pTeXでは、2バイト文字のカテゴリコードを変更することはできません。
なぜなら、pTeXは2バイト文字のカテゴリコードを、その文字の1バイト目で
判断していますが、つぎのように、シフトJISコードの1バイト目が必ずしも、
区点コードの`区'に対応していないためです。
そのため、仮に区単位でカテゴリコードを変更できるようにしても、
SJIS版とEUC版で同じ動作が保証できなくなります。
内部コードを統一すれば不可能ではありませんが、現在は見送っております。
区点 JIS EUC シフトJIS 区
特殊文字 0101-0294, 2121-227e, a1a1-a2fe, 8140-81fc, 1,2
英数字 0316-0390, 2330-237a, a3b0-a3fa, 824f-829a, 3
平仮名 0401-0483, 2421-2473, a4a1-a4f3, 829f-82f1, 4
片仮名 0501-0586, 2521-2576, a5a1-a5f6, 8340-8396, 5
ギリシャ文字 0601-0656, 2621-2658, a6a1-a6d8, 839f-83d6, 6
ロシア文字 0701-0781, 2721-2771, a7a1-a7f1, 8440-8491, 7
罫線素片 0800-0833, 2821-2841, a8a1-a8c1, 849f-84bf, 8
第1水準漢字 1601-4751, 3021-4f53, b0a1-cfd3, 889f-9872, 16-47
第2水準漢字 4801-8404, 5021-7424, d0a1-f4a4, 989f-ea92, 48-84
[pTeX home page]