JIS X 0201について調査してみた(2)
やってもうたー。読んでたのは「JIS X 0202」の規格でした。
Chromeで開かないのでIEにコピペしたら何故か「JIS X 0202」のPDFが開いてました。
\(^o^)/オワタ
ですので、下記の内容は「JIS X 0202」です。(2014/04/24追記)
昨日の続き
「JIS X 0201」の規格が以下のサイトでみれるのでパラパラと読んでみた。
固定符号化文字の存在
DELETE(07/15)とESCAPE(01/11)とSPACE(02/00)は符号化が固定されているらしい。
しかし、後述の96文字集合つかうとDELETEとSPACEが別の文字に割り当てられるのでは?
どうすんのこれ。
CL領域になっているESCAPEは問題なさそうだけど。やっべ難しい。
符号化図形文字集合について
94文字集合だけかと思いきや・・・あれ、96文字集合も使えるんだ?!
驚きなんですけどー。
てか94^nとか96^nってなんなんだーっていう。
で、詳しく読んでみると、どうやらマルチバイトに対応しているらしい。(6.3.1 符号化図形文字集合の種類)
面(といっていいのか微妙だけど)の指定も
94^nなら02/01から07/14で、
96^nなら02/00から07/15となるらしい。
うほまじでー。
nって表記が気になる。群、面、句、点に拡張することもできるのだろうか。
94文字集合の場合、3バイトを使うマルチバイト集合だと約83万文字収録できることに。
いまさらどうしろって話ですけど。
ちなみに、ESCAPEは、基本集合(CL)以外に入れたらアカンらしい。
基本集合(00/00から01/15)は、ESCAPEを含まなければならない。補助集合(08/00から09/15)は、この文字を含んではならない。
8ビットの場合
- 00/00から01/15はCL領域
- 02/00から07/15はGL領域
- 08/00から09/15はCR領域
- 10/00から15/15はGR領域
ここまではおk。
で、その領域の説明
CL:制御文字の基本集合
GL:SPACE及びDELETEと94文字若しくは94^n文字の図形文字と集合、又は96文字若しくは96^n文字の図形文字の集合
CR:制御機能の補助集合又は未使用
GR:94文字若しくは94^n文字の図形文字(10/00及び15/15は、未使用とする。)の集合、96文字若しくは96^n文字の図形文字の集合、又は未使用
又、96、96^n文字集合がGL、GR領域に呼び出された時は、02/00と07/15にも図形文字を割り当てていいらしい。
その場合、SPECEとDELETEはどこに行くんだっていう疑問が。。。単に使えなくなるだけ?
とりあえずJIS X 0201の調査はこのくらいにしとこうかなー。
と思ったけど、ロッキングシフトやらシングルシフトの話がきになるのでもう少し仕様書を読むやも。
あまり深入りしたくない分野やけどなー。