[LE-talk-ja 55] 基本仕様

Back to archive index

MORIYAMA Masayuki moriy****@mirac*****
2006年 4月 12日 (水) 12:04:53 JST


森山です。

cp932, cp51932, eucJP-ms, ISO-2022-JP-MS の定義および Unicode との変換
を「基本仕様書」のドラフト版を次の場所にアップしました。

ISO-2022-JP-MS に関しては、ユーザ定義文字の扱いに関して変更になるかも
しれませんが、現状では ESC $ ( ? としています。

  http://sourceforge.jp/docman2/?group_id=2198

今までの説明でなかった点として、重複定義されている文字の変換を明示しま
した。

重複定義文字に関する Unicode から(MS)レガシーエンコーディングへの変換
ルールを簡単に説明すると次のようになります。

次の変換規則を番号の若い順番から適用していきコード変換を行う。

1. JIS X 0208:1997 で定義されている文字であれば、JIS X 0208:1997 の符
   号位置に変換する。
2. NEC特殊文字で定義されている文字であれば、NEC特殊文字の符号位置に変
   換する。
3. IBM拡張文字で定義されている文字であれば、IBM拡張文字の符号位置に変
   換する。
4. IBM拡張文字の符号位置が存在しない場合は、NEC選定IBM拡張文字の符号位
   置に変換する。

マイクロソフト > [PRB] SHIFT - JIS と Unicode 間の変換問題
http://support.microsoft.com/default.aspx?scid=kb;ja;JP170559

上記の、変換表がベースとなっています。

ここで説明している変換については、別途 ucm ファイルとして公開予定して
います。

--
森山 将之 moriy****@mirac*****
ミラクル・リナックス株式会社




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index