NARUSE, Yui
narus****@airem*****
2006年 5月 19日 (金) 08:04:22 JST
成瀬です。 Tomoyuki Asakawa wrote: > SJIS(CR) -> SJIS(LF) > と言った場合、 > MAC系SJIS -> UNIX系SJIS > という様に、単純に字集合が決まるわけではないです。 相違点を探すのでなく、共通点を探して欲しいです。 相違点が大きいのは承知ですので。 もっとも、¬や∵も検討に入れると、 色々味わい深い例えにしてたりもするんですが。 > CRとCRLF,LFなどの改行の変換は、 > (略) > この時点では、改行コードの変換が必要かどうかは > 場合によってことなる。 > > すくなくとも、同一環境上では、通常改行の変換は必要ない > 改行の変換が必要なのは、異なる環境との交換の時だけです。 > > UNIXから WINDOWSという変換のとき > EUC(LF) -> SJIS(CRLF) > と、セットで切り替えると便利なのは確かですが > > UNIX上で、ハンドリングする場合には、 > EUC(LF) -> SJIS(LF) > の方がいいに決まってる。 > > なので、改行コードは次元が違う。 デフォルトでは改行コードはいじらず、必要なら別途、LF->CRLF変換する。 セットでCRLF変換できれば便利だろうけど。 デフォルトでは \x81\x60 -> U+FF5E、必要なら別途U+301Cに。 セットで変換できれば便利だろうけど。 共通項はありますよね。 -- NARUSE, Yui <narus****@airem*****> DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA