Kenichi Handa
handa****@m17n*****
2005年 2月 17日 (木) 17:53:02 JST
In article <20050****@homa*****>, Takuro Ashie <ashie****@homa*****> writes: >> おそらくシステムの nl_langinfo が eucJP を返すのであれば、システムの >> iconv_open も eucJP を EUC-JP の alias として受けつけるのではない >> でしょうか? まあ、実装によるとは思いますけど。 > nl_langinfo(CODESET)の返り値をiconvの引数として使えるかどうかは実装依存 > のはずなので、nl_langinfoには頼らない方が無難かと思います。 > libcharsetのlocale_charset()相当の関数をuim内に持つというのも一つの手で > すが、0.4.6ではとりあえずlibiconvをインストールしてもらうのが良いのでは > ないかと思います。 ちなみに m17n-lib では以下のようにしてエンコーディング名を canonicalize しています。 /** Canonicalize the name of SYM, and return a symbol of the canonicalized name. Canonicalization is done by this rule: o convert all uppercase characters to lowercase. o remove all non alpha-numeric characters. o change the leading "ibm" to "cp". o remove the leading "iso". For instance: "ISO-8859-2" -> "88592" "euc-JP" -> "eucjp" "IBM851" -> "cp851" これでほとんどのバリエーションをカバーできると期待しているの ですが。でも decode/encode のためだけに m17n-lib を使うのは重 過ぎ? −− 半田@AIST handa****@m17n*****