[Anthy-dev 1856] Re: uim-0.4.6alpha on Solaris8

Back to archive index

Kenichi Handa handa****@m17n*****
2005年 2月 17日 (木) 17:53:02 JST


In article <20050****@homa*****>, Takuro Ashie <ashie****@homa*****> writes:
>>  おそらくシステムの nl_langinfo が eucJP を返すのであれば、システムの
>>  iconv_open も eucJP を EUC-JP の alias として受けつけるのではない
>>  でしょうか? まあ、実装によるとは思いますけど。

> nl_langinfo(CODESET)の返り値をiconvの引数として使えるかどうかは実装依存
> のはずなので、nl_langinfoには頼らない方が無難かと思います。

> libcharsetのlocale_charset()相当の関数をuim内に持つというのも一つの手で
> すが、0.4.6ではとりあえずlibiconvをインストールしてもらうのが良いのでは
> ないかと思います。

ちなみに m17n-lib では以下のようにしてエンコーディング名を
canonicalize しています。

/** Canonicalize the name of SYM, and return a symbol of the
    canonicalized name.  Canonicalization is done by this rule:
	o convert all uppercase characters to lowercase.
	o remove all non alpha-numeric characters.
	o change the leading "ibm" to "cp".
	o remove the leading "iso".
    For instance:
	"ISO-8859-2" -> "88592"
	"euc-JP" -> "eucjp"
	"IBM851" -> "cp851"

これでほとんどのバリエーションをカバーできると期待しているの
ですが。でも decode/encode のためだけに m17n-lib を使うのは重
過ぎ?

−− 半田@AIST
      handa****@m17n*****



Anthy-dev メーリングリストの案内
Back to archive index