任务单 #10260

バケツに文字化けした単語が登録されている
开放日期: 2007-04-08 02:52 最后更新: 2007-04-08 02:52

报告人:
属主:
(无)
类型:
状态:
开启
组件:
(无)
里程碑:
(无)
优先:
5 - Medium
严重性:
5 - Medium
处理结果:
文件:

Details

バケツに文字化けした単語(EUC-JP でない単語)が登録され
ることがある。
バケツの詳細ページにおいて、半角カタカナと全角ひらがな
の間に文字化けが
起こり、内容を確認すると文字化けした単語が登録されている。
EUC-JP で使用されていない文字を EUC-JP として扱ってしま
うことによって
この問題が起こっている。

Classifier/MailParse.pm
Classifier/WordMangle.pm
UI/HTML.pm

において、EUC-JP の 2 バイト文字を

my $two_bytes_euc_jp = '(?:[\x8E\xA1-\xFE][\xA1-\xFE])';

と定義しているが、\x8EF0-\x8EFE は EUC-JP では使用され
ていない。
(\x8EA1~\x8EDF は半角カタカナ)

上記定義をそれぞれ、

my $two_bytes_euc_jp =
'(?:[\xA1-\xFE][\xA1-\xFE])|(?:\x8E[\xA1-\xDF])';

に修正し、また、

Classifier/MailParse.pm



my $non_symbol_two_bytes_euc_jp =
'(?:[\x8E\xA3-\xA7\xB0-\xFE][\xA1-\xFE])';



my $non_symbol_two_bytes_euc_jp =
'(?:[\xA3-\xA7\xB0-\xFE][\xA1-\xFE])|(?:\x8E[\xA1-\xDF])';

に修正することにより問題が解決するのではないかと考えら
れる(未検証)。

(参考)
http://euc.jp/i18n/charcode.ja.html

(バグ報告の書き込み)
https://sourceforge.jp/forum/message.php?msg_id=28986

任务单历史 (0/0 Histories)

Attachment File List

No attachments

编辑

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » 登录名