OSDN > 浏览软件 > Communications > Email > 过滤器 > POPFile(自動メールフィルター)の日本語化 > Ticket List/Search > 任务单 #10260

POPFile(自動メールフィルター)の日本語化

任务单 #10260
Ticket List Submit New Ticket RSS

バケツに文字化けした単語が登録されている

开放日期: 2007-04-08 02:52 最后更新: 2007-04-08 02:52

monitor

报告人:

amatubu

属主:

(无)

类型:

バグ

状态:

开启

组件:

(无)

里程碑:

(无)

优先:

5 - Medium

严重性:

5 - Medium

处理结果:

无

文件:

无

Details

バケツに文字化けした単語（EUC-JP でない単語）が登録され
ることがある。
バケツの詳細ページにおいて、半角カタカナと全角ひらがな
の間に文字化けが
起こり、内容を確認すると文字化けした単語が登録されている。
EUC-JP で使用されていない文字を EUC-JP として扱ってしま
うことによって
この問題が起こっている。

Classifier/MailParse.pm
Classifier/WordMangle.pm
UI/HTML.pm

において、EUC-JP の 2 バイト文字を

my $two_bytes_euc_jp = '(?:[\x8E\xA1-\xFE][\xA1-\xFE])';

と定義しているが、\x8EF0-\x8EFE は EUC-JP では使用され
ていない。
（\x8EA1～\x8EDF は半角カタカナ）

上記定義をそれぞれ、

my $two_bytes_euc_jp =
'(?:[\xA1-\xFE][\xA1-\xFE])|(?:\x8E[\xA1-\xDF])';

に修正し、また、

Classifier/MailParse.pm

の

my $non_symbol_two_bytes_euc_jp =
'(?:[\x8E\xA3-\xA7\xB0-\xFE][\xA1-\xFE])';

を

my $non_symbol_two_bytes_euc_jp =
'(?:[\xA3-\xA7\xB0-\xFE][\xA1-\xFE])|(?:\x8E[\xA1-\xDF])';

に修正することにより問題が解決するのではないかと考えら
れる（未検証）。

（参考）
http://euc.jp/i18n/charcode.ja.html

（バグ報告の書き込み）
https://sourceforge.jp/forum/message.php?msg_id=28986

任务单历史 (0/0 Histories)

Attachment File List

No attachments

POPFile(自動メールフィルター)の日本語化

任务单 #10260 Ticket List Submit New Ticket RSS

バケツに文字化けした単語が登録されている 开放日期: 2007-04-08 02:52 最后更新: 2007-04-08 02:52 monitor ON OFF

Details 回复

任务单历史 (0/0 Histories)

Attachment File List

编辑

任务单 #10260
Ticket List Submit New Ticket RSS

バケツに文字化けした単語が登録されている

开放日期: 2007-04-08 02:52 最后更新: 2007-04-08 02:52

monitor

Details