任务单 #10370

Windows 版における複合語モジュール
开放日期: 2007-05-10 11:12 最后更新: 2007-05-10 11:12

报告人:
属主:
类型:
状态:
开启 [Owner assigned]
组件:
(无)
里程碑:
(无)
优先:
5 - Medium
严重性:
5 - Medium
处理结果:
文件:

Details

Windows 版 chasen-2.4.0 + unidic-1.3.0 で「何時」を解
析すると、以下の
ような結果になります。

------------------------------------------------------
----------------
<cha:W1 orth="" kana="ナン" pron="ナン"
pos="BOS/EOS" ...></cha:W1>
<cha:W1 orth="" kana="ジ" pron="ジ"
pos="BOS/EOS" ...></cha:W1>
------------------------------------------------------
----------------

orth と pos が変です。

「何時」は複合語として以下のように登録されており、

------------------------------------------------------
----------------
(POS (名詞 普通名詞 一般)) ((LEX (何時 1730))
(COMPOUND
((POS (名詞 数詞)) (LEX 何) (READING ナン) (PRON
ナン) (INFO ...))
((POS (接尾辞 名詞的 助数詞)) (LEX 時) (READING
ジ) (PRON ジ) (INFO ...))
))
------------------------------------------------------
----------------

正しくは以下のように解析されるべきです。

------------------------------------------------------
----------------
<cha:W1 orth="何" kana="ナン" pron="ナン" pos="名詞-数
詞" ...>何</cha:W1>
<cha:W1 orth="時" kana="ジ" pron="ジ" pos="接尾辞-名詞
的-助数詞" ...>時</cha:W1>
------------------------------------------------------
----------------

実際、同じソースから作られているはずの Unix 版 (gcc-
3.4.4 で make) で
は、正しく解析されます。

Unix 版で作成したシステム辞書を使っても同じ現象が生じ
るので、mkchadic
ではなく、chasen の問題です。

o Windows 版を作成したときの版が古かった。
o Windows 用に書かれたコード部分にバグがある。
o ソースコードにもともと潜在的な問題があり、Windows
版で使っているコ
ンパイラ (borland かなにかに変えたと言ってましたよ
ね) でそれが顕在
化した。

あたりだと思うのですが、心当たりはあるでしょうか。

任务单历史 (0/0 Histories)

Attachment File List

No attachments

编辑

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » 登录名