Taku Kudo
taku****@chase*****
2009年 5月 29日 (金) 19:18:19 JST
ご報告ありがとうございます。 おっしゃるとおり 文字コードの変換をよりプリミティブな Win32 API を使って書き換えました。その部分がバグっているものと 思われます。 修正版を早急にお届けいたします。 くどう 2009/05/29 15:06 Hiroaki Kawai <hiroa****@gmail*****>: > 川井です。 > > Linux で 0.98pre2 を試してみました。 > 辞書は正しくコンパイルされ、「すももも〜」は正常に解析されました。 > なので、やっぱり Windows 版固有の問題のようです。 > 文字セット変換部分も大幅に書き直されていて、Windows に > 備わっている関数が呼び出されているので、そのあたりかも...? > > Windows 上でビルドできればと思って試してみたのですが、 > cl.exe がエラーを吐いて止まってしまって、試せずにいます。 > # Microsoft Visual C++ 2008 Express Edition です。 > > 【Windows Vista上で0.98pre2】 > すもももももももものうち 名詞,一般,*,*,*,*,* > EOS > 本日 名詞,一般,*,*,*,*,* > は 名詞,一般,*,*,*,*,* > 晴天 名詞,一般,*,*,*,*,* > なり 名詞,一般,*,*,*,*,* > EOS > > 【Linux 上で 0.98pre2】 > すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ > も 助詞,係助詞,*,*,*,*,も,モ,モ > もも 名詞,一般,*,*,*,*,もも,モモ,モモ > も 助詞,係助詞,*,*,*,*,も,モ,モ > もも 名詞,一般,*,*,*,*,もも,モモ,モモ > の 助詞,連体化,*,*,*,*,の,ノ,ノ > うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ > EOS > 本日 名詞,副詞可能,*,*,*,*,本日,ホンジツ,ホンジツ > は 助詞,係助詞,*,*,*,*,は,ハ,ワ > 晴天 名詞,一般,*,*,*,*,晴天,セイテン,セイテン > なり 助動詞,*,*,*,文語・ナリ,基本形,なり,ナリ,ナリ > EOS > > # Windows では、たぶん全部未知語になったのかと。 > > > 2009/05/28 10:46 柳原 啓美 <yanag****@two-t*****>: >> シーゲルさん、川井さん、ありがとうございます。 >> 私の環境もシーゲルさんの仰るとおり、-unk-feature "未知語" >> オプションで実行すると、すべての言葉が未知語になります。 >> >> [input.txt][UTF-8] >> 本日は晴天なり >> ↓ >> mecab input.txt -o output.txt --unk-feature "unknown" >> ↓ >> [output.txt] >> 本日 unknown >> は unknown >> 晴天 unknown >> なり unknown >> EOS >> >> 川井さんの環境では >>> ちなみに、「すもも〜」は解析できませんでしたが「本日は晴天なり」は >>> 解析できました。 >> とのことですが、もし上記オプションありで検証可能でしたら >> お願いできますでしょうか? >> >> 以上です。 >> -- >> 柳原 啓美 <yanag****@two-t*****> >> >> _______________________________________________ >> mecab-users mailing list >> mecab****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/mecab-users >> > > _______________________________________________ > mecab-users mailing list > mecab****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/mecab-users >