Yusuke TABATA
yusuk****@w5*****
2007年 2月 8日 (木) 00:39:22 JST
田畑です。 UTUMI Hirosi wrote: > anthy-8604 の変換例をいくつかお送りします。 直せるものについては直してanthy-8607としてリリースしました。 http://osdn.dl.sourceforge.jp/anthy/23881/anthy-8607.tar.gz (513文、1871文節) #「はーとまーく」で変換して〓が出るのは仕様です ;) > - 文字を各。 多分、直ってると思います。 > - 椎なりんごの新曲を > - 王貞治さんと永島重雄さんが 複合語の扱いをミスってたので、直しました。 > - 仕事が出きるのは コード上に変なミスがありましたので、直しました。 > - いいと思った螺すぐ実行する。 > (いいとおもったらすぐじっこうする。) 例文に正解を入れておいたら直りました。 > wikicanna のほうもちょくちょく更新しています。 頻度情報が絡む誤変換が目立つように感じるので、どうしようか 考えながら拝見してたのですが、頻度情報はこういう辞書中の グローバルな順位の数字に一本化するのが楽じゃないかなと 検討しています。 #実際の頻度は適当な分布(zipf則など)を仮定して計算。 -- -- CHAOS AND CHANCE! Yusuke TABATA