yusuk****@cheru*****
yusuk****@cheru*****
2004年 3月 19日 (金) 00:31:14 JST
田畑です。 > > 早速試してみました.「はなし」は「話」に変換されるようになっ > たのですが,「だいなし」とか「くらし」とか変関すると「ダイナ > 氏」「蔵氏」になっちゃいます.あと,「氏」だけじゃなく,「か > いさん」は「甲斐さん」とか,「にいさん」は「新さん」とか, > 「さん」でも同じような雰囲気が漂ってます. 一部直ってないのが残っていますが、これらを修正してanthy-5117を リリースしました。 > > というわけで,特に体言止めを使用するような場合,まだまだ人名 > が強いように思います. anthyのコードは(1)文節の境界を見付ける所と(2)候補を生成して評価する所 で全然違う処理をしています。文節境界のところでは「さん」や「氏(し)」 のような接尾時にも自立語なみのスコアを与えると良い結果が出るというのが anthy-5100で気付いたことなのですが、候補生成と評価がその時の情報に 引きずられてしまって、接尾時を自立語と同じ重みで評価していました。 今後は(1)(2)の独立性を高めていくってのも方向かなと考えてます。 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)