yusuk****@cheru*****
yusuk****@cheru*****
2005年 4月 1日 (金) 19:34:32 JST
田畑です。 > [anthy-dev 1991]の内容は渡辺さんの報告してくださった問題の > 3つめしか解決してないですね。すみません。他のは今から調査します。 修正したものをanthy-6331としてリリースしました(というより、してもらいました)。 anthyの内部では部分文字列を切り出してから、色々な理由で部分文字列の 構造体(struct metaword)をくっつけていって、ある程度、大きな構造を 作っていきます。(src-splitter/metaword.c参照) この構造が利用可能かどうかの判断は結合したときの理由(mw->type)に よるのですが、接頭辞+自立語のパターンの時に文節境界の制約がかかった 時に間違った判断をしてしまっていたようです。 他の変更は *メモリアロケータのalignを直したつもり(UltraSparcで動くかも、未チェック) *wtype_tの32bitへの縮小 *dicutil.hへのanthy_dic_search_words_file()というAPIの実験的な追加 *その他、微調整 anthy_dic_search_words_file(const char *words)はちょっとアドホックな 実装になっていますが、/usr/share/dict/wordsを検索するAPIです。 (path名はanthy-confに書いてあります) 「インターネットで」と入力しようとして、「internetde」と打ってしまい 「いんてrねtで」になった時に自動修正するのに使えないかなと 思っています。 anthy_dic_search_words_file("internetde") => "internet" と最長でマッチした単語がstrdupされて、返り値になります。 フロントエンド側で使ってもらえなかったり、別に実装されたり した場合には、このAPIは消します。 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)