Kazuhiro Osawa
ko****@yappo*****
2005年 4月 5日 (火) 20:14:00 JST
大沢です。 > 技術的には「n-gramを使って高精度化を頑張る」というよりは、 > 「形態素解析を使って、検索漏れ防止を頑張る」という方を > 基本スタンスにしたいと考えています。 了解しました。 現状配付されているindex.cにて、sen_index_addではsen_chop*を sen_index_delではsen_ngram*系のAPIを利用している影響で インデックスからの削除処理を行なうと、インデックスが壊れて しまっていたので、全てsen_ngram*系のAPIを利用するパッチ を作ってしまっていました。。。 取り急ぎ使える用にしたかったので、結果的にMeCabを切っちゃいました。 http://tech.yappo.jp/download/senna/senna.patch.for-rev6.diff > 次いで、上記のMeCabを使ってMySQLバインディングの現状化を行う予定でしたが、 > 大沢様のおかげでかなり工数が短縮できそうです。(ありがとうございます) あのパッチをあてていても、drop databaseを行なうと ERROR 1010: Error dropping database (can't rmdir './database/', errno: 17) というエラーが出てしまい、drop出来ない不具合がありました。 sql/sql_db.ccに修正を加えて不具合に対応しました。 また、4.1系に対応させるべく4.1.10aをベースにしたパッチも作りました。 http://tech.yappo.jp/download/senna/mysql-4.1.10a.senna.diff > (*) http://dev.razil.jp/archive/mecab-0.80.mte.patch > からダウンロードできます。 おおお、ご苦労さまです。 index.cをMeCab対応に書き変えて試してみます。 --- osawa