[Senna-dev 5] Re: 各MLの位置付け

Back to archive index

Kazuhiro Osawa ko****@yappo*****
2005年 4月 5日 (火) 20:14:00 JST


大沢です。

> 技術的には「n-gramを使って高精度化を頑張る」というよりは、
> 「形態素解析を使って、検索漏れ防止を頑張る」という方を
> 基本スタンスにしたいと考えています。

了解しました。

現状配付されているindex.cにて、sen_index_addではsen_chop*を
sen_index_delではsen_ngram*系のAPIを利用している影響で
インデックスからの削除処理を行なうと、インデックスが壊れて
しまっていたので、全てsen_ngram*系のAPIを利用するパッチ
を作ってしまっていました。。。
取り急ぎ使える用にしたかったので、結果的にMeCabを切っちゃいました。
http://tech.yappo.jp/download/senna/senna.patch.for-rev6.diff


> 次いで、上記のMeCabを使ってMySQLバインディングの現状化を行う予定でしたが、
> 大沢様のおかげでかなり工数が短縮できそうです。(ありがとうございます)

あのパッチをあてていても、drop databaseを行なうと
ERROR 1010: Error dropping database (can't rmdir './database/', errno: 17)
というエラーが出てしまい、drop出来ない不具合がありました。
sql/sql_db.ccに修正を加えて不具合に対応しました。

また、4.1系に対応させるべく4.1.10aをベースにしたパッチも作りました。
http://tech.yappo.jp/download/senna/mysql-4.1.10a.senna.diff

> (*) http://dev.razil.jp/archive/mecab-0.80.mte.patch
>     からダウンロードできます。

おおお、ご苦労さまです。
index.cをMeCab対応に書き変えて試してみます。

---
osawa



Senna-dev メーリングリストの案内
Back to archive index