[groonga-dev,02798] Re: BigramとNatural Language Mode

Back to archive index

Kouhei Sutou kou****@clear*****
2014年 9月 24日 (水) 18:46:04 JST


須藤です。

In <54228****@fdiar*****>
  "[groonga-dev,02797] Re: BigramとNatural Language Mode" on Wed, 24 Sep 2014 11:30:57 +0200,
  Kazuhiko <kazuh****@fdiar*****> wrote:

> ただ、Boolean Modeで、TokenBigramSplitSymbolAlphaDigitだと'fine'が'nefi'
> にマッチしなくて、TokenBigramだと'tomorrow fine'が'fine tomorrow'にマッ
> チするのは、前者の検索語の'fi, in, ne'というトークンと後者の検索語の
> 'fine, tomorrow'というトークンは何かが違うということでしょうか?

「fine」はfi, in, neが連続して出現するというクエリーで、
「tomorrow fine」は

  * to, om, mo, or, rr, ro, orが連続して出現して、かつ!
  * fi, in, neが連続して出現する

というクエリー、という違いになります!


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/




groonga-dev メーリングリストの案内
Back to archive index