Re: BigramとNatural Language Mode (groonga-dev,02798) - Groonga - fulltext search engine.

須藤です。

In <54228****@fdiar*****>
  "[groonga-dev,02797] Re: BigramとNatural Language Mode" on Wed, 24 Sep 2014 11:30:57 +0200,
  Kazuhiko <kazuh****@fdiar*****> wrote:

> ただ、Boolean Modeで、TokenBigramSplitSymbolAlphaDigitだと'fine'が'nefi'
> にマッチしなくて、TokenBigramだと'tomorrow fine'が'fine tomorrow'にマッ
> チするのは、前者の検索語の'fi, in, ne'というトークンと後者の検索語の
> 'fine, tomorrow'というトークンは何かが違うということでしょうか？

「fine」はfi, in, neが連続して出現するというクエリーで、
「tomorrow fine」は

  * to, om, mo, or, rr, ro, orが連続して出現して、かつ！
  * fi, in, neが連続して出現する

というクエリー、という違いになります！


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/

Groonga - fulltext search engine.

[groonga-dev,02798] Re: BigramとNatural Language Mode