[groonga-dev,02809] Re: IN NATURAL LANGUAGE MODEにおける検索スコア

Back to archive index

Kazuhiko kazuh****@fdiar*****
2014年 9月 25日 (木) 22:12:02 JST


On 25/09/2014 14:50, Kouhei Sutou wrote:
>> groonga/lib/ii.c を見てみました。
>>
>>   limit = optarg->similarity_threshold
>>     ? (optarg->similarity_threshold > GRN_HASH_SIZE(h)
>>        ? GRN_HASH_SIZE(h)
>>        : optarg->similarity_threshold)
>>     : (GRN_HASH_SIZE(h) >> 3) + 1;
>>
>> どれくらいのlimitが検索精度と処理速度の兼ね合いで実用的か試してみたいの
>> ですが、Mroonga側から、このoptarg->similarity_threshold を設定する方法は
>> あるでしょうか?
> 
> ないです!
> 
> だとアレなので、masterでは設定できるようにしました。
> 
> AGAINST('*S1"a b c"' IN BOOLEAN MODE)というように使ってくだ
> さい。「1」の部分がsimilarity_thresholdになります。

ありがとうございます!

MySQL/MariaDBの変数で変更できたらいいなというイメージだったのですが、ク
エリ内のプラグマの方が柔軟に変更できて嬉しいのかもしれません。

確認ですが、 AGAINST('*S1 a b c' IN BOOLEAN MODE) みたいに、二重引用符で
のフレーズ検索じゃなくても使えますよね?

25日の変更にしてはいささかチャレンジャーな気もしますが、今月29日のリリー
スに含まれて公式仕様になってしまうのでしょうか?
個人的には、デフォルトのヒューリスティックな値が今より「いい感じ」になる
のがゴールですが、それには時間が足りなさそうですね。

かずひこ




groonga-dev メーリングリストの案内
Back to archive index