groonga/groonga [master] Support near search by 'column *N "word1 word2 ..."' in script syntax (Groonga-commit) - Groonga - fulltext search engine.

Kouhei Sutou	2012-07-08 18:30:26 +0900 (Sun, 08 Jul 2012)

  New Revision: 798c7c685059b8455d280caf2ef727873a2d554f
  https://github.com/groonga/groonga/commit/798c7c685059b8455d280caf2ef727873a2d554f

  Log:
    Support near search by 'column *N "word1 word2 ..."' in script syntax
    
    Near search requires max interval but the syntax doesn't accept max
    interval. So this change always uses 10 as max interval. What about
    '*N[NUMBER]' as syntax for specifying max interval?
    
    fixes #1423

  Added files:
    test/function/suite/select/filter/near.expected
    test/function/suite/select/filter/near.test
  Modified files:
    lib/db.c
    lib/expr.c
    lib/ii.c

  Modified: lib/db.c (+2 -0)
===================================================================

--- lib/db.c    2012-07-08 20:07:22 +0900 (898f831)
+++ lib/db.c    2012-07-08 18:30:26 +0900 (3c6cf6c)
@@ -8191,6 +8191,8 @@ grn_column_index(grn_ctx *ctx, grn_obj *obj, grn_operator op,
     case GRN_OP_PREFIX :
     case GRN_OP_SUFFIX :
     case GRN_OP_MATCH :
+    case GRN_OP_NEAR :
+    case GRN_OP_NEAR2 :
     case GRN_OP_SIMILAR :
       for (hooks = DB_OBJ(obj)->hooks[GRN_HOOK_SET]; hooks; hooks = hooks->next) {
         default_set_value_hook_data *data = (void *)NEXT_ADDR(hooks);

  Modified: lib/expr.c (+19 -1)
===================================================================
--- lib/expr.c    2012-07-08 20:07:22 +0900 (afb5660)
+++ lib/expr.c    2012-07-08 18:30:26 +0900 (4d5de6d)
@@ -943,6 +943,8 @@ grn_expr_append_obj(grn_ctx *ctx, grn_obj *expr, grn_obj *obj, grn_operator op,
     case GRN_OP_TABLE_CREATE :
     case GRN_OP_EXPR_GET_VAR :
     case GRN_OP_MATCH :
+    case GRN_OP_NEAR :
+    case GRN_OP_NEAR2 :
     case GRN_OP_SIMILAR :
     case GRN_OP_PREFIX :
     case GRN_OP_SUFFIX :
@@ -3585,6 +3587,8 @@ scan_info_build(grn_ctx *ctx, grn_obj *expr, int *n,
   for (stat = SCAN_START, c = e->codes, ce = &e->codes[e->codes_curr]; c < ce; c++) {
     switch (c->op) {
     case GRN_OP_MATCH :
+    case GRN_OP_NEAR :
+    case GRN_OP_NEAR2 :
     case GRN_OP_SIMILAR :
     case GRN_OP_PREFIX :
     case GRN_OP_SUFFIX :
@@ -3648,6 +3652,8 @@ scan_info_build(grn_ctx *ctx, grn_obj *expr, int *n,
   for (i = 0, stat = SCAN_START, c = e->codes, ce = &e->codes[e->codes_curr]; c < ce; c++) {
     switch (c->op) {
     case GRN_OP_MATCH :
+    case GRN_OP_NEAR :
+    case GRN_OP_NEAR2 :
     case GRN_OP_SIMILAR :
     case GRN_OP_PREFIX :
     case GRN_OP_SUFFIX :
@@ -4135,6 +4141,8 @@ grn_table_select(grn_ctx *ctx, grn_obj *table, grn_obj *expr,
               }
               break;
             case GRN_OP_MATCH :
+            case GRN_OP_NEAR :
+            case GRN_OP_NEAR2 :
             case GRN_OP_SIMILAR :
               {
                 grn_obj wv, **ip = &GRN_PTR_VALUE(&si->index);
@@ -4148,7 +4156,17 @@ grn_table_select(grn_ctx *ctx, grn_obj *table, grn_obj *expr,
                   optarg.mode = si->op;
                 }
                 optarg.similarity_threshold = 0;
-                optarg.max_interval = 0;
+                switch (si->op) {
+                case GRN_OP_NEAR :
+                case GRN_OP_NEAR2 :
+#define DEFAULT_NEAR_MAX_INTERVAL 10
+                  optarg.max_interval = DEFAULT_NEAR_MAX_INTERVAL;
+#undef DEFAULT_NEAR_MAX_INTERVAL
+                  break;
+                default :
+                  optarg.max_interval = 0;
+                  break;
+                }
                 optarg.weight_vector = (int *)GRN_BULK_HEAD(&wv);
                 /* optarg.vector_size = GRN_BULK_VSIZE(&si->wv); */
                 optarg.vector_size = 1;

  Modified: lib/ii.c (+10 -1)
===================================================================
--- lib/ii.c    2012-07-08 20:07:22 +0900 (3e27e97)
+++ lib/ii.c    2012-07-08 18:30:26 +0900 (ec7b234)
@@ -6038,8 +6038,17 @@ grn_ii_sel(grn_ctx *ctx, grn_ii *ii, const char *string, unsigned int string_len
     grn_select_optarg arg = {GRN_OP_EXACT, 0, 0, NULL, 0, NULL, NULL, 0};
     if (!s) { return GRN_INVALID_ARGUMENT; }
     if (optarg) {
-      if (optarg->mode == GRN_OP_SIMILAR) {
+      switch (optarg->mode) {
+      case GRN_OP_NEAR :
+      case GRN_OP_NEAR2 :
         arg.mode = optarg->mode;
+        arg.max_interval = optarg->max_interval;
+        break;
+      case GRN_OP_SIMILAR :
+        arg.mode = optarg->mode;
+        break;
+      default :
+        break;
       }
       if (optarg->vector_size > 0) {
         arg.weight_vector = optarg->weight_vector;

  Added: test/function/suite/select/filter/near.expected (+56 -0) 100644
===================================================================
--- /dev/null
+++ test/function/suite/select/filter/near.expected    2012-07-08 18:30:26 +0900 (95d3492)
@@ -0,0 +1,56 @@
+table_create Documents TABLE_HASH_KEY ShortText
+[[0,0.0,0.0],true]
+column_create Documents content COLUMN_SCALAR Text
+[[0,0.0,0.0],true]
+table_create Terms TABLE_PAT_KEY|KEY_NORMALIZE ShortText --default_tokenizer TokenBigram
+[[0,0.0,0.0],true]
+column_create Terms document_index COLUMN_INDEX|WITH_POSITION Documents content
+[[0,0.0,0.0],true]
+load --table Documents
+[
+["_key", "content"],
+["groonga ã®æ¦‚è¦", "groonga ã¯è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸé«˜é€Ÿãƒ»é«˜ç²¾åº¦ãªå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã‚ã‚Šã€ç™»éŒ²ã•ã‚ŒãŸæ–‡æ›¸ã‚’ã™ãã«æ¤œç´¢çµæžœã«åæ˜ ã§ãã¾ã™ã€‚ã¾ãŸã€å‚ç…§ã‚’ãƒ–ãƒãƒƒã‚¯ã›ãšã«æ›´æ–°ã§ãã‚‹ã“ã¨ã‹ã‚‰ã€å³æ™‚æ›´æ–°ã®å¿…è¦ãªã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«ãŠã„ã¦ã‚‚é«˜ã„æ€§èƒ½ã‚’ç™ºæ®ã—ã¾ã™ã€‚\n\nå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦é–‹ç™ºã•ã‚ŒãŸ groonga ã§ã™ãŒã€ç‹¬è‡ªã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŒã¤åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã—ã¦ã®å´é¢ã‚‚æŒã£ã¦ã„ã¾ã™ã€‚ãã®ãŸã‚ã€MySQL ã‚„ PostgreSQL ãªã©ã€æ—¢å˜ã®ä»£è¡¨çš„ãªãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ãŒè‹¦æ‰‹ã¨ã™ã‚‹é›†è¨ˆã‚¯ã‚¨ãƒªã‚’é«˜é€Ÿã«å‡¦ç†ã§ãã‚‹ã¨ã„ã†ç‰¹å¾´ãŒã‚ã‚Šã€çµ„ã¿åˆã‚ã›ã«ã‚ˆã£ã¦å¼±ç‚¹ã‚’è£œã†ã‚ˆã†ãªä½¿ã„æ–¹ã‚‚ã§ãã¾ã™ã€‚\n\ngroonga ã®åŸºæœ¬æ©Ÿèƒ½ã¯ C ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã¨ã—ã¦æä¾›ã•ã‚Œã¦ã„ã¾ã™ãŒã€MySQL ã‚„ PostgreSQL ã¨é€£æºã•ã›ãŸã‚Šã€Ruby ã‹ã‚‰å‘¼ã³å‡ºã—ãŸã‚Šã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ãã®ãŸã‚ã€ä»»æ
 „ã®ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«çµ„ã¿è¾¼ã‚€ã“ã¨ãŒå¯èƒ½ã§ã‚ã‚Šã€å¤šæ§˜ãªä½¿ã„æ–¹ãŒè€ƒãˆã‚‰ã‚Œã¾ã™ã€‚ èˆˆå‘³ã®ã‚ã‚‹æ–¹ã¯ åˆ©ç”¨ä¾‹ ã‚’ã”è¦§ãã ã•ã„ã€‚"],
+["å…¨æ–‡æ¤œç´¢ã¨å³æ™‚æ›´æ–°", "ä¸€èˆ¬çš„ãªãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã«ãŠã„ã¦ã¯ã€è¿½åŠ ãƒ»å‰Šé™¤ãªã©ã®æ“ä½œãŒã™ãã«åæ˜ ã•ã‚Œã¾ã™ã€‚ä¸€æ–¹ã€å…¨æ–‡æ¤œç´¢ã«ãŠã„ã¦ã¯ã€è»¢ç½®ç´¢å¼•ãŒé€æ¬¡æ›´æ–°ã®é›£ã—ã„ãƒ‡ãƒ¼ã‚¿æ§‹é€ ã§ã‚ã‚‹ã“ã¨ã‹ã‚‰ã€æ–‡æ›¸ã®è¿½åŠ ãƒ»å‰Šé™¤ã«å¯¾å¿œã—ãªã„ã‚¨ãƒ³ã‚¸ãƒ³ãŒå°‘ãªãã‚ã‚Šã¾ã›ã‚“ã€‚\n\nã“ã‚Œã«å¯¾ã—ã€è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã‚ã‚ŠãªãŒã‚‰ã€groonga ã¯æ–‡æ›¸ã‚’çŸæ™‚é–“ã§è¿½åŠ ãƒ»å‰Šé™¤ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ãã®ä¸Šã€æ›´æ–°ã—ãªãŒã‚‰ã§ã‚‚æ¤œç´¢ã§ãã‚‹ã¨ã„ã†å„ªã‚ŒãŸç‰¹å¾´ã‚’æŒã£ã¦ã„ã‚‹ãŸã‚ã€å…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ã¯ã¨ã¦ã‚‚æŸ”è»Ÿæ€§ãŒã‚ã‚Šã¾ã™ã€‚ã¾ãŸã€è¤‡æ•°ã®è»¢ç½®ç´¢å¼•ã‚’çµ±åˆã™ã‚‹ã‚ˆã†ãªé‡ã„å‡¦ç†ã‚’å¿…è¦ã¨ã—ãªã„ã®ã§ã€å®‰å®šã—ã¦é«˜ã„æ€§èƒ½ã‚’ç™ºæ®ã™ã‚‹ã“ã¨ãŒæœŸå¾…ã§ãã¾ã™ã€‚"],
+["ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã¨é›†è¨ˆã‚¯ã‚¨ãƒª", "ç¾ä»£ã¯ã€ã‚¤ãƒ³ã‚¿ãƒ¼ãƒãƒƒãƒˆã‚’æƒ…å ±æºã¨ã™ã‚Œã°ã€ã„ãã‚‰ã§ã‚‚æƒ…å ±ã‚’åŽé›†ã§ãã‚‹æ™‚ä»£ã§ã™ã€‚ã—ã‹ã—ã€è†¨å¤§ãªæƒ…å ±ã‹ã‚‰æœ‰ç›Šãªæƒ…å ±ã‚’å¼•ãå‡ºã™ã®ã¯å›°é›£ã§ã‚ã‚Šã€å¤šé¢çš„ãªåˆ†æžã«ã‚ˆã‚‹è©¦è¡ŒéŒ¯èª¤ãŒå¿…è¦ã¨ãªã‚Šã¾ã™ã€‚ãŸã¨ãˆã°ã€æ—¥ä»˜ã‚„æ™‚é–“å¸¯ã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã€åœ°åŸŸã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã€æ€§åˆ¥ã‚„å¹´é½¢ã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã™ã‚‹ã“ã¨ã§ã—ã‚‡ã†ã€‚ãã—ã¦ã€ãã®ã‚ˆã†ãªã¨ãã«ä¾¿åˆ©ãªå˜åœ¨ãŒé›†è¨ˆã‚¯ã‚¨ãƒªã§ã™ã€‚\n\né›†è¨ˆã‚¯ã‚¨ãƒªã¨ã¯ã€æŒ‡å®šã—ãŸã‚«ãƒ©ãƒ ã®å€¤ã«ã‚ˆã£ã¦ãƒ¬ã‚³ãƒ¼ãƒ‰ã‚’ã‚°ãƒ«ãƒ¼ãƒ—åŒ–ã—ã€å„ã‚°ãƒ«ãƒ¼ãƒ—ã«å«ã¾ã‚Œã‚‹ãƒ¬ã‚³ãƒ¼ãƒ‰ã®æ•°ã‚’æ±‚ã‚ã‚‹ã‚¯ã‚¨ãƒªã§ã™ã€‚ãŸã¨ãˆã°ã€åœ°åŸŸã® ID ã‚’æ ¼ç´ã—ã¦ã„ã‚‹ã‚«ãƒ©ãƒ ã‚’æŒ‡å®šã™ã‚Œã°ã€åœ°åŸŸæ¯Žã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ãŒæ±‚ã¾ã‚Šã¾ã™ã€‚æ—¥ä»˜ã®ã‚«ãƒ©ãƒ ã‚’æŒ‡å®šã—ãŸã¨ãã®å‡ºåŠ›ã‚’ã‚°ãƒ©ãƒ•åŒ–ã™ã‚Œã°ã€ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ã®æ™‚é–“å¤‰åŒ–ã‚’
 è¦–è¦šåŒ–ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã•ã‚‰ã«ã€åœ°åŸŸã«ã‚ˆã‚‹çµžã‚Šè¾¼ã¿ã¨æ—¥ä»˜ã«å¯¾ã™ã‚‹é›†è¨ˆã‚¯ã‚¨ãƒªã‚’çµ„ã¿åˆã‚ã›ã‚Œã°ã€ç‰¹å®šã®åœ°åŸŸã«ãŠã‘ã‚‹ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ã®æ™‚é–“å¤‰åŒ–ã‚’è¦–è¦šåŒ–ã“ã¨ã‚‚å¯èƒ½ã§ã™ã€‚ã“ã®ã‚ˆã†ã«ã€å°ºåº¦ã‚’è‡ªç”±ã«é¸æŠžã—ã¦çµžã‚Šè¾¼ã¿ãƒ»é›†è¨ˆã§ãã‚‹ã“ã¨ã¯ã€è†¨å¤§ãªæƒ…å ±ã‚’æ‰±ã†ä¸Šã§ã¨ã¦ã‚‚é‡è¦ã«ãªã‚Šã¾ã™ã€‚\n\ngroonga ãŒé›†è¨ˆã‚¯ã‚¨ãƒªã‚’é«˜é€Ÿã«å‡¦ç†ã§ãã‚‹ç†ç”±ã¯ã€ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã®è«–ç†æ§‹é€ ã«ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŽ¡ç”¨ã—ã¦ã„ã‚‹ã‹ã‚‰ã§ã™ã€‚é›†è¨ˆã‚¯ã‚¨ãƒªãŒå‚ç…§ã™ã‚‹ã®ã¯æŒ‡å®šã•ã‚ŒãŸã‚«ãƒ©ãƒ ã®ã¿ã§ã‚ã‚‹ãŸã‚ã€ã‚«ãƒ©ãƒ å˜ä½ã§ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã™ã‚‹åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã§ã¯ã€å¿…è¦ãªã‚«ãƒ©ãƒ ã®ã¿ã‚’ç„¡é§„ãªãèªã¿å‡ºã›ã‚‹ã“ã¨ãŒåˆ©ç‚¹ã¨ãªã‚Šã¾ã™ã€‚ä¸€æ–¹ã€ãƒ¬ã‚³ãƒ¼ãƒ‰å˜ä½ã§ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã™ã‚‹è¡ŒæŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã§ã¯ã€éš£æŽ¥ã™ã‚‹ã‚«ãƒ©ãƒ ã‚’ã¾ã¨ã‚ã¦èªã¿å‡ºã—ã¦ã—ã¾ã†ã“ã¨ãŒæ¬ ç‚¹ã¨ãªã‚Šã¾ã™ã€‚"],
+["è»¢ç½®ç´¢å¼•ã¨ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶", "è»¢ç½®ç´¢å¼•ã¯å¤§è¦æ¨¡ãªå…¨æ–‡æ¤œç´¢ã«ç”¨ã„ã‚‰ã‚Œã‚‹ä¼çµ±çš„ãªãƒ‡ãƒ¼ã‚¿æ§‹é€ ã§ã™ã€‚è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã¯ã€æ–‡æ›¸ã‚’è¿½åŠ ã™ã‚‹ã¨ãã«ç´¢å¼•èªžã‚’è¨˜éŒ²ã—ã¦ãŠãã€æ¤œç´¢ã™ã‚‹ã¨ãã¯ã‚¯ã‚¨ãƒªã‚’ç´¢å¼•èªžã«åˆ†å‰²ã—ã¦å‡ºç¾æ–‡æ›¸ã‚’æ±‚ã‚ã¾ã™ã€‚ãã®ãŸã‚ã€æ–‡æ›¸ã‚„ã‚¯ã‚¨ãƒªã‹ã‚‰ç´¢å¼•èªžã‚’æŠœãå‡ºã™æ–¹æ³•ãŒé‡è¦ã«ãªã‚Šã¾ã™ã€‚\n\nãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ã€æ–‡å—åˆ—ã‹ã‚‰ç´¢å¼•èªžã‚’æŠœãå‡ºã™ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã§ã™ã€‚æ—¥æœ¬èªžã‚’å¯¾è±¡ã¨ã™ã‚‹å…¨æ–‡æ¤œç´¢ã«ãŠã„ã¦ã¯ã€å½¢æ…‹ç´ ã‚’ç´¢å¼•èªžã¨ã—ã¦æŠœãå‡ºã™æ–¹å¼ã¨æ–‡å— N-gram ã‚’æŠœãå‡ºã™æ–¹å¼ã®ã„ãšã‚Œã‹ã€ã‚ã‚‹ã„ã¯ä¸¡æ–¹ã‚’ç”¨ã„ã‚‹ã®ãŒä¸€èˆ¬çš„ã§ã™ã€‚å½¢æ…‹ç´ æ–¹å¼ã¯æ¤œç´¢æ™‚é–“ã‚„ç´¢å¼•ã‚µã‚¤ã‚ºã®é¢ã§å„ªã‚Œã¦ã„ã‚‹ã»ã‹ã€æ¤œç´¢çµæžœã«ä¸è¦ãªæ–‡æ›¸ãŒå«ã¾ã‚Œã«ãã„ã¨ã„ã†åˆ©ç‚¹ã‚’æŒã£ã¦ã„ã¾ã™ã€‚ä¸€æ–¹ã€N-gram æ–¹å¼ã«ã¯æ¤œç´¢æ¼ã‚ŒãŒç™ºç”Ÿã—ã«ãã„ã¨ã„ã†åˆ©ç‚¹ã
 Œã‚ã‚Šã€çŠ¶æ³ã«ã‚ˆã£ã¦é©ã—ãŸæ–¹å¼ã‚’é¸æŠžã™ã‚‹ã“ã¨ãŒæœ›ã¾ã—ã„ã¨ã•ã‚Œã¦ã„ã¾ã™ã€‚\n\ngroonga ã¯å½¢æ…‹ç´ æ–¹å¼ã¨ N-gram æ–¹å¼ã®ä¸¡æ–¹ã«å¯¾å¿œã—ã¦ã„ã¾ã™ã€‚åˆæœŸçŠ¶æ…‹ã§åˆ©ç”¨ã§ãã‚‹ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ç©ºç™½ã‚’åŒºåˆ‡ã‚Šæ–‡å—ã¨ã—ã¦ç”¨ã„ã‚‹æ–¹å¼ã¨ N-gram æ–¹å¼ã®ã¿ã§ã™ãŒã€å½¢æ…‹ç´ è§£æžå™¨ MeCab ã‚’çµ„ã¿è¾¼ã‚“ã ã¨ãã¯ MeCab ã«ã‚ˆã‚‹åˆ†ã‹ã¡æ›¸ãã®çµæžœã‚’ç”¨ã„ã‚‹å½¢æ…‹ç´ æ–¹å¼ãŒæœ‰åŠ¹ã«ãªã‚Šã¾ã™ã€‚ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã—ã¦è¿½åŠ ã§ãã‚‹ãŸã‚ã€ç‰¹å¾´çš„ãªã‚ãƒ¼ãƒ¯ãƒ¼ãƒ‰ã®ã¿ã‚’ç´¢å¼•èªžã¨ã—ã¦æŽ¡ç”¨ã™ã‚‹ãªã©ã€ç‹¬è‡ªã®ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã‚’é–‹ç™ºã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã™ã€‚"],
+["å…±æœ‰å¯èƒ½ãªã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¨å‚ç…§ãƒãƒƒã‚¯ãƒ•ãƒªãƒ¼", "CPU ã®ãƒžãƒ«ãƒã‚³ã‚¢åŒ–ãŒé€²ã‚“ã§ã„ã‚‹ãŸã‚ã€åŒæ™‚ã«è¤‡æ•°ã®ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ãŸã‚Šã€ä¸€ã¤ã®ã‚¯ã‚¨ãƒªã‚’è¤‡æ•°ã®ã‚¹ãƒ¬ãƒƒãƒ‰ã§å®Ÿè¡Œã—ãŸã‚Šã™ã‚‹ã“ã¨ã®é‡è¦æ€§ã¯ã¾ã™ã¾ã™é«˜ã¾ã£ã¦ã„ã¾ã™ã€‚\n\ngroonga ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¯ã€è¤‡æ•°ã®ã‚¹ãƒ¬ãƒƒãƒ‰ãƒ»ãƒ—ãƒã‚»ã‚¹ã§å…±æœ‰ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã¾ãŸã€å‚ç…§ãƒãƒƒã‚¯ãƒ•ãƒªãƒ¼ãªãƒ‡ãƒ¼ã‚¿æ§‹é€ ã‚’æŽ¡ç”¨ã—ã¦ã„ã‚‹ãŸã‚ã€æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ã¦ã„ã‚‹çŠ¶æ³ã§ã‚‚å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã§ãã‚‹çŠ¶æ…‹ã‚’ç¶æŒã—ãªãŒã‚‰æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã§ãã‚‹ã®ã§ã€ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ãªã‚·ã‚¹ãƒ†ãƒ ã«é©ã—ã¦ã„ã¾ã™ã€‚ã•ã‚‰ã«ã¯ã€MySQL ã‚’ä»‹ã—ã¦æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ã¦ã„ã‚‹æœ€ä¸ã« groonga ã® HTTP ã‚µãƒ¼ãƒã‚’ä»‹ã—ã¦å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã™ã‚‹ãªã©ã€å¤šå½©ãªé‹ç”¨ãŒå¯èƒ½ã¨ãªã£ã¦ã„ã¾ã™ã€‚"],
+["ä½ç½®æƒ…å ±ï¼ˆç·¯åº¦ãƒ»çµŒåº¦ï¼‰æ¤œç´¢", "GPS ã«ä»£è¡¨ã•ã‚Œã‚‹æ¸¬ä½ã‚·ã‚¹ãƒ†ãƒ ã‚’æè¼‰ã—ãŸé«˜æ©Ÿèƒ½ãªæºå¸¯ç«¯æœ«ã®æ™®åŠãªã©ã«ã‚ˆã£ã¦ã€ä½ç½®æƒ…å ±ã‚’æ‰±ã†ã‚µãƒ¼ãƒ“ã‚¹ã¯ã¾ã™ã¾ã™ä¾¿åˆ©ã«ãªã£ã¦ã„ã¾ã™ã€‚ãŸã¨ãˆã°ã€è¿‘ãã«ã‚ã‚‹ãƒ¬ã‚¹ãƒˆãƒ©ãƒ³ã‚’æŽ¢ã—ã¦ã„ã‚‹ã¨ãã¯ã€ç¾åœ¨åœ°ã‹ã‚‰ã®è·é›¢ã‚’åŸºæº–ã¨ã—ã¦æ¤œç´¢ã‚’ãŠã“ãªã„ã€æ¤œç´¢çµæžœã‚’åœ°å›³ä¸Šã«è¡¨ç¤ºã—ã¦ãã‚Œã‚‹ã‚ˆã†ãªã‚µãƒ¼ãƒ“ã‚¹ãŒä¾¿åˆ©ã§ã™ã€‚ãã®ãŸã‚ã€ä½ç½®æƒ…å ±æ¤œç´¢ã‚’é«˜é€Ÿã«å®Ÿç¾ã§ãã‚‹ã“ã¨ãŒé‡è¦ã«ãªã£ã¦ã„ã¾ã™ã€‚\n\ngroonga ã§ã¯è»¢ç½®ç´¢å¼•ã‚’å¿œç”¨ã—ã¦é«˜é€Ÿãªä½ç½®æƒ…å ±æ¤œç´¢ã‚’å®Ÿç¾ã—ã¦ã„ã¾ã™ã€‚çŸ©å½¢ãƒ»å††ã«ã‚ˆã‚‹ç¯„å›²æ¤œç´¢ã«å¯¾å¿œã—ã¦ã„ã‚‹ã»ã‹ã€åŸºæº–ç‚¹ã®è¿‘ãã‚’å„ªå…ˆçš„ã«æŽ¢ç´¢ã•ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã¾ãŸã€è·é›¢è¨ˆç®—ã‚’ã‚µãƒãƒ¼ãƒˆã—ã¦ã„ã‚‹ã®ã§ã€ä½ç½®æƒ…å ±æ¤œç´¢ã®çµæžœã‚’åŸºæº–ç‚¹ã‹ã‚‰ã®è·é›¢ã«ã‚ˆã£ã¦æ•´åˆ—ã™ã‚‹ã“ã¨ã‚‚å¯èƒ½ã§ã™ã€‚"],
+["groonga ãƒ©ã‚¤ãƒ–ãƒ©ãƒª", "Groonga ã®åŸºæœ¬æ©Ÿèƒ½ã¯ C ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã¨ã—ã¦æä¾›ã•ã‚Œã¦ã„ã‚‹ã®ã§ã€ä»»æ„ã®ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«çµ„ã¿è¾¼ã‚“ã§åˆ©ç”¨ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚C/C++ ä»¥å¤–ã«ã¤ã„ã¦ã¯ã€Ruby ã‹ã‚‰ groonga ã‚’åˆ©ç”¨ã™ã‚‹ãƒ©ã‚¤ãƒ–ãƒ©ãƒªãªã©ãŒé–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆã«ãŠã„ã¦æä¾›ã•ã‚Œã¦ã„ã¾ã™ã€‚è©³ã—ãã¯ é–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆ ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚"],
+["groonga ã‚µãƒ¼ãƒ", "groonga ã«ã¯ã‚µãƒ¼ãƒæ©Ÿèƒ½ãŒã‚ã‚‹ãŸã‚ã€ãƒ¬ãƒ³ã‚¿ãƒ«ã‚µãƒ¼ãƒãªã©ã®æ–°ã—ã„ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã§ããªã„ç’°å¢ƒã«ãŠã„ã¦ã‚‚åˆ©ç”¨ã§ãã¾ã™ã€‚å¯¾å¿œã—ã¦ã„ã‚‹ã®ã¯ HTTP, memcached binary ãƒ—ãƒãƒˆã‚³ãƒ«ã€ãŠã‚ˆã³ã« groonga ã®ç‹¬è‡ªãƒ—ãƒãƒˆã‚³ãƒ«ã§ã‚ã‚‹ gqtp ã§ã™ã€‚ã‚µãƒ¼ãƒã¨ã—ã¦åˆ©ç”¨ã™ã‚‹ã¨ãã¯ã‚¯ã‚¨ãƒªã®ã‚ãƒ£ãƒƒã‚·ãƒ¥æ©Ÿèƒ½ãŒæœ‰åŠ¹ã«ãªã‚‹ãŸã‚ã€åŒã˜ã‚¯ã‚¨ãƒªã‚’å—ã‘å–ã£ãŸã¨ãã¯å¿œç”æ™‚é–“ãŒçŸããªã‚‹ã¨ã„ã†ç‰¹å¾´ãŒã‚ã‚Šã¾ã™ã€‚"],
+["groonga ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³", "groonga ã¯ç‹¬è‡ªã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŒã¤åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã—ã¦ã®å´é¢ã‚’æŒã£ã¦ã„ã¾ã™ãŒã€æ—¢å˜ã® RDBMS ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦åˆ©ç”¨ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ãŸã¨ãˆã°ã€groonga ã‚’ãƒ™ãƒ¼ã‚¹ã¨ã™ã‚‹ MySQL ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ mroonga ãŒé–‹ç™ºã•ã‚Œã¦ã„ã¾ã™ã€‚mroonga ã¯ MySQL ã®ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã—ã¦å‹•çš„ã«ãƒãƒ¼ãƒ‰ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã‚ã‚Šã€groonga ã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¨ã—ã¦åˆ©ç”¨ã—ãŸã‚Šã€å…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ groonga ã‚’ MyISAM ã‚„ InnoDB ã¨é€£æºã•ã›ãŸã‚Šã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚groonga å˜ä½“ã§ã®åˆ©ç”¨ã€ãŠã‚ˆã³ã« MyISAM, InnoDB ã¨ã®é€£æºã«ã¯ä¸€é•·ä¸€çŸãŒã‚ã‚‹ã®ã§ã€ç”¨é€”ã«å¿œã˜ã¦é©åˆ‡ãªçµ„ã¿åˆã‚ã›ã‚’é¸ã¶ã“ã¨ãŒå¤§åˆ‡ã§ã™ã€‚è©³ã—ãã¯ é–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆ ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚"]
+]
+[[0,0.0,0.0],9]
+select Documents --filter 'content *N "groonga MySQL"' --output_columns '_key, _score, content'
+[
+  [
+    0,
+    0.0,
+    0.0
+  ],
+  [
+    [
+      [
+        1
+      ],
+      [
+        [
+          "_key",
+          "ShortText"
+        ],
+        [
+          "_score",
+          "Int32"
+        ],
+        [
+          "content",
+          "Text"
+        ]
+      ],
+      [
+        "groonga ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³",
+        1,
+        "groonga ã¯ç‹¬è‡ªã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŒã¤åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã—ã¦ã®å´é¢ã‚’æŒã£ã¦ã„ã¾ã™ãŒã€æ—¢å˜ã® RDBMS ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦åˆ©ç”¨ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ãŸã¨ãˆã°ã€groonga ã‚’ãƒ™ãƒ¼ã‚¹ã¨ã™ã‚‹ MySQL ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ mroonga ãŒé–‹ç™ºã•ã‚Œã¦ã„ã¾ã™ã€‚mroonga ã¯ MySQL ã®ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã—ã¦å‹•çš„ã«ãƒãƒ¼ãƒ‰ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã‚ã‚Šã€groonga ã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¨ã—ã¦åˆ©ç”¨ã—ãŸã‚Šã€å…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ groonga ã‚’ MyISAM ã‚„ InnoDB ã¨é€£æºã•ã›ãŸã‚Šã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚groonga å˜ä½“ã§ã®åˆ©ç”¨ã€ãŠã‚ˆã³ã« MyISAM, InnoDB ã¨ã®é€£æºã«ã¯ä¸€é•·ä¸€çŸãŒã‚ã‚‹ã®ã§ã€ç”¨é€”ã«å¿œã˜ã¦é©åˆ‡ãªçµ„ã¿åˆã‚ã›ã‚’é¸ã¶ã“ã¨ãŒå¤§åˆ‡ã§ã™ã€‚è©³ã—ãã¯ é–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆ ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚"
+      ]
+    ]
+  ]
+]

  Added: test/function/suite/select/filter/near.test (+21 -0) 100644
===================================================================
--- /dev/null
+++ test/function/suite/select/filter/near.test    2012-07-08 18:30:26 +0900 (811141a)
@@ -0,0 +1,21 @@
+table_create Documents TABLE_HASH_KEY ShortText
+column_create Documents content COLUMN_SCALAR Text
+
+table_create Terms TABLE_PAT_KEY|KEY_NORMALIZE ShortText --default_tokenizer TokenBigram
+column_create Terms document_index COLUMN_INDEX|WITH_POSITION Documents content
+
+load --table Documents
+[
+["_key", "content"],
+["groonga ã®æ¦‚è¦", "groonga ã¯è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸé«˜é€Ÿãƒ»é«˜ç²¾åº¦ãªå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã‚ã‚Šã€ç™»éŒ²ã•ã‚ŒãŸæ–‡æ›¸ã‚’ã™ãã«æ¤œç´¢çµæžœã«åæ˜ ã§ãã¾ã™ã€‚ã¾ãŸã€å‚ç…§ã‚’ãƒ–ãƒãƒƒã‚¯ã›ãšã«æ›´æ–°ã§ãã‚‹ã“ã¨ã‹ã‚‰ã€å³æ™‚æ›´æ–°ã®å¿…è¦ãªã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«ãŠã„ã¦ã‚‚é«˜ã„æ€§èƒ½ã‚’ç™ºæ®ã—ã¾ã™ã€‚\n\nå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦é–‹ç™ºã•ã‚ŒãŸ groonga ã§ã™ãŒã€ç‹¬è‡ªã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŒã¤åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã—ã¦ã®å´é¢ã‚‚æŒã£ã¦ã„ã¾ã™ã€‚ãã®ãŸã‚ã€MySQL ã‚„ PostgreSQL ãªã©ã€æ—¢å˜ã®ä»£è¡¨çš„ãªãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ãŒè‹¦æ‰‹ã¨ã™ã‚‹é›†è¨ˆã‚¯ã‚¨ãƒªã‚’é«˜é€Ÿã«å‡¦ç†ã§ãã‚‹ã¨ã„ã†ç‰¹å¾´ãŒã‚ã‚Šã€çµ„ã¿åˆã‚ã›ã«ã‚ˆã£ã¦å¼±ç‚¹ã‚’è£œã†ã‚ˆã†ãªä½¿ã„æ–¹ã‚‚ã§ãã¾ã™ã€‚\n\ngroonga ã®åŸºæœ¬æ©Ÿèƒ½ã¯ C ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã¨ã—ã¦æä¾›ã•ã‚Œã¦ã„ã¾ã™ãŒã€MySQL ã‚„ PostgreSQL ã¨é€£æºã•ã›ãŸã‚Šã€Ruby ã‹ã‚‰å‘¼ã³å‡ºã—ãŸã‚Šã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ãã®ãŸã‚ã€ä»»æ
 „ã®ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«çµ„ã¿è¾¼ã‚€ã“ã¨ãŒå¯èƒ½ã§ã‚ã‚Šã€å¤šæ§˜ãªä½¿ã„æ–¹ãŒè€ƒãˆã‚‰ã‚Œã¾ã™ã€‚ èˆˆå‘³ã®ã‚ã‚‹æ–¹ã¯ åˆ©ç”¨ä¾‹ ã‚’ã”è¦§ãã ã•ã„ã€‚"],
+["å…¨æ–‡æ¤œç´¢ã¨å³æ™‚æ›´æ–°", "ä¸€èˆ¬çš„ãªãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã«ãŠã„ã¦ã¯ã€è¿½åŠ ãƒ»å‰Šé™¤ãªã©ã®æ“ä½œãŒã™ãã«åæ˜ ã•ã‚Œã¾ã™ã€‚ä¸€æ–¹ã€å…¨æ–‡æ¤œç´¢ã«ãŠã„ã¦ã¯ã€è»¢ç½®ç´¢å¼•ãŒé€æ¬¡æ›´æ–°ã®é›£ã—ã„ãƒ‡ãƒ¼ã‚¿æ§‹é€ ã§ã‚ã‚‹ã“ã¨ã‹ã‚‰ã€æ–‡æ›¸ã®è¿½åŠ ãƒ»å‰Šé™¤ã«å¯¾å¿œã—ãªã„ã‚¨ãƒ³ã‚¸ãƒ³ãŒå°‘ãªãã‚ã‚Šã¾ã›ã‚“ã€‚\n\nã“ã‚Œã«å¯¾ã—ã€è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã‚ã‚ŠãªãŒã‚‰ã€groonga ã¯æ–‡æ›¸ã‚’çŸæ™‚é–“ã§è¿½åŠ ãƒ»å‰Šé™¤ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ãã®ä¸Šã€æ›´æ–°ã—ãªãŒã‚‰ã§ã‚‚æ¤œç´¢ã§ãã‚‹ã¨ã„ã†å„ªã‚ŒãŸç‰¹å¾´ã‚’æŒã£ã¦ã„ã‚‹ãŸã‚ã€å…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ã¯ã¨ã¦ã‚‚æŸ”è»Ÿæ€§ãŒã‚ã‚Šã¾ã™ã€‚ã¾ãŸã€è¤‡æ•°ã®è»¢ç½®ç´¢å¼•ã‚’çµ±åˆã™ã‚‹ã‚ˆã†ãªé‡ã„å‡¦ç†ã‚’å¿…è¦ã¨ã—ãªã„ã®ã§ã€å®‰å®šã—ã¦é«˜ã„æ€§èƒ½ã‚’ç™ºæ®ã™ã‚‹ã“ã¨ãŒæœŸå¾…ã§ãã¾ã™ã€‚"],
+["ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã¨é›†è¨ˆã‚¯ã‚¨ãƒª", "ç¾ä»£ã¯ã€ã‚¤ãƒ³ã‚¿ãƒ¼ãƒãƒƒãƒˆã‚’æƒ…å ±æºã¨ã™ã‚Œã°ã€ã„ãã‚‰ã§ã‚‚æƒ…å ±ã‚’åŽé›†ã§ãã‚‹æ™‚ä»£ã§ã™ã€‚ã—ã‹ã—ã€è†¨å¤§ãªæƒ…å ±ã‹ã‚‰æœ‰ç›Šãªæƒ…å ±ã‚’å¼•ãå‡ºã™ã®ã¯å›°é›£ã§ã‚ã‚Šã€å¤šé¢çš„ãªåˆ†æžã«ã‚ˆã‚‹è©¦è¡ŒéŒ¯èª¤ãŒå¿…è¦ã¨ãªã‚Šã¾ã™ã€‚ãŸã¨ãˆã°ã€æ—¥ä»˜ã‚„æ™‚é–“å¸¯ã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã€åœ°åŸŸã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã€æ€§åˆ¥ã‚„å¹´é½¢ã«ã‚ˆã‚Šçµžã‚Šè¾¼ã‚“ã§ã¿ãŸã‚Šã™ã‚‹ã“ã¨ã§ã—ã‚‡ã†ã€‚ãã—ã¦ã€ãã®ã‚ˆã†ãªã¨ãã«ä¾¿åˆ©ãªå˜åœ¨ãŒé›†è¨ˆã‚¯ã‚¨ãƒªã§ã™ã€‚\n\né›†è¨ˆã‚¯ã‚¨ãƒªã¨ã¯ã€æŒ‡å®šã—ãŸã‚«ãƒ©ãƒ ã®å€¤ã«ã‚ˆã£ã¦ãƒ¬ã‚³ãƒ¼ãƒ‰ã‚’ã‚°ãƒ«ãƒ¼ãƒ—åŒ–ã—ã€å„ã‚°ãƒ«ãƒ¼ãƒ—ã«å«ã¾ã‚Œã‚‹ãƒ¬ã‚³ãƒ¼ãƒ‰ã®æ•°ã‚’æ±‚ã‚ã‚‹ã‚¯ã‚¨ãƒªã§ã™ã€‚ãŸã¨ãˆã°ã€åœ°åŸŸã® ID ã‚’æ ¼ç´ã—ã¦ã„ã‚‹ã‚«ãƒ©ãƒ ã‚’æŒ‡å®šã™ã‚Œã°ã€åœ°åŸŸæ¯Žã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ãŒæ±‚ã¾ã‚Šã¾ã™ã€‚æ—¥ä»˜ã®ã‚«ãƒ©ãƒ ã‚’æŒ‡å®šã—ãŸã¨ãã®å‡ºåŠ›ã‚’ã‚°ãƒ©ãƒ•åŒ–ã™ã‚Œã°ã€ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ã®æ™‚é–“å¤‰åŒ–ã‚’
 è¦–è¦šåŒ–ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã•ã‚‰ã«ã€åœ°åŸŸã«ã‚ˆã‚‹çµžã‚Šè¾¼ã¿ã¨æ—¥ä»˜ã«å¯¾ã™ã‚‹é›†è¨ˆã‚¯ã‚¨ãƒªã‚’çµ„ã¿åˆã‚ã›ã‚Œã°ã€ç‰¹å®šã®åœ°åŸŸã«ãŠã‘ã‚‹ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ã®æ™‚é–“å¤‰åŒ–ã‚’è¦–è¦šåŒ–ã“ã¨ã‚‚å¯èƒ½ã§ã™ã€‚ã“ã®ã‚ˆã†ã«ã€å°ºåº¦ã‚’è‡ªç”±ã«é¸æŠžã—ã¦çµžã‚Šè¾¼ã¿ãƒ»é›†è¨ˆã§ãã‚‹ã“ã¨ã¯ã€è†¨å¤§ãªæƒ…å ±ã‚’æ‰±ã†ä¸Šã§ã¨ã¦ã‚‚é‡è¦ã«ãªã‚Šã¾ã™ã€‚\n\ngroonga ãŒé›†è¨ˆã‚¯ã‚¨ãƒªã‚’é«˜é€Ÿã«å‡¦ç†ã§ãã‚‹ç†ç”±ã¯ã€ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã®è«–ç†æ§‹é€ ã«ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŽ¡ç”¨ã—ã¦ã„ã‚‹ã‹ã‚‰ã§ã™ã€‚é›†è¨ˆã‚¯ã‚¨ãƒªãŒå‚ç…§ã™ã‚‹ã®ã¯æŒ‡å®šã•ã‚ŒãŸã‚«ãƒ©ãƒ ã®ã¿ã§ã‚ã‚‹ãŸã‚ã€ã‚«ãƒ©ãƒ å˜ä½ã§ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã™ã‚‹åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã§ã¯ã€å¿…è¦ãªã‚«ãƒ©ãƒ ã®ã¿ã‚’ç„¡é§„ãªãèªã¿å‡ºã›ã‚‹ã“ã¨ãŒåˆ©ç‚¹ã¨ãªã‚Šã¾ã™ã€‚ä¸€æ–¹ã€ãƒ¬ã‚³ãƒ¼ãƒ‰å˜ä½ã§ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã™ã‚‹è¡ŒæŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã§ã¯ã€éš£æŽ¥ã™ã‚‹ã‚«ãƒ©ãƒ ã‚’ã¾ã¨ã‚ã¦èªã¿å‡ºã—ã¦ã—ã¾ã†ã“ã¨ãŒæ¬ ç‚¹ã¨ãªã‚Šã¾ã™ã€‚"],
+["è»¢ç½®ç´¢å¼•ã¨ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶", "è»¢ç½®ç´¢å¼•ã¯å¤§è¦æ¨¡ãªå…¨æ–‡æ¤œç´¢ã«ç”¨ã„ã‚‰ã‚Œã‚‹ä¼çµ±çš„ãªãƒ‡ãƒ¼ã‚¿æ§‹é€ ã§ã™ã€‚è»¢ç½®ç´¢å¼•ã‚’ç”¨ã„ãŸå…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã§ã¯ã€æ–‡æ›¸ã‚’è¿½åŠ ã™ã‚‹ã¨ãã«ç´¢å¼•èªžã‚’è¨˜éŒ²ã—ã¦ãŠãã€æ¤œç´¢ã™ã‚‹ã¨ãã¯ã‚¯ã‚¨ãƒªã‚’ç´¢å¼•èªžã«åˆ†å‰²ã—ã¦å‡ºç¾æ–‡æ›¸ã‚’æ±‚ã‚ã¾ã™ã€‚ãã®ãŸã‚ã€æ–‡æ›¸ã‚„ã‚¯ã‚¨ãƒªã‹ã‚‰ç´¢å¼•èªžã‚’æŠœãå‡ºã™æ–¹æ³•ãŒé‡è¦ã«ãªã‚Šã¾ã™ã€‚\n\nãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ã€æ–‡å—åˆ—ã‹ã‚‰ç´¢å¼•èªžã‚’æŠœãå‡ºã™ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã§ã™ã€‚æ—¥æœ¬èªžã‚’å¯¾è±¡ã¨ã™ã‚‹å…¨æ–‡æ¤œç´¢ã«ãŠã„ã¦ã¯ã€å½¢æ…‹ç´ ã‚’ç´¢å¼•èªžã¨ã—ã¦æŠœãå‡ºã™æ–¹å¼ã¨æ–‡å— N-gram ã‚’æŠœãå‡ºã™æ–¹å¼ã®ã„ãšã‚Œã‹ã€ã‚ã‚‹ã„ã¯ä¸¡æ–¹ã‚’ç”¨ã„ã‚‹ã®ãŒä¸€èˆ¬çš„ã§ã™ã€‚å½¢æ…‹ç´ æ–¹å¼ã¯æ¤œç´¢æ™‚é–“ã‚„ç´¢å¼•ã‚µã‚¤ã‚ºã®é¢ã§å„ªã‚Œã¦ã„ã‚‹ã»ã‹ã€æ¤œç´¢çµæžœã«ä¸è¦ãªæ–‡æ›¸ãŒå«ã¾ã‚Œã«ãã„ã¨ã„ã†åˆ©ç‚¹ã‚’æŒã£ã¦ã„ã¾ã™ã€‚ä¸€æ–¹ã€N-gram æ–¹å¼ã«ã¯æ¤œç´¢æ¼ã‚ŒãŒç™ºç”Ÿã—ã«ãã„ã¨ã„ã†åˆ©ç‚¹ã
 Œã‚ã‚Šã€çŠ¶æ³ã«ã‚ˆã£ã¦é©ã—ãŸæ–¹å¼ã‚’é¸æŠžã™ã‚‹ã“ã¨ãŒæœ›ã¾ã—ã„ã¨ã•ã‚Œã¦ã„ã¾ã™ã€‚\n\ngroonga ã¯å½¢æ…‹ç´ æ–¹å¼ã¨ N-gram æ–¹å¼ã®ä¸¡æ–¹ã«å¯¾å¿œã—ã¦ã„ã¾ã™ã€‚åˆæœŸçŠ¶æ…‹ã§åˆ©ç”¨ã§ãã‚‹ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ç©ºç™½ã‚’åŒºåˆ‡ã‚Šæ–‡å—ã¨ã—ã¦ç”¨ã„ã‚‹æ–¹å¼ã¨ N-gram æ–¹å¼ã®ã¿ã§ã™ãŒã€å½¢æ…‹ç´ è§£æžå™¨ MeCab ã‚’çµ„ã¿è¾¼ã‚“ã ã¨ãã¯ MeCab ã«ã‚ˆã‚‹åˆ†ã‹ã¡æ›¸ãã®çµæžœã‚’ç”¨ã„ã‚‹å½¢æ…‹ç´ æ–¹å¼ãŒæœ‰åŠ¹ã«ãªã‚Šã¾ã™ã€‚ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã¯ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã—ã¦è¿½åŠ ã§ãã‚‹ãŸã‚ã€ç‰¹å¾´çš„ãªã‚ãƒ¼ãƒ¯ãƒ¼ãƒ‰ã®ã¿ã‚’ç´¢å¼•èªžã¨ã—ã¦æŽ¡ç”¨ã™ã‚‹ãªã©ã€ç‹¬è‡ªã®ãƒˆãƒ¼ã‚¯ãƒŠã‚¤ã‚¶ã‚’é–‹ç™ºã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã™ã€‚"],
+["å…±æœ‰å¯èƒ½ãªã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¨å‚ç…§ãƒãƒƒã‚¯ãƒ•ãƒªãƒ¼", "CPU ã®ãƒžãƒ«ãƒã‚³ã‚¢åŒ–ãŒé€²ã‚“ã§ã„ã‚‹ãŸã‚ã€åŒæ™‚ã«è¤‡æ•°ã®ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ãŸã‚Šã€ä¸€ã¤ã®ã‚¯ã‚¨ãƒªã‚’è¤‡æ•°ã®ã‚¹ãƒ¬ãƒƒãƒ‰ã§å®Ÿè¡Œã—ãŸã‚Šã™ã‚‹ã“ã¨ã®é‡è¦æ€§ã¯ã¾ã™ã¾ã™é«˜ã¾ã£ã¦ã„ã¾ã™ã€‚\n\ngroonga ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¯ã€è¤‡æ•°ã®ã‚¹ãƒ¬ãƒƒãƒ‰ãƒ»ãƒ—ãƒã‚»ã‚¹ã§å…±æœ‰ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã¾ãŸã€å‚ç…§ãƒãƒƒã‚¯ãƒ•ãƒªãƒ¼ãªãƒ‡ãƒ¼ã‚¿æ§‹é€ ã‚’æŽ¡ç”¨ã—ã¦ã„ã‚‹ãŸã‚ã€æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ã¦ã„ã‚‹çŠ¶æ³ã§ã‚‚å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã§ãã‚‹çŠ¶æ…‹ã‚’ç¶æŒã—ãªãŒã‚‰æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã§ãã‚‹ã®ã§ã€ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ãªã‚·ã‚¹ãƒ†ãƒ ã«é©ã—ã¦ã„ã¾ã™ã€‚ã•ã‚‰ã«ã¯ã€MySQL ã‚’ä»‹ã—ã¦æ›´æ–°ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã—ã¦ã„ã‚‹æœ€ä¸ã« groonga ã® HTTP ã‚µãƒ¼ãƒã‚’ä»‹ã—ã¦å‚ç…§ã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã™ã‚‹ãªã©ã€å¤šå½©ãªé‹ç”¨ãŒå¯èƒ½ã¨ãªã£ã¦ã„ã¾ã™ã€‚"],
+["ä½ç½®æƒ…å ±ï¼ˆç·¯åº¦ãƒ»çµŒåº¦ï¼‰æ¤œç´¢", "GPS ã«ä»£è¡¨ã•ã‚Œã‚‹æ¸¬ä½ã‚·ã‚¹ãƒ†ãƒ ã‚’æè¼‰ã—ãŸé«˜æ©Ÿèƒ½ãªæºå¸¯ç«¯æœ«ã®æ™®åŠãªã©ã«ã‚ˆã£ã¦ã€ä½ç½®æƒ…å ±ã‚’æ‰±ã†ã‚µãƒ¼ãƒ“ã‚¹ã¯ã¾ã™ã¾ã™ä¾¿åˆ©ã«ãªã£ã¦ã„ã¾ã™ã€‚ãŸã¨ãˆã°ã€è¿‘ãã«ã‚ã‚‹ãƒ¬ã‚¹ãƒˆãƒ©ãƒ³ã‚’æŽ¢ã—ã¦ã„ã‚‹ã¨ãã¯ã€ç¾åœ¨åœ°ã‹ã‚‰ã®è·é›¢ã‚’åŸºæº–ã¨ã—ã¦æ¤œç´¢ã‚’ãŠã“ãªã„ã€æ¤œç´¢çµæžœã‚’åœ°å›³ä¸Šã«è¡¨ç¤ºã—ã¦ãã‚Œã‚‹ã‚ˆã†ãªã‚µãƒ¼ãƒ“ã‚¹ãŒä¾¿åˆ©ã§ã™ã€‚ãã®ãŸã‚ã€ä½ç½®æƒ…å ±æ¤œç´¢ã‚’é«˜é€Ÿã«å®Ÿç¾ã§ãã‚‹ã“ã¨ãŒé‡è¦ã«ãªã£ã¦ã„ã¾ã™ã€‚\n\ngroonga ã§ã¯è»¢ç½®ç´¢å¼•ã‚’å¿œç”¨ã—ã¦é«˜é€Ÿãªä½ç½®æƒ…å ±æ¤œç´¢ã‚’å®Ÿç¾ã—ã¦ã„ã¾ã™ã€‚çŸ©å½¢ãƒ»å††ã«ã‚ˆã‚‹ç¯„å›²æ¤œç´¢ã«å¯¾å¿œã—ã¦ã„ã‚‹ã»ã‹ã€åŸºæº–ç‚¹ã®è¿‘ãã‚’å„ªå…ˆçš„ã«æŽ¢ç´¢ã•ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã¾ãŸã€è·é›¢è¨ˆç®—ã‚’ã‚µãƒãƒ¼ãƒˆã—ã¦ã„ã‚‹ã®ã§ã€ä½ç½®æƒ…å ±æ¤œç´¢ã®çµæžœã‚’åŸºæº–ç‚¹ã‹ã‚‰ã®è·é›¢ã«ã‚ˆã£ã¦æ•´åˆ—ã™ã‚‹ã“ã¨ã‚‚å¯èƒ½ã§ã™ã€‚"],
+["groonga ãƒ©ã‚¤ãƒ–ãƒ©ãƒª", "Groonga ã®åŸºæœ¬æ©Ÿèƒ½ã¯ C ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã¨ã—ã¦æä¾›ã•ã‚Œã¦ã„ã‚‹ã®ã§ã€ä»»æ„ã®ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«çµ„ã¿è¾¼ã‚“ã§åˆ©ç”¨ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚C/C++ ä»¥å¤–ã«ã¤ã„ã¦ã¯ã€Ruby ã‹ã‚‰ groonga ã‚’åˆ©ç”¨ã™ã‚‹ãƒ©ã‚¤ãƒ–ãƒ©ãƒªãªã©ãŒé–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆã«ãŠã„ã¦æä¾›ã•ã‚Œã¦ã„ã¾ã™ã€‚è©³ã—ãã¯ é–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆ ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚"],
+["groonga ã‚µãƒ¼ãƒ", "groonga ã«ã¯ã‚µãƒ¼ãƒæ©Ÿèƒ½ãŒã‚ã‚‹ãŸã‚ã€ãƒ¬ãƒ³ã‚¿ãƒ«ã‚µãƒ¼ãƒãªã©ã®æ–°ã—ã„ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã§ããªã„ç’°å¢ƒã«ãŠã„ã¦ã‚‚åˆ©ç”¨ã§ãã¾ã™ã€‚å¯¾å¿œã—ã¦ã„ã‚‹ã®ã¯ HTTP, memcached binary ãƒ—ãƒãƒˆã‚³ãƒ«ã€ãŠã‚ˆã³ã« groonga ã®ç‹¬è‡ªãƒ—ãƒãƒˆã‚³ãƒ«ã§ã‚ã‚‹ gqtp ã§ã™ã€‚ã‚µãƒ¼ãƒã¨ã—ã¦åˆ©ç”¨ã™ã‚‹ã¨ãã¯ã‚¯ã‚¨ãƒªã®ã‚ãƒ£ãƒƒã‚·ãƒ¥æ©Ÿèƒ½ãŒæœ‰åŠ¹ã«ãªã‚‹ãŸã‚ã€åŒã˜ã‚¯ã‚¨ãƒªã‚’å—ã‘å–ã£ãŸã¨ãã¯å¿œç”æ™‚é–“ãŒçŸããªã‚‹ã¨ã„ã†ç‰¹å¾´ãŒã‚ã‚Šã¾ã™ã€‚"],
+["groonga ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³", "groonga ã¯ç‹¬è‡ªã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’æŒã¤åˆ—æŒ‡å‘ã®ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ã¨ã—ã¦ã®å´é¢ã‚’æŒã£ã¦ã„ã¾ã™ãŒã€æ—¢å˜ã® RDBMS ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦åˆ©ç”¨ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ãŸã¨ãˆã°ã€groonga ã‚’ãƒ™ãƒ¼ã‚¹ã¨ã™ã‚‹ MySQL ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ mroonga ãŒé–‹ç™ºã•ã‚Œã¦ã„ã¾ã™ã€‚mroonga ã¯ MySQL ã®ãƒ—ãƒ©ã‚°ã‚¤ãƒ³ã¨ã—ã¦å‹•çš„ã«ãƒãƒ¼ãƒ‰ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã‚ã‚Šã€groonga ã®ã‚«ãƒ©ãƒ ã‚¹ãƒˆã‚¢ã‚’ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã¨ã—ã¦åˆ©ç”¨ã—ãŸã‚Šã€å…¨æ–‡æ¤œç´¢ã‚¨ãƒ³ã‚¸ãƒ³ã¨ã—ã¦ groonga ã‚’ MyISAM ã‚„ InnoDB ã¨é€£æºã•ã›ãŸã‚Šã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚groonga å˜ä½“ã§ã®åˆ©ç”¨ã€ãŠã‚ˆã³ã« MyISAM, InnoDB ã¨ã®é€£æºã«ã¯ä¸€é•·ä¸€çŸãŒã‚ã‚‹ã®ã§ã€ç”¨é€”ã«å¿œã˜ã¦é©åˆ‡ãªçµ„ã¿åˆã‚ã›ã‚’é¸ã¶ã“ã¨ãŒå¤§åˆ‡ã§ã™ã€‚è©³ã—ãã¯ é–¢é€£ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆ ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚"]
+]
+
+select Documents --filter 'content *N "groonga MySQL"' --output_columns '_key, _score, content'
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
下载 


Groonga - fulltext search engine.

[Groonga-commit] groonga/groonga [master] Support near search by 'column *N "word1 word2 ..."' in script syntax