Handle right-trucation for ICU normalized terms.
[idzebra-moved-to-github.git] / test / api / t17.c
index 1c82442..57d57f2 100644 (file)
@@ -1,4 +1,4 @@
-/* $Id: t17.c,v 1.6 2007-11-15 08:53:04 adam Exp $
+/* $Id: t17.c,v 1.12 2008-01-26 15:51:00 adam Exp $
    Copyright (C) 1995-2007
    Index Data ApS
 
@@ -26,10 +26,28 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
 #include <yaz/test.h>
 #include "testlib.h"
 
+/* utf-8 sequences for some characters */
+#define char_ae "\xc3\xa6"
+#define char_AE "\xc3\x86"
+
+#define char_oslash "\xc3\xb8"
+#define char_Oslash "\xc3\x98"
+
+#define char_aring "\xc3\xa5"
+#define char_Aring "\xc3\x85"
+
+#define char_comb_ring_above "\xcc\x8a"
+
+#define char_aring1 "a" char_comb_ring_above
+#define char_Aring1 "A" char_comb_ring_above
+
 const char *myrec[] = {
         "<gils>\n<title>My computer</title>\n</gils>\n",
         "<gils>\n<title>My x computer</title>\n</gils>\n",
         "<gils>\n<title>My computer x</title>\n</gils>\n" ,
+        "<gils>\n<title>" char_ae "</title>\n</gils>\n" ,
+        "<gils>\n<title>B" char_aring "d</title>\n"
+        "<abstract>זיהוי סדר הארועים בסיפור המרד הגדול מאת צביה בן-שלום 提示:直接点击数据库名称,将进入单库检索 Ngày xửa ngày xưa D.W. all wet</abstract>\n</gils>\n" ,
        0} ;
        
 static void tst(int argc, char **argv)
@@ -42,18 +60,68 @@ static void tst(int argc, char **argv)
 
     /* simple term */
     YAZ_CHECK(tl_query(zh, "@attr 1=title notfound", 0));
-
-    YAZ_CHECK(tl_query(zh, "@attr 1=title computer", 3));
  
+    YAZ_CHECK(tl_query(zh, "@attr 1=title computer", 3));
+
+    YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 5=1 comput", 3));
+
     YAZ_CHECK(tl_query(zh, "@attr 1=title .computer.", 3));
 
     YAZ_CHECK(tl_query(zh, "@attr 1=title x", 2));
 
-#if 0
-    /* does not yet work */
-    YAZ_CHECK(tl_query(zh, "@attr 1=title my", 2));
-#endif
+    YAZ_CHECK(tl_query(zh, "@attr 1=title my", 3));
+
+    YAZ_CHECK(tl_query(zh, "@attr 1=title mY", 3));
+
+    YAZ_CHECK(tl_query(zh, char_ae, 1));
+    YAZ_CHECK(tl_query(zh, char_AE, 1));
+
+    YAZ_CHECK(tl_query(zh, "b" char_aring "d", 1));
+    YAZ_CHECK(tl_query(zh, "B" char_Aring "D", 1));
+    YAZ_CHECK(tl_query(zh, "b" char_aring1 "d", 1));
+    YAZ_CHECK(tl_query(zh, "B" char_Aring1 "D", 1));
+
+    /* Abstract searches . Chinese mostly */
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract בן", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract צביה", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract הגדול", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפור", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפ", 0));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract 点", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract wet", 1));
+
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסיפ", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 סיפ", 0));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסי", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בס", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 ב", 1));
+
+    /* phrase search */
+    YAZ_CHECK(tl_query(zh, "@attr 1=title {my computer}", 2));
+    YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=1 {my computer}", 2));
+    YAZ_CHECK(tl_query(zh, "@attr 1=title {computer x}", 1));
+
+    /* complete-subfield search */
+    YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my computer}", 1));
+    YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my}", 0));
+    
+    /* scan */
+    {   /* word search */
+        const char *ent[] = { char_ae, "B" char_aring "d", "computer", 
+                              "My", "x", 0 };
+        YAZ_CHECK(tl_scan(zh, "@attr 1=title 0", 1, 10, 1, 5, 1, ent));
+    }
+
+    {   /* word search */
+        const char *ent[] = { "My", "x", 0 };
+        YAZ_CHECK(tl_scan(zh, "@attr 1=title cp", 1, 10, 1, 2, 1, ent));
+    }
+
+    {   /* phrase search */
+        const char *ent[] = { char_ae, "B" char_aring "d", "My computer" };
+        YAZ_CHECK(tl_scan(zh, "@attr 1=title @attr 6=2 0", 1, 3, 1, 3, 0, ent));
+    }
+    
     YAZ_CHECK(tl_close_down(zh, zs));
 #endif
 }