a1cff6c23ba7831e318c0ea72411a3afce820477
[idzebra-moved-to-github.git] / test / api / test_icu_indexing.c
1 /* This file is part of the Zebra server.
2    Copyright (C) 1994-2009 Index Data
3
4 Zebra is free software; you can redistribute it and/or modify it under
5 the terms of the GNU General Public License as published by the Free
6 Software Foundation; either version 2, or (at your option) any later
7 version.
8
9 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
10 WARRANTY; without even the implied warranty of MERCHANTABILITY or
11 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
12 for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 */
19
20 /** \file
21     \brief tests ICU enabled maps
22 */
23 #include <yaz/test.h>
24 #include "testlib.h"
25
26 /* utf-8 sequences for some characters */
27 #define char_ae "\xc3\xa6"
28 #define char_AE "\xc3\x86"
29
30 #define char_oslash "\xc3\xb8"
31 #define char_Oslash "\xc3\x98"
32
33 #define char_aring "\xc3\xa5"
34 #define char_Aring "\xc3\x85"
35
36 #define char_comb_ring_above "\xcc\x8a"
37
38 #define char_aring1 "a" char_comb_ring_above
39 #define char_Aring1 "A" char_comb_ring_above
40
41 const char *myrec[] = {
42         "<gils>\n<title>My computer</title>\n</gils>\n",
43         "<gils>\n<title>My x computer</title>\n</gils>\n",
44         "<gils>\n<title>My computer x</title>\n</gils>\n" ,
45         "<gils>\n<title>" char_ae "</title>\n</gils>\n" ,
46         "<gils>\n<title>B" char_aring "d</title>\n"
47         "<abstract>זיהוי סדר הארועים בסיפור המרד הגדול מאת צביה בן-שלום 提示:直接点击数据库名称,将进入单库检索 Ngày xửa ngày xưa D.W. all wet</abstract>\n</gils>\n" ,
48         0} ;
49         
50 static void tst(int argc, char **argv)
51 {
52 #if YAZ_HAVE_ICU
53     ZebraService zs = tl_start_up("test_icu_indexing.cfg", argc, argv);
54     ZebraHandle zh = zebra_open(zs, 0);
55
56     tl_check_filter(zs, "grs.xml");
57
58     YAZ_CHECK(tl_init_data(zh, myrec));
59
60     /* simple term */
61     YAZ_CHECK(tl_query(zh, "@attr 1=title notfound", 0));
62  
63     YAZ_CHECK(tl_query(zh, "@attr 1=title computer", 3));
64
65     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 5=1 comput", 3));
66
67     YAZ_CHECK(tl_query(zh, "@attr 1=title .computer.", 3));
68
69     YAZ_CHECK(tl_query(zh, "@attr 1=title x", 2));
70
71     YAZ_CHECK(tl_query(zh, "@attr 1=title my", 3));
72
73     YAZ_CHECK(tl_query(zh, "@attr 1=title mY", 3));
74
75     YAZ_CHECK(tl_query(zh, char_ae, 1));
76     YAZ_CHECK(tl_query(zh, char_AE, 1));
77
78     YAZ_CHECK(tl_query(zh, "b" char_aring "d", 1));
79     YAZ_CHECK(tl_query(zh, "B" char_Aring "D", 1));
80     YAZ_CHECK(tl_query(zh, "b" char_aring1 "d", 1));
81     YAZ_CHECK(tl_query(zh, "B" char_Aring1 "D", 1));
82
83     /* Abstract searches . Chinese mostly */
84     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בן", 1));
85     YAZ_CHECK(tl_query(zh, "@attr 1=abstract צביה", 1));
86     YAZ_CHECK(tl_query(zh, "@attr 1=abstract הגדול", 1));
87     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפור", 1));
88     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפ", 0));
89     YAZ_CHECK(tl_query(zh, "@attr 1=abstract 点", 1));
90     YAZ_CHECK(tl_query(zh, "@attr 1=abstract wet", 1));
91
92     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסיפ", 1));
93     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 סיפ", 0));
94     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסי", 1));
95     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בס", 1));
96     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 ב", 1));
97
98     /* phrase search */
99     YAZ_CHECK(tl_query(zh, "@attr 1=title {my computer}", 2));
100     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=1 {my computer}", 2));
101     YAZ_CHECK(tl_query(zh, "@attr 1=title {computer x}", 1));
102
103     /* complete-subfield search */
104     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my computer}", 1));
105     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my}", 0));
106
107     /* always matches */
108     YAZ_CHECK(tl_query(zh, "@attr 1=_ALLRECORDS @attr 2=103 {}", 5));
109     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 2=103 {}", 5));
110     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 2=103 {}", 1));
111     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 2=103 {does not match}", 1));
112     
113     /* scan */
114     {   /* word search */
115         const char *ent[] = { char_ae, "B" char_aring "d", "computer", 
116                               "My", "x", 0 };
117         YAZ_CHECK(tl_scan(zh, "@attr 1=title 0", 1, 10, 1, 5, 1, ent));
118     }
119
120     {   /* word search */
121         const char *ent[] = { "My", "x", 0 };
122         YAZ_CHECK(tl_scan(zh, "@attr 1=title cp", 1, 10, 1, 2, 1, ent));
123     }
124
125     {   /* phrase search */
126         const char *ent[] = { char_ae, "B" char_aring "d", "My computer" };
127         YAZ_CHECK(tl_scan(zh, "@attr 1=title @attr 6=2 0", 1, 3, 1, 3, 0, ent));
128     }
129     
130     YAZ_CHECK(tl_close_down(zh, zs));
131 #endif
132 }
133
134 TL_MAIN
135
136 /*
137  * Local variables:
138  * c-basic-offset: 4
139  * indent-tabs-mode: nil
140  * End:
141  * vim: shiftwidth=4 tabstop=8 expandtab
142  */
143