Happy new year
[idzebra-moved-to-github.git] / test / api / test_icu_indexing.c
1 /* This file is part of the Zebra server.
2    Copyright (C) 1994-2009 Index Data
3
4 Zebra is free software; you can redistribute it and/or modify it under
5 the terms of the GNU General Public License as published by the Free
6 Software Foundation; either version 2, or (at your option) any later
7 version.
8
9 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
10 WARRANTY; without even the implied warranty of MERCHANTABILITY or
11 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
12 for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 */
19
20 /** \file
21     \brief tests ICU enabled maps
22 */
23 #include <yaz/test.h>
24 #include "testlib.h"
25
26 /* utf-8 sequences for some characters */
27 #define char_ae "\xc3\xa6"
28 #define char_AE "\xc3\x86"
29
30 #define char_oslash "\xc3\xb8"
31 #define char_Oslash "\xc3\x98"
32
33 #define char_aring "\xc3\xa5"
34 #define char_Aring "\xc3\x85"
35
36 #define char_comb_ring_above "\xcc\x8a"
37
38 #define char_aring1 "a" char_comb_ring_above
39 #define char_Aring1 "A" char_comb_ring_above
40
41 const char *myrec[] = {
42         "<gils>\n<title>My computer</title>\n</gils>\n",
43         "<gils>\n<title>My x computer</title>\n</gils>\n",
44         "<gils>\n<title>My computer x</title>\n</gils>\n" ,
45         "<gils>\n<title>" char_ae "</title>\n</gils>\n" ,
46         "<gils>\n<title>B" char_aring "d</title>\n"
47         "<abstract>זיהוי סדר הארועים בסיפור המרד הגדול מאת צביה בן-שלום 提示:直接点击数据库名称,将进入单库检索 Ngày xửa ngày xưa D.W. all wet</abstract>\n</gils>\n" ,
48         0} ;
49         
50 static void tst(int argc, char **argv)
51 {
52 #if YAZ_HAVE_ICU
53     ZebraService zs = tl_start_up("test_icu_indexing.cfg", argc, argv);
54     ZebraHandle zh = zebra_open(zs, 0);
55
56     YAZ_CHECK(tl_init_data(zh, myrec));
57
58     /* simple term */
59     YAZ_CHECK(tl_query(zh, "@attr 1=title notfound", 0));
60  
61     YAZ_CHECK(tl_query(zh, "@attr 1=title computer", 3));
62
63     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 5=1 comput", 3));
64
65     YAZ_CHECK(tl_query(zh, "@attr 1=title .computer.", 3));
66
67     YAZ_CHECK(tl_query(zh, "@attr 1=title x", 2));
68
69     YAZ_CHECK(tl_query(zh, "@attr 1=title my", 3));
70
71     YAZ_CHECK(tl_query(zh, "@attr 1=title mY", 3));
72
73     YAZ_CHECK(tl_query(zh, char_ae, 1));
74     YAZ_CHECK(tl_query(zh, char_AE, 1));
75
76     YAZ_CHECK(tl_query(zh, "b" char_aring "d", 1));
77     YAZ_CHECK(tl_query(zh, "B" char_Aring "D", 1));
78     YAZ_CHECK(tl_query(zh, "b" char_aring1 "d", 1));
79     YAZ_CHECK(tl_query(zh, "B" char_Aring1 "D", 1));
80
81     /* Abstract searches . Chinese mostly */
82     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בן", 1));
83     YAZ_CHECK(tl_query(zh, "@attr 1=abstract צביה", 1));
84     YAZ_CHECK(tl_query(zh, "@attr 1=abstract הגדול", 1));
85     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפור", 1));
86     YAZ_CHECK(tl_query(zh, "@attr 1=abstract בסיפ", 0));
87     YAZ_CHECK(tl_query(zh, "@attr 1=abstract 点", 1));
88     YAZ_CHECK(tl_query(zh, "@attr 1=abstract wet", 1));
89
90     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסיפ", 1));
91     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 סיפ", 0));
92     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בסי", 1));
93     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 בס", 1));
94     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 5=1 ב", 1));
95
96     /* phrase search */
97     YAZ_CHECK(tl_query(zh, "@attr 1=title {my computer}", 2));
98     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=1 {my computer}", 2));
99     YAZ_CHECK(tl_query(zh, "@attr 1=title {computer x}", 1));
100
101     /* complete-subfield search */
102     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my computer}", 1));
103     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 6=2 {my}", 0));
104
105     /* always matches */
106     YAZ_CHECK(tl_query(zh, "@attr 1=_ALLRECORDS @attr 2=103 {}", 5));
107     YAZ_CHECK(tl_query(zh, "@attr 1=title @attr 2=103 {}", 5));
108     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 2=103 {}", 1));
109     YAZ_CHECK(tl_query(zh, "@attr 1=abstract @attr 2=103 {does not match}", 1));
110     
111     /* scan */
112     {   /* word search */
113         const char *ent[] = { char_ae, "B" char_aring "d", "computer", 
114                               "My", "x", 0 };
115         YAZ_CHECK(tl_scan(zh, "@attr 1=title 0", 1, 10, 1, 5, 1, ent));
116     }
117
118     {   /* word search */
119         const char *ent[] = { "My", "x", 0 };
120         YAZ_CHECK(tl_scan(zh, "@attr 1=title cp", 1, 10, 1, 2, 1, ent));
121     }
122
123     {   /* phrase search */
124         const char *ent[] = { char_ae, "B" char_aring "d", "My computer" };
125         YAZ_CHECK(tl_scan(zh, "@attr 1=title @attr 6=2 0", 1, 3, 1, 3, 0, ent));
126     }
127     
128     YAZ_CHECK(tl_close_down(zh, zs));
129 #endif
130 }
131
132 TL_MAIN
133
134 /*
135  * Local variables:
136  * c-basic-offset: 4
137  * indent-tabs-mode: nil
138  * End:
139  * vim: shiftwidth=4 tabstop=8 expandtab
140  */
141