Updated footer comment
[idzebra-moved-to-github.git] / test / api / test_search.c
1 /* This file is part of the Zebra server.
2    Copyright (C) 1994-2009 Index Data
3
4 Zebra is free software; you can redistribute it and/or modify it under
5 the terms of the GNU General Public License as published by the Free
6 Software Foundation; either version 2, or (at your option) any later
7 version.
8
9 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
10 WARRANTY; without even the implied warranty of MERCHANTABILITY or
11 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
12 for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 */
19
20 /** \file
21     \brief test various search attributes */
22 #include <yaz/test.h>
23 #include "testlib.h"
24
25 const char *myrec[] = {
26         "<gils>\n<title>My title</title>\n"
27         "  <abstract>test record with single coordset, negatives</abstract>\n"
28         "  <Spatial-Domain><Bounding-Coordinates>\n"
29         "    <West-Bounding-Coordinate> -120 </West-Bounding-Coordinate>\n"
30         "    <East-Bounding-Coordinate> -102 </East-Bounding-Coordinate>\n"
31         "    <North-Bounding-Coordinate>  49 </North-Bounding-Coordinate>\n"
32         "    <South-Bounding-Coordinate>  31 </South-Bounding-Coordinate>\n"
33         "  </Bounding-Coordinates></Spatial-Domain>\n"
34         "</gils>\n",
35
36         "<gils>\n<title>My x title</title>\n"
37         "  <abstract>second test with two coord sets</abstract>\n"
38         "  <Spatial-Domain><Bounding-Coordinates>\n"
39         "    <West-Bounding-Coordinate> -120 </West-Bounding-Coordinate>\n"
40         "    <East-Bounding-Coordinate> -102 </East-Bounding-Coordinate>\n"
41         "    <North-Bounding-Coordinate>  49 </North-Bounding-Coordinate>\n"
42         "    <South-Bounding-Coordinate>  31 </South-Bounding-Coordinate>\n"
43         "  </Bounding-Coordinates>"
44         "  <Bounding-Coordinates>\n"
45         "    <West-Bounding-Coordinate> -125 </West-Bounding-Coordinate>\n"
46         "    <East-Bounding-Coordinate> -108 </East-Bounding-Coordinate>\n"
47         "    <North-Bounding-Coordinate>  41 </North-Bounding-Coordinate>\n"
48         "    <South-Bounding-Coordinate>  25 </South-Bounding-Coordinate>\n"
49         "  </Bounding-Coordinates></Spatial-Domain>\n"
50         "</gils>\n",
51
52         "<gils>\n<title>My title x</title>\n</gils>\n" ,
53
54         "<test_search>\n"
55         " <date>2107-09-19 00:00:00</date>\n"
56         "</test_search>\n"
57         ,
58         0} ;
59         
60 static void tst(int argc, char **argv)
61 {
62     ZebraService zs = tl_start_up(0, argc, argv);
63     ZebraHandle zh = zebra_open(zs, 0);
64
65     YAZ_CHECK(tl_init_data(zh, myrec));
66
67     /* simple term */
68     YAZ_CHECK(tl_query(zh, "@attr 1=4 notfound", 0));
69     YAZ_CHECK(tl_query(zh, "@attr 1=4 title", 3));
70     YAZ_CHECK_EQ(tl_fetch_compare(zh, 1, "zebra::facet::title:w",
71                                   yaz_oid_recsyn_sutrs,
72                                   "facet w title\n"
73                                   "term 3 3: my\n"
74                                   "term 3 3: title\n"
75                                   "term 2 2: x\n"), ZEBRA_OK);
76     
77     YAZ_CHECK_EQ(tl_fetch_compare(zh, 1, "zebra::facet::title:s",
78                                   yaz_oid_recsyn_sutrs,
79                                   "facet s title\n"
80                                   "term 1 1: my title\n"
81                                   "term 1 1: my title x\n"
82                                   "term 1 1: my x title\n"), ZEBRA_OK);
83
84     /* trunc right */
85     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=1 titl", 3));
86
87     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=1 x", 2));
88     YAZ_CHECK_EQ(tl_fetch_compare(zh, 1, "zebra::facet::title:w",
89                                   yaz_oid_recsyn_sutrs,
90                                   "facet w title\n"
91                                   "term 2 2: my\n"
92                                   "term 2 2: title\n"
93                                   "term 2 2: x\n"), ZEBRA_OK);
94                  
95     /* trunc left */
96     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=2 titl", 0));
97     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=2 x", 2));
98     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=2 le", 3));
99
100     /* trunc left&right */
101     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=3 titl", 3));
102     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=3 x", 2));
103     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=3 le", 3));
104
105     /* trunc none */
106     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=100 titl", 0));
107     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=100 x", 2));
108     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=100 le", 0));
109
110     /* trunc: process # in term */
111     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=101 titl", 0));
112     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=101 x", 2));
113     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=101 le", 0));
114     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=101 #le", 3));
115
116     /* trunc: re-1 */
117     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=102 titl", 0));
118     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=102 x", 2));
119     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=102 le", 0));
120     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=102 .*le", 3));
121
122     /* trunc: re-2 */
123     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 titl", 3));
124     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 titlx", 3));
125     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 titlxx", 0));
126     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 x", 2));
127     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 le", 0));
128     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=103 .*le", 3));
129
130     /* trunc: CCL #=. ?=.* (?[0-9] = n times .) */
131     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 titl", 0));
132     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 tit#e", 3));
133     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 x", 2));
134     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 le", 0));
135     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 ?le", 3));
136     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 ?1le", 0));
137     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 ?2le", 0));
138     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=104 ?3le", 3));
139
140     /* trunc: * = .*   ! = . and right truncate */
141     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=105 titl", 3));
142     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=105 tit!e", 3));
143     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=105 x", 2));
144     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=105 le", 0));
145     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=105 *le", 3));
146
147     /* trunc: * = .*   ! = . and do not truncate */
148     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=106 titl", 0));
149     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=106 tit!e", 3));
150     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=106 x", 2));
151     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=106 le", 0));
152     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 5=106 *le", 3));
153
154     /* string relations, < */
155     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=1 0", 0));
156     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=1 my", 0));
157
158     /* string relations, <= */
159     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=2 my", 3));
160     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=2 mn", 0));
161
162     /* = */
163     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=3 my", 3));
164
165     /* string relations, >= */
166     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=4 x", 2));
167     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=4 tu", 2));
168     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=4 title", 3));
169
170     /* string relations, > */
171     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=5 x", 0));
172     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=5 tu", 2));
173     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=5 title", 2));
174
175     /* always-matches relation */
176     YAZ_CHECK(tl_query(zh, "@attr 1=_ALLRECORDS @attr 2=103 {ym}", 4));
177     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 2=103 {x my}", 3));
178     YAZ_CHECK(tl_query_x(zh, "@attr 1=1 @attr 2=103 {x my}", 0, 114));
179
180     /* and searches */
181     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 notfound @attr 1=4 x", 0)); 
182     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 x @attr 1=4 notfound", 0)); 
183     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 notfound @attr 1=4 notfound", 0)); 
184     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 x @attr 1=4 x", 2)); 
185     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 x @attr 1=4 my", 2)); 
186     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 my @attr 1=4 x", 2)); 
187     YAZ_CHECK(tl_query(zh, "@and @attr 1=4 my @attr 1=4 my", 3)); 
188
189     /* or searches */
190     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 notfound @attr 1=4 x", 2)); 
191     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 x @attr 1=4 notfound", 2)); 
192     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 notfound @attr 1=4 notfound", 0)); 
193     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 x @attr 1=4 x", 2)); 
194     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 x @attr 1=4 my", 3)); 
195     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 my @attr 1=4 x", 3)); 
196     YAZ_CHECK(tl_query(zh, "@or @attr 1=4 my @attr 1=4 my", 3)); 
197
198     /* not searches */
199     /* bug 619 */
200     YAZ_CHECK(tl_query(zh, "@not @attr 1=4 notfound @attr 1=4 x", 0)); 
201     YAZ_CHECK(tl_query(zh, "@not @attr 1=4 x @attr 1=4 x", 0));
202     YAZ_CHECK(tl_query(zh, "@not @attr 1=4 my @attr 1=4 x", 1));
203     YAZ_CHECK(tl_query(zh, "@not @attr 1=4 my @attr 1=4 notfound", 3));
204     YAZ_CHECK(tl_query(zh, "@not @attr 1=4 notfound @attr 1=4 notfound", 0));
205     
206     /* phrase searches */
207     YAZ_CHECK(tl_query(zh, "@attr 1=4 my", 3));
208     YAZ_CHECK(tl_query(zh, "@attr 1=4 {my x}", 1));
209     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=1 {my x}", 1));
210     YAZ_CHECK(tl_query(zh, "@attr 1=4 {my x}", 1));
211     YAZ_CHECK(tl_query(zh, "@attr 1=4 {x my}", 0));
212     YAZ_CHECK(tl_query(zh, "@attr 1=4 {my x title}", 1));
213     YAZ_CHECK(tl_query(zh, "@attr 1=4 {my title}", 2));
214
215     /* and-list searches */
216     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=6 {x my}", 2));
217     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=6 {my x}", 2));
218     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=6 {my my}", 3));
219     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=6 {e x}", 0));
220
221     /* or-list searches */
222     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=105 {x my}", 3));
223     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=105 {my x}", 3));
224     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=105 {my my}", 3));
225     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=105 {e x}", 2));
226     YAZ_CHECK(tl_query(zh, "@attr 1=4 @attr 4=106 {e x}", 2));
227
228     /* exl=0 distance=2 order=1 relation=2 (<=), known, unit=word */
229     YAZ_CHECK(tl_query(zh, "@attr 1=4 @prox 0 2 1 2 k 2 my x", 2));
230
231     /* exl=0 distance=2 order=1 relation=2 (<=), known, unit=word */
232     YAZ_CHECK(tl_query(zh, "@attr 1=4 @prox 0 2 1 2 k 2 x my", 0));
233
234     /* exl=0 distance=2 order=0 relation=2 (<=), known, unit=word */
235     YAZ_CHECK(tl_query(zh, "@attr 1=4 @prox 0 2 0 2 k 2 x my", 2));
236
237     /* exl=0 distance=2 order=0 relation=3 (=), known, unit=word */
238     YAZ_CHECK(tl_query(zh, "@attr 1=4 @prox 0 2 1 3 k 2 my x", 1));
239
240     /* exl=1 distance=2 order=0 relation=3 (=), known, unit=word */
241     YAZ_CHECK(tl_query(zh, "@attr 1=4 @prox 1 2 1 3 k 2 my x", 1));
242
243     /* Non-indexed numeric use, but specified in bib1.att (bug #1142) */
244     YAZ_CHECK(tl_query_x(zh, "@attr 1=1000 x", 0, 114));
245     YAZ_CHECK(tl_query_x(zh, "@attr 1=1000 @attr 14=0 x", 0, 114));
246     YAZ_CHECK(tl_query_x(zh, "@attr 1=1000 @attr 14=1 x", 0, 0));
247     /* Non-indexed numeric use and unspecified in bib1.att */
248     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 x", 0, 114));
249     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 @attr 14=1 x", 0, 114));
250     /* Non-indexed string use attribute */
251     YAZ_CHECK(tl_query_x(zh, "@attr 1=gyf  x", 0, 114));
252     YAZ_CHECK(tl_query_x(zh, "@attr 1=gyf @attr 14=0 x", 0, 114));
253     YAZ_CHECK(tl_query_x(zh, "@attr 1=gyf @attr 14=1 x", 0, 0));
254
255     /* provoke unsupported use attribute */
256     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 @attr 4=1 x", 0, 114));
257     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 @attr 4=6 x", 0, 114));
258     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 @attr 4=105 x", 0, 114));
259     YAZ_CHECK(tl_query_x(zh, "@attr 1=999 @attr 4=109 123", 0, 114));
260     YAZ_CHECK(tl_query_x(zh, "@attrset 1.2.840.10003.3.1 @attr 1=999 x",
261                          0, 114));
262     /* provoke unsupported attribute set */
263     YAZ_CHECK(tl_query_x(zh, "@attrset 1.2.8 @attr 1=999 @attr 4=1 x", 0, 121));
264     YAZ_CHECK(tl_query_x(zh, "@attrset 1.2.8 @attr 1=999 @attr 4=6 x", 0,
265                121));
266     YAZ_CHECK(tl_query_x(zh, "@attrset 1.2.8 @attr 1=999 @attr 4=105 x", 0,
267                121));
268     YAZ_CHECK(tl_query_x(zh, "@attrset 1.2.8 @attr 1=999 @attr 4=109 123",
269                0, 121));
270
271     /* provoke unsupported relation */
272     YAZ_CHECK(tl_query_x(zh, "@attr 1=4 @attr 2=6 x", 0, 117));
273     YAZ_CHECK(tl_query_x(zh, "@attr 1=1016 @attr 2=6 @attr 4=109 x", 0, 114));
274
275     /* position , phrase searches */
276     YAZ_CHECK(tl_query(zh, "@attr 3=1 title", 0));
277     YAZ_CHECK(tl_query(zh, "@attr 3=1 my", 3));
278
279     YAZ_CHECK(tl_query(zh, "@attr 3=1 {my title}", 2));
280     YAZ_CHECK(tl_query(zh, "@attr 4=1 @attr 3=1 {my title}", 2));
281
282     YAZ_CHECK(tl_query(zh, "@attr 3=1 {title my}", 0));
283     YAZ_CHECK(tl_query(zh, "@attr 4=1 @attr 3=1 {title my}", 0));
284
285     YAZ_CHECK(tl_query(zh, "@attr 4=1 @attr 3=1 {title my}", 0));
286
287     /* position , or-list */
288     YAZ_CHECK(tl_query(zh, "@attr 4=105 @attr 3=1 {title my}", 3));
289     YAZ_CHECK(tl_query(zh, "@attr 4=105 @attr 3=1 {title x}", 0));
290     
291     /* position, and-list */
292     YAZ_CHECK(tl_query(zh, "@attr 4=6 @attr 3=1 {title my}", 0));
293     YAZ_CHECK(tl_query(zh, "@attr 4=6 @attr 3=1 {title x}", 0));
294     YAZ_CHECK(tl_query(zh, "@attr 4=6 @attr 3=1 my", 3));
295
296
297     /* 1=2038: West-Bounding-Coordinate 2039: East: 2040: North: 2041 South*/
298     /* 4=109: numeric string */
299     /* 2=3: equal  2=1: less, 2=4: greater or equal 2=5 greater */
300
301     /* N>=25, search attributes work */
302     YAZ_CHECK(tl_query(zh,  "@attr 2=4 @attr gils 1=2040 @attr 4=109 25", 2));
303
304     /* N>49, search attributes work */
305     YAZ_CHECK(tl_query(zh,  "@attr 2=5 @attr gils 1=2040 @attr 4=109 49", 0));
306
307     /* N>=49, search attributes work */
308     YAZ_CHECK(tl_query(zh,  "@attr 2=4 @attr gils 1=2040 @attr 4=109 49", 2));
309
310     /* N>48, search attributes work */
311     YAZ_CHECK(tl_query(zh,  "@attr 2=5 @attr gils 1=2040 @attr 4=109 48", 2));
312
313     /* N<48, search attributes work */
314     YAZ_CHECK(tl_query(zh,  "@attr 2=1 @attr gils 1=2040 @attr 4=109 48", 1));
315
316     /* N<=48, search attributes work */
317     YAZ_CHECK(tl_query(zh,  "@attr 2=2 @attr gils 1=2040 @attr 4=109 48", 1));
318
319     /* N=41, get rec1 only */
320     YAZ_CHECK(tl_query(zh,  "@attr 2=3 @attr gils 1=2040 @attr 4=109 41", 1));
321
322     /* N=49, get both records */
323     YAZ_CHECK(tl_query(zh,  "@attr 2=3 @attr gils 1=2040 @attr 4=109 49", 2));
324
325     /* W=-120 get both records */
326     YAZ_CHECK(tl_query(zh,  "@attr 2=3 @attr gils 1=2038 @attr 4=109 -120", 2));
327
328     /* W<-122 get only rec1 */
329     YAZ_CHECK(tl_query(zh,  "@attr 2=1 @attr gils 1=2038 @attr 4=109 '-120' ", 1));
330
331     /* N=41 and N=49 get only rec2 */
332     YAZ_CHECK(tl_query(zh, "@attr 2=3 @attr gils 1=2040 @attr 4=109 \"41 49\" ", 1));
333
334
335     /* = */
336     YAZ_CHECK(tl_query(zh, "@attr 1=30 @attr 4=5 @attr 2=3 {2107-09-19 00:00:00}", 1));
337     /* < */
338     YAZ_CHECK(tl_query(zh, "@attr 1=30 @attr 4=5 @attr 2=1 {2107-09-19 00:00:00}", 0));
339     /* <= */
340     YAZ_CHECK(tl_query(zh, "@attr 1=30 @attr 4=5 @attr 2=2 {2107-09-19 00:00:00}", 1));
341     /* >= */
342     YAZ_CHECK(tl_query(zh, "@attr 1=30 @attr 4=5 @attr 2=4 {2107-09-19 00:00:00}", 1));
343     /* > */
344     YAZ_CHECK(tl_query(zh, "@attr 1=30 @attr 4=5 @attr 2=5 {2107-09-19 00:00:00}", 0));
345     
346
347     YAZ_CHECK(tl_close_down(zh, zs));
348 }
349
350 TL_MAIN
351
352 /*
353  * Local variables:
354  * c-basic-offset: 4
355  * c-file-style: "Stroustrup"
356  * indent-tabs-mode: nil
357  * End:
358  * vim: shiftwidth=4 tabstop=8 expandtab
359  */
360