Added remote record import using Z39.50 extended services and Segment
[idzebra-moved-to-github.git] / index / zserver.h
1 /*
2  * Copyright (C) 1994-2000, Index Data 
3  * All rights reserved.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: zserver.h,v $
7  * Revision 1.47  2000-03-20 19:08:36  adam
8  * Added remote record import using Z39.50 extended services and Segment
9  * Requests.
10  *
11  * Revision 1.46  2000/03/15 15:00:31  adam
12  * First work on threaded version.
13  *
14  * Revision 1.45  1999/11/30 13:48:04  adam
15  * Improved installation. Updated for inclusion of YAZ header files.
16  *
17  * Revision 1.44  1999/11/04 15:00:45  adam
18  * Implemented delete result set(s).
19  *
20  * Revision 1.43  1999/07/14 10:59:27  adam
21  * Changed functions isc_getmethod, isams_getmethod.
22  * Improved fatal error handling (such as missing EXPLAIN schema).
23  *
24  * Revision 1.42  1999/05/26 07:49:13  adam
25  * C++ compilation.
26  *
27  * Revision 1.41  1999/05/12 13:08:06  adam
28  * First version of ISAMS.
29  *
30  * Revision 1.40  1998/11/16 16:03:45  adam
31  * Moved loggin utilities to Yaz. Was implemented in file zlogs.c.
32  *
33  * Revision 1.39  1998/10/16 08:14:35  adam
34  * Updated record control system.
35  *
36  * Revision 1.38  1998/09/22 10:03:44  adam
37  * Changed result sets to be persistent in the sense that they can
38  * be re-searched if needed.
39  * Fixed memory leak in rsm_or.
40  *
41  * Revision 1.37  1998/09/02 13:53:22  adam
42  * Extra parameter decode added to search routines to implement
43  * persistent queries.
44  *
45  * Revision 1.36  1998/06/24 12:16:16  adam
46  * Support for relations on text operands. Open range support in
47  * DFA module (i.e. [-j], [g-]).
48  *
49  * Revision 1.35  1998/06/23 15:33:35  adam
50  * Added feature to specify sort criteria in query (type 7 specifies
51  * sort flags).
52  *
53  * Revision 1.34  1998/06/22 11:36:50  adam
54  * Added authentication check facility to zebra.
55  *
56  * Revision 1.33  1998/06/12 12:22:14  adam
57  * Work on Zebra API.
58  *
59  * Revision 1.32  1998/05/27 16:57:47  adam
60  * Zebra returns surrogate diagnostic for single records when
61  * appropriate.
62  *
63  * Revision 1.31  1998/05/20 10:12:23  adam
64  * Implemented automatic EXPLAIN database maintenance.
65  * Modified Zebra to work with ASN.1 compiled version of YAZ.
66  *
67  * Revision 1.30  1998/03/05 08:45:13  adam
68  * New result set model and modular ranking system. Moved towards
69  * descent server API. System information stored as "SGML" records.
70  *
71  * Revision 1.29  1998/02/10 12:03:06  adam
72  * Implemented Sort.
73  *
74  * Revision 1.28  1998/01/29 13:40:11  adam
75  * Better logging for scan service.
76  *
77  * Revision 1.27  1997/10/27 14:33:06  adam
78  * Moved towards generic character mapping depending on "structure"
79  * field in abstract syntax file. Fixed a few memory leaks. Fixed
80  * bug with negative integers when doing searches with relational
81  * operators.
82  *
83  * Revision 1.26  1997/09/29 12:41:35  adam
84  * Fixed bug regarding USE_TIMES var.
85  *
86  * Revision 1.25  1997/09/29 09:08:36  adam
87  * Revised locking system to be thread safe for the server.
88  *
89  * Revision 1.24  1997/09/17 12:19:19  adam
90  * Zebra version corresponds to YAZ version 1.4.
91  * Changed Zebra server so that it doesn't depend on global common_resource.
92  *
93  * Revision 1.23  1996/12/23 15:30:46  adam
94  * Work on truncation.
95  * Bug fix: result sets weren't deleted after server shut down.
96  *
97  * Revision 1.22  1996/11/04 14:07:49  adam
98  * Moved truncation code to trunc.c.
99  *
100  * Revision 1.21  1996/10/29 14:09:58  adam
101  * Use of cisam system - enabled if setting isamc is 1.
102  *
103  * Revision 1.20  1996/06/04 10:19:02  adam
104  * Minor changes - removed include of ctype.h.
105  *
106  * Revision 1.19  1996/05/14  11:34:01  adam
107  * Scan support in multiple registers/databases.
108  *
109  * Revision 1.18  1996/05/14  06:16:50  adam
110  * Compact use/set bytes used in search service.
111  *
112  * Revision 1.17  1995/12/08 16:22:57  adam
113  * Work on update while servers are running. Three lock files introduced.
114  * The servers reload their registers when necessary, but they don't
115  * reestablish result sets yet.
116  *
117  * Revision 1.16  1995/12/07  17:38:48  adam
118  * Work locking mechanisms for concurrent updates/commit.
119  *
120  * Revision 1.15  1995/11/21  15:29:13  adam
121  * Config file 'base' read by default by both indexer and server.
122  *
123  * Revision 1.14  1995/11/16  17:00:57  adam
124  * Better logging of rpn query.
125  *
126  * Revision 1.13  1995/11/16  15:34:56  adam
127  * Uses new record management system in both indexer and server.
128  *
129  * Revision 1.12  1995/10/27  14:00:12  adam
130  * Implemented detection of database availability.
131  *
132  * Revision 1.11  1995/10/17  18:02:12  adam
133  * New feature: databases. Implemented as prefix to words in dictionary.
134  *
135  * Revision 1.10  1995/10/09  16:18:38  adam
136  * Function dict_lookup_grep got extra client data parameter.
137  *
138  * Revision 1.9  1995/10/06  14:38:01  adam
139  * New result set method: r_score.
140  * Local no (sysno) and score is transferred to retrieveCtrl.
141  *
142  * Revision 1.8  1995/10/06  13:52:06  adam
143  * Bug fixes. Handler may abort further scanning.
144  *
145  * Revision 1.7  1995/10/06  10:43:57  adam
146  * Scan added. 'occurrences' in scan entries not set yet.
147  *
148  * Revision 1.6  1995/09/28  09:19:48  adam
149  * xfree/xmalloc used everywhere.
150  * Extract/retrieve method seems to work for text records.
151  *
152  * Revision 1.5  1995/09/27  16:17:32  adam
153  * More work on retrieve.
154  *
155  * Revision 1.4  1995/09/14  11:53:28  adam
156  * First work on regular expressions/truncations.
157  *
158  * Revision 1.3  1995/09/08  08:53:23  adam
159  * Record buffer maintained in server_info.
160  *
161  * Revision 1.2  1995/09/06  16:11:19  adam
162  * Option: only one word key per file.
163  *
164  * Revision 1.1  1995/09/05  15:28:40  adam
165  * More work on search engine.
166  *
167  */
168
169 #if HAVE_SYS_TIMES_H
170 #include <sys/times.h>
171 #endif
172
173 #if HAVE_PTHREADS_H
174 #include <pthreads.h>
175 #endif
176
177 #include <yaz/backend.h>
178 #include <rset.h>
179
180 #include <sortidx.h>
181 #include <passwddb.h>
182 #include "index.h"
183 #include "zebraapi.h"
184 #include "zinfo.h"
185
186 YAZ_BEGIN_CDECL
187
188 typedef struct {
189     int sysno;
190     int score;
191 } *ZebraPosSet;
192
193 typedef struct zebra_set *ZebraSet;
194
195 typedef struct zebra_rank_class {
196     struct rank_control *control;
197     int init_flag;
198     void *class_handle;
199     struct zebra_rank_class *next;
200 } *ZebraRankClass;
201
202 struct zebra_service {
203     char *configName;
204     struct zebra_session *sessions;
205     ISAMS isams;
206 #if ZMBOL
207     ISAM isam;
208     ISAMC isamc;
209     ISAMD isamd;
210 #endif
211     Dict dict;
212     SortIdx sortIdx;
213     int registerState; /* 0 (no commit pages), 1 (use commit pages) */
214     time_t registerChange;
215     BFiles bfs;
216     Records records;
217     ZebraExplainInfo zei;
218     Res res;
219     ZebraLockHandle server_lock_cmt;
220     ZebraLockHandle server_lock_org;
221     char *server_path_prefix;
222 #if HAVE_SYS_TIMES_H
223     struct tms tms1;
224     struct tms tms2;    
225 #endif
226     data1_handle dh;
227     ZebraMaps zebra_maps;
228     ZebraRankClass rank_classes;
229     RecTypes recTypes;
230     Passwd_db passwd_db;
231     Zebra_mutex_cond session_lock;
232     int stop_flag;
233     int active;
234 };
235
236 struct recKeys {
237     int buf_used;
238     int buf_max;
239     char *buf;
240     char prevAttrSet;
241     short prevAttrUse;
242     int prevSeqNo;
243 };
244
245 struct sortKey {
246     char *string;
247     int length;
248     int attrSet;
249     int attrUse;
250     struct sortKey *next;
251 };
252
253 struct zebra_session {
254     struct zebra_session *next;
255     struct zebra_service *service;
256
257     struct recKeys keys;
258     struct sortKey *sortKeys;
259
260     char **key_buf;
261     size_t ptr_top;
262     size_t ptr_i;
263     size_t key_buf_used;
264     int key_file_no;
265
266     int destroyed;
267     ZebraSet sets;
268     int errCode;
269     int hits;
270     char *errString;
271 };
272
273 struct rank_control {
274     char *name;
275     void *(*create)(ZebraService zh);
276     void (*destroy)(ZebraService zh, void *class_handle);
277     void *(*begin)(ZebraHandle zh, void *class_handle, RSET rset);
278     void (*end)(ZebraHandle zh, void *set_handle);
279     int (*calc)(void *set_handle, int sysno);
280     void (*add)(void *set_handle, int seqno, int term_index);
281 };
282
283 RSET rpn_search (ZebraHandle zh, NMEM mem,
284                  Z_RPNQuery *rpn, int num_bases, char **basenames, 
285                  const char *setname, ZebraSet sset);
286
287
288 void rpn_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
289                oid_value attributeset,
290                int num_bases, char **basenames,
291                int *position, int *num_entries, ZebraScanEntry **list,
292                int *is_partial);
293
294 RSET rset_trunc (ZebraHandle zh, ISAMS_P *isam_p, int no,
295                  const char *term, int length_term, const char *flags);
296
297 ZebraSet resultSetAdd (ZebraHandle zh, const char *name, int ov);
298 ZebraSet resultSetGet (ZebraHandle zh, const char *name);
299 ZebraSet resultSetAddRPN (ZebraHandle zh, ODR stream, ODR decode,                                         Z_RPNQuery *rpn, int num_bases, char **basenames,
300                           const char *setname);
301 RSET resultSetRef (ZebraHandle zh, Z_ResultSetId *resultSetId);
302 void resultSetDestroy (ZebraHandle zh, int num_names, char **names,
303                        int *statuses);
304
305 ZebraPosSet zebraPosSetCreate (ZebraHandle zh, const char *name,
306                                int num, int *positions);
307 void zebraPosSetDestroy (ZebraHandle zh, ZebraPosSet records, int num);
308
309 void resultSetSort (ZebraHandle zh, NMEM nmem,
310                     int num_input_setnames, const char **input_setnames,
311                     const char *output_setname,
312                     Z_SortKeySpecList *sort_sequence, int *sort_status);
313 void resultSetSortSingle (ZebraHandle zh, NMEM nmem,
314                           ZebraSet sset, RSET rset,
315                           Z_SortKeySpecList *sort_sequence, int *sort_status);
316 void resultSetRank (ZebraHandle zh, ZebraSet zebraSet, RSET rset);
317
318 void zebra_sort (ZebraHandle zh, ODR stream,
319                  int num_input_setnames, const char **input_setnames,
320                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
321                  int *sort_status);
322
323 int zebra_server_lock_init (ZebraService zh);
324 int zebra_server_lock_destroy (ZebraService zh);
325 int zebra_server_lock (ZebraService zh, int lockCommit);
326 void zebra_server_unlock (ZebraService zh, int commitPhase);
327 int zebra_server_lock_get_state (ZebraService zh, time_t *timep);
328
329 typedef struct attent
330 {
331     int attset_ordinal;
332     data1_local_attribute *local_attributes;
333 } attent;
334
335 void zebraRankInstall (ZebraService zh, struct rank_control *ctrl);
336 ZebraRankClass zebraRankLookup (ZebraHandle zh, const char *name);
337 void zebraRankDestroy (ZebraService zh);
338
339 int att_getentbyatt(ZebraHandle zh, attent *res, oid_value set, int att);
340
341 extern struct rank_control *rank1_class;
342
343 int zebra_record_fetch (ZebraHandle zh, int sysno, int score, ODR stream,
344                         oid_value input_format, Z_RecordComposition *comp,
345                         oid_value *output_format, char **rec_bufp,
346                         int *rec_lenp, char **basenamep);
347
348 void extract_get_fname_tmp (ZebraHandle zh, char *fname, int no);
349 void zebra_index_merge (ZebraHandle zh);
350
351
352 struct zebra_fetch_control {
353     int offset_end;
354     int record_offset;
355     int record_int_pos;
356     const char *record_int_buf;
357     int record_int_len;
358     int fd;
359 };
360
361 int zebra_record_ext_read (void *fh, char *buf, size_t count);
362 off_t zebra_record_ext_seek (void *fh, off_t offset);
363 off_t zebra_record_ext_tell (void *fh);
364 off_t zebra_record_int_seek (void *fh, off_t offset);
365 off_t zebra_record_int_tell (void *fh);
366 int zebra_record_int_read (void *fh, char *buf, size_t count);
367 void zebra_record_int_end (void *fh, off_t offset);
368
369 YAZ_END_CDECL