Fixed bug regarding user-defined attribute sets.
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.42  2000-12-05 10:01:44  adam
7  * Fixed bug regarding user-defined attribute sets.
8  *
9  * Revision 1.41  2000/12/01 17:59:08  adam
10  * Fixed bug regarding online updates on WIN32.
11  * When zebra.cfg is not available the server will not abort.
12  *
13  * Revision 1.40  2000/11/29 15:21:31  adam
14  * Fixed problem with passwd db.
15  *
16  * Revision 1.39  2000/11/29 14:24:01  adam
17  * Script configure uses yaz pthreads options. Added locking for
18  * zebra_register_{lock,unlock}.
19  *
20  * Revision 1.38  2000/11/08 13:46:58  adam
21  * Fixed scan: server could break if bad attribute/database was selected.
22  * Work on remote update.
23  *
24  * Revision 1.37  2000/10/17 12:37:09  adam
25  * Fixed notification of live-updates. Fixed minor problem with mf_init
26  * where it didn't handle shadow area file names correctly.
27  *
28  * Revision 1.36  2000/09/06 08:59:36  adam
29  * Using read-only (for now) for server.
30  *
31  * Revision 1.35  2000/07/07 12:49:20  adam
32  * Optimized resultSetInsert{Rank,Sort}.
33  *
34  * Revision 1.34  2000/06/09 13:56:38  ian
35  * Added some logging on Authentication and searches.
36  *
37  * Revision 1.33  2000/05/18 12:01:36  adam
38  * System call times(2) used again. More 64-bit fixes.
39  *
40  * Revision 1.32  2000/04/19 14:35:59  adam
41  * WIN32 update (this version is known not to work on Windows).
42  *
43  * Revision 1.31  2000/04/05 10:07:02  adam
44  * Minor zebra compile fix.
45  *
46  * Revision 1.30  2000/04/05 09:49:35  adam
47  * On Unix, zebra/z'mbol uses automake.
48  *
49  * Revision 1.29  2000/03/20 19:08:36  adam
50  * Added remote record import using Z39.50 extended services and Segment
51  * Requests.
52  *
53  * Revision 1.28  2000/03/15 15:00:30  adam
54  * First work on threaded version.
55  *
56  * Revision 1.27  2000/02/24 12:31:17  adam
57  * Added zebra_string_norm.
58  *
59  * Revision 1.26  1999/11/30 13:48:03  adam
60  * Improved installation. Updated for inclusion of YAZ header files.
61  *
62  * Revision 1.25  1999/11/04 15:00:45  adam
63  * Implemented delete result set(s).
64  *
65  * Revision 1.24  1999/10/14 14:33:50  adam
66  * Added truncation 5=106.
67  *
68  * Revision 1.23  1999/09/07 11:36:32  adam
69  * Minor changes.
70  *
71  * Revision 1.22  1999/08/02 10:13:47  adam
72  * Fixed bug regarding zebra_hits.
73  *
74  * Revision 1.21  1999/07/14 10:59:26  adam
75  * Changed functions isc_getmethod, isams_getmethod.
76  * Improved fatal error handling (such as missing EXPLAIN schema).
77  *
78  * Revision 1.20  1999/07/06 12:28:04  adam
79  * Updated record index structure. Format includes version ID. Compression
80  * algorithm ID is stored for each record block.
81  *
82  * Revision 1.19  1999/05/26 07:49:13  adam
83  * C++ compilation.
84  *
85  * Revision 1.18  1999/05/15 14:36:38  adam
86  * Updated dictionary. Implemented "compression" of dictionary.
87  *
88  * Revision 1.17  1999/05/12 13:08:06  adam
89  * First version of ISAMS.
90  *
91  * Revision 1.16  1999/02/19 10:38:30  adam
92  * Implemented chdir-setting.
93  *
94  * Revision 1.15  1999/02/17 12:18:12  adam
95  * Fixed zebra_close so that a NULL pointer is ignored.
96  *
97  * Revision 1.14  1999/02/02 14:51:11  adam
98  * Updated WIN32 code specific sections. Changed header.
99  *
100  * Revision 1.13  1998/12/16 12:23:30  adam
101  * Added facility for database name mapping using resource mapdb.
102  *
103  * Revision 1.12  1998/11/16 10:18:10  adam
104  * Better error reporting for result sets.
105  *
106  * Revision 1.11  1998/10/16 08:14:34  adam
107  * Updated record control system.
108  *
109  * Revision 1.10  1998/09/22 10:03:42  adam
110  * Changed result sets to be persistent in the sense that they can
111  * be re-searched if needed.
112  * Fixed memory leak in rsm_or.
113  *
114  * Revision 1.9  1998/09/02 13:53:17  adam
115  * Extra parameter decode added to search routines to implement
116  * persistent queries.
117  *
118  * Revision 1.8  1998/08/24 17:29:23  adam
119  * Minor changes.
120  *
121  * Revision 1.7  1998/06/24 12:16:13  adam
122  * Support for relations on text operands. Open range support in
123  * DFA module (i.e. [-j], [g-]).
124  *
125  * Revision 1.6  1998/06/22 11:36:47  adam
126  * Added authentication check facility to zebra.
127  *
128  * Revision 1.5  1998/06/13 00:14:08  adam
129  * Minor changes.
130  *
131  * Revision 1.4  1998/06/12 12:22:12  adam
132  * Work on Zebra API.
133  *
134  * Revision 1.3  1998/05/27 16:57:44  adam
135  * Zebra returns surrogate diagnostic for single records when
136  * appropriate.
137  *
138  * Revision 1.2  1998/05/20 10:12:19  adam
139  * Implemented automatic EXPLAIN database maintenance.
140  * Modified Zebra to work with ASN.1 compiled version of YAZ.
141  *
142  * Revision 1.1  1998/03/05 08:45:13  adam
143  * New result set model and modular ranking system. Moved towards
144  * descent server API. System information stored as "SGML" records.
145  *
146  */
147
148 #include <assert.h>
149 #include <stdio.h>
150 #ifdef WIN32
151 #include <io.h>
152 #include <process.h>
153 #include <direct.h>
154 #else
155 #include <unistd.h>
156 #endif
157
158 #include <yaz/diagbib1.h>
159 #include "zserver.h"
160 #include <charmap.h>
161
162 static void zebra_chdir (ZebraService zh)
163 {
164     const char *dir = res_get (zh->res, "chdir");
165     if (!dir)
166         return;
167     logf (LOG_DEBUG, "chdir %s", dir);
168 #ifdef WIN32
169     _chdir(dir);
170 #else
171     chdir (dir);
172 #endif
173 }
174
175 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
176                                const char *buf, size_t buf_size,
177                                const char *databaseName, int delete_flag,
178                                int test_mode, int *sysno,
179                                int store_keys, int store_data,
180                                const char *match_criteria);
181
182 static int explain_extract (void *handle, Record rec, data1_node *n);
183 static void extract_index (ZebraHandle zh);
184
185 static void zebra_register_unlock (ZebraHandle zh);
186
187 static int zebra_register_activate (ZebraService zh, int rw);
188 static int zebra_register_deactivate (ZebraService zh);
189
190 static int zebra_register_lock (ZebraHandle zh, int rw)
191 {
192     time_t lastChange;
193     int state;
194     zh->errCode = 0;
195     zh->errString = 0;
196     if (!zh->service->active)
197     {
198         zh->errCode = 1019;
199         return 1;
200     }
201     
202 #if HAVE_SYS_TIMES_H
203     times (&zh->tms1);
204 #endif
205
206     zebra_mutex_cond_lock (&zh->service->session_lock);
207
208     state = zebra_server_lock_get_state(zh->service, &lastChange);
209
210     zebra_server_lock (zh->service, state);
211
212     switch (state)
213     {
214     case 'c':
215         state = 1;
216         break;
217     default:
218         state = 0;
219     }
220     if (rw)
221         logf (LOG_LOG, "Register in read/write mode");
222     else if (zh->service->registerState == state)
223     {
224         logf (LOG_LOG, "registerChange = %ld lastChange = %ld",
225             (long) zh->service->registerChange, (long)lastChange);
226         if (zh->service->registerChange >= lastChange)
227         {
228             return 0;
229         }
230         logf (LOG_LOG, "Register completely updated since last access");
231     }
232     else if (zh->service->registerState == -1)
233         logf (LOG_LOG, "Reading register using state %d pid=%ld", state,
234               (long) getpid());
235     else
236         logf (LOG_LOG, "Register has changed state from %d to %d",
237               zh->service->registerState, state);
238     zh->service->registerChange = lastChange;
239
240     zebra_register_deactivate (zh->service);
241
242     zh->service->registerState = state;
243
244     zebra_register_activate (zh->service, rw);
245     return 0;
246 }
247
248
249 static void zebra_register_unlock (ZebraHandle zh)
250 {
251     if (zh->service->registerState != -1)
252         zebra_server_unlock (zh->service, zh->service->registerState);
253     zebra_mutex_cond_unlock (&zh->service->session_lock);
254 #if HAVE_SYS_TIMES_H
255     times (&zh->tms2);
256     logf (LOG_LOG, "user/system: %ld/%ld",
257                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
258                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
259
260 #endif
261 }
262
263 ZebraHandle zebra_open (ZebraService zs)
264 {
265     ZebraHandle zh;
266
267     assert (zs);
268     if (zs->stop_flag)
269         return 0;
270
271     zh = (ZebraHandle) xmalloc (sizeof(*zh));
272     yaz_log (LOG_LOG, "zebra_open zs=%p returns %p", zs, zh);
273
274     zh->service = zs;
275     zh->sets = 0;
276     zh->destroyed = 0;
277     zh->errCode = 0;
278     zh->errString = 0;
279
280     zh->key_buf = 0;
281     zh->admin_databaseName = 0;
282     
283     zebra_mutex_cond_lock (&zs->session_lock);
284
285     zh->next = zs->sessions;
286     zs->sessions = zh;
287
288     zebra_mutex_cond_unlock (&zs->session_lock);
289
290     return zh;
291 }
292
293
294 ZebraService zebra_start (const char *configName)
295 {
296     ZebraService zh = xmalloc (sizeof(*zh));
297
298     yaz_log (LOG_LOG, "zebra_start %s", configName);
299
300     zh->configName = xstrdup(configName);
301     zh->sessions = 0;
302     zh->stop_flag = 0;
303     zh->active = 1;
304
305     zh->registerState = -1;
306     zh->registerChange = 0;
307
308     if (!(zh->res = res_open (zh->configName)))
309     {
310         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
311 //      return zh;
312     }
313     zebra_chdir (zh);
314     zebra_server_lock_init (zh);
315     zebra_mutex_cond_init (&zh->session_lock);
316     if (!res_get (zh->res, "passwd"))
317         zh->passwd_db = NULL;
318     else
319     {
320         zh->passwd_db = passwd_db_open ();
321         if (!zh->passwd_db)
322             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
323         else
324             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
325     }
326
327     return zh;
328 }
329
330 static int zebra_register_activate (ZebraService zh, int rw)
331 {
332     if (zh->active > 1)
333     {
334         yaz_log (LOG_LOG, "zebra_register_activate (ignored since active=%d)",
335                  zh->active);
336         return 0;
337     }
338     yaz_log (LOG_LOG, "zebra_register_activate shadow=%s",
339              zh->registerState ? "yes" : "no");
340
341     zh->dh = data1_create ();
342     if (!zh->dh)
343         return -1;
344     zh->bfs = bfs_create (res_get (zh->res, "register"));
345     if (!zh->bfs)
346     {
347         data1_destroy(zh->dh);
348         return -1;
349     }
350     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
351     bf_cache (zh->bfs, zh->registerState ? res_get (zh->res, "shadow") : NULL);
352     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
353     zh->recTypes = recTypes_init (zh->dh);
354     recTypes_default_handlers (zh->recTypes);
355
356     zh->records = NULL;
357     zh->zebra_maps = zebra_maps_open (zh->res);
358     zh->rank_classes = NULL;
359
360     zh->records = 0;
361     zh->dict = 0;
362     zh->sortIdx = 0;
363     zh->isams = 0;
364 #if ZMBOL
365     zh->isam = 0;
366     zh->isamc = 0;
367     zh->isamd = 0;
368 #endif
369     zh->zei = 0;
370     
371     zebraRankInstall (zh, rank1_class);
372
373     if (!(zh->records = rec_open (zh->bfs, rw, 0)))
374     {
375         logf (LOG_WARN, "rec_open");
376         return -1;
377     }
378     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, rw, 0)))
379     {
380         logf (LOG_WARN, "dict_open");
381         return -1;
382     }
383     if (!(zh->sortIdx = sortIdx_open (zh->bfs, rw)))
384     {
385         logf (LOG_WARN, "sortIdx_open");
386         return -1;
387     }
388     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
389     {
390         struct ISAMS_M_s isams_m;
391         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, rw,
392                                       key_isams_m(zh->res, &isams_m))))
393         {
394             logf (LOG_WARN, "isams_open");
395             return -1;
396         }
397     }
398 #if ZMBOL
399     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
400     {
401         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, rw,
402                                   sizeof (struct it_key), zh->res)))
403         {
404             logf (LOG_WARN, "is_open");
405             return -1;
406         }
407     }
408     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
409     {
410         struct ISAMC_M_s isamc_m;
411         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
412                                     rw, key_isamc_m(zh->res, &isamc_m))))
413         {
414             logf (LOG_WARN, "isc_open");
415             return -1;
416         }
417     }
418     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
419     {
420         struct ISAMD_M_s isamd_m;
421         
422         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
423                                       rw, key_isamd_m(zh->res, &isamd_m))))
424         {
425             logf (LOG_WARN, "isamd_open");
426             return -1;
427         }
428     }
429 #endif
430     zh->zei = zebraExplain_open (zh->records, zh->dh,
431                                  zh->res, rw, 0 /* rGroup */,
432                                  explain_extract);
433     if (!zh->zei)
434     {
435         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
436         return -1;
437     }
438     zh->active = 2;
439     yaz_log (LOG_LOG, "zebra_register_activate ok");
440     return 0;
441 }
442
443 void zebra_admin_shutdown (ZebraHandle zh)
444 {
445     zebra_mutex_cond_lock (&zh->service->session_lock);
446     zh->service->stop_flag = 1;
447     if (!zh->service->sessions)
448         zebra_register_deactivate(zh->service);
449     zh->service->active = 0;
450     zebra_mutex_cond_unlock (&zh->service->session_lock);
451 }
452
453 void zebra_admin_start (ZebraHandle zh)
454 {
455     ZebraService zs = zh->service;
456     zh->errCode = 0;
457     zebra_mutex_cond_lock (&zs->session_lock);
458     if (!zs->stop_flag)
459         zh->service->active = 1;
460     zebra_mutex_cond_unlock (&zs->session_lock);
461 }
462
463 static int zebra_register_deactivate (ZebraService zs)
464 {
465     zs->stop_flag = 0;
466     if (zs->active <= 1)
467     {
468         yaz_log(LOG_LOG, "zebra_register_deactivate (ignored since active=%d)",
469                 zs->active);
470         return 0;
471     }
472     yaz_log(LOG_LOG, "zebra_register_deactivate");
473     zebra_chdir (zs);
474     if (zs->records)
475     {
476         zebraExplain_close (zs->zei, 0);
477         dict_close (zs->dict);
478         sortIdx_close (zs->sortIdx);
479         if (zs->isams)
480             isams_close (zs->isams);
481 #if ZMBOL
482         if (zs->isam)
483             is_close (zs->isam);
484         if (zs->isamc)
485             isc_close (zs->isamc);
486         if (zs->isamd)
487             isamd_close (zs->isamd);
488 #endif
489         rec_close (&zs->records);
490     }
491     recTypes_destroy (zs->recTypes);
492     zebra_maps_close (zs->zebra_maps);
493     zebraRankDestroy (zs);
494     bfs_destroy (zs->bfs);
495     data1_destroy (zs->dh);
496
497     if (zs->passwd_db)
498         passwd_db_close (zs->passwd_db);
499     zs->active = 1;
500     return 0;
501 }
502
503 void zebra_stop(ZebraService zs)
504 {
505     if (!zs)
506         return ;
507     yaz_log (LOG_LOG, "zebra_stop");
508
509     zebra_mutex_cond_lock (&zs->session_lock);
510     while (zs->sessions)
511         zebra_close (zs->sessions);
512
513     zebra_mutex_cond_unlock (&zs->session_lock);
514
515     zebra_mutex_cond_destroy (&zs->session_lock);
516
517     zebra_register_deactivate(zs);
518     res_close (zs->res);
519     xfree (zs->configName);
520     xfree (zs);
521 }
522
523 void zebra_close (ZebraHandle zh)
524 {
525     ZebraService zs = zh->service;
526     struct zebra_session **sp;
527
528     yaz_log (LOG_LOG, "zebra_close zh=%p", zh);
529     if (!zh)
530         return ;
531     resultSetDestroy (zh, -1, 0, 0);
532
533     if (zh->key_buf)
534     {
535         xfree (zh->key_buf);
536         zh->key_buf = 0;
537     }
538     xfree (zh->admin_databaseName);
539     zebra_mutex_cond_lock (&zs->session_lock);
540     sp = &zs->sessions;
541     while (1)
542     {
543         assert (*sp);
544         if (*sp == zh)
545         {
546             *sp = (*sp)->next;
547             break;
548         }
549         sp = &(*sp)->next;
550     }
551     if (!zs->sessions && zs->stop_flag)
552         zebra_register_deactivate(zs);
553     zebra_mutex_cond_unlock (&zs->session_lock);
554     xfree (zh);
555 }
556
557 struct map_baseinfo {
558     ZebraHandle zh;
559     NMEM mem;
560     int num_bases;
561     char **basenames;
562     int new_num_bases;
563     char **new_basenames;
564     int new_num_max;
565 };
566         
567 void map_basenames_func (void *vp, const char *name, const char *value)
568 {
569     struct map_baseinfo *p = (struct map_baseinfo *) vp;
570     int i, no;
571     char fromdb[128], todb[8][128];
572     
573     no =
574         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
575                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
576                 todb[5], todb[6], todb[7]);
577     if (no < 2)
578         return ;
579     no--;
580     for (i = 0; i<p->num_bases; i++)
581         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
582         {
583             p->basenames[i] = 0;
584             for (i = 0; i < no; i++)
585             {
586                 if (p->new_num_bases == p->new_num_max)
587                     return;
588                 p->new_basenames[(p->new_num_bases)++] = 
589                     nmem_strdup (p->mem, todb[i]);
590             }
591             return;
592         }
593 }
594
595 void map_basenames (ZebraHandle zh, ODR stream,
596                     int *num_bases, char ***basenames)
597 {
598     struct map_baseinfo info;
599     struct map_baseinfo *p = &info;
600     int i;
601
602     info.zh = zh;
603     info.num_bases = *num_bases;
604     info.basenames = *basenames;
605     info.new_num_max = 128;
606     info.new_num_bases = 0;
607     info.new_basenames = (char **)
608         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
609     info.mem = stream->mem;
610
611     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
612     
613     for (i = 0; i<p->num_bases; i++)
614         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
615         {
616             p->new_basenames[(p->new_num_bases)++] = 
617                 nmem_strdup (p->mem, p->basenames[i]);
618         }
619     *num_bases = info.new_num_bases;
620     *basenames = info.new_basenames;
621     for (i = 0; i<*num_bases; i++)
622         logf (LOG_LOG, "base %s", (*basenames)[i]);
623 }
624
625 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
626                        Z_RPNQuery *query, int num_bases, char **basenames, 
627                        const char *setname)
628 {
629     zh->hits = 0;
630     if (zebra_register_lock (zh, 0))
631         return;
632     map_basenames (zh, stream, &num_bases, &basenames);
633     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
634
635     zebra_register_unlock (zh);
636
637     logf(LOG_APP,"SEARCH:%d:",zh->hits);
638 }
639
640 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
641                              const char *setname, Z_RecordComposition *comp,
642                              oid_value input_format, int num_recs,
643                              ZebraRetrievalRecord *recs)
644 {
645     ZebraPosSet poset;
646     int i, *pos_array;
647
648     if (zebra_register_lock (zh, 0))
649         return;
650     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
651     for (i = 0; i<num_recs; i++)
652         pos_array[i] = recs[i].position;
653     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
654     if (!poset)
655     {
656         logf (LOG_DEBUG, "zebraPosSetCreate error");
657         zh->errCode = 30;
658         zh->errString = nmem_strdup (stream->mem, setname);
659     }
660     else
661     {
662         for (i = 0; i<num_recs; i++)
663         {
664             if (!poset[i].sysno)
665             {
666                 char num_str[20];
667
668                 sprintf (num_str, "%d", pos_array[i]);  
669                 zh->errCode = 13;
670                 zh->errString = nmem_strdup (stream->mem, num_str);
671                 break;
672             }
673             else
674             {
675                 recs[i].errCode =
676                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
677                                         stream, input_format, comp,
678                                         &recs[i].format, &recs[i].buf,
679                                         &recs[i].len,
680                                         &recs[i].base);
681                 recs[i].errString = NULL;
682             }
683         }
684         zebraPosSetDestroy (zh, poset, num_recs);
685     }
686     zebra_register_unlock (zh);
687     xfree (pos_array);
688 }
689
690 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
691                  oid_value attributeset,
692                  int num_bases, char **basenames,
693                  int *position, int *num_entries, ZebraScanEntry **entries,
694                  int *is_partial)
695 {
696     if (zebra_register_lock (zh, 0))
697     {
698         *entries = 0;
699         *num_entries = 0;
700         return;
701     }
702     map_basenames (zh, stream, &num_bases, &basenames);
703     rpn_scan (zh, stream, zapt, attributeset,
704               num_bases, basenames, position,
705               num_entries, entries, is_partial);
706     zebra_register_unlock (zh);
707 }
708
709 void zebra_sort (ZebraHandle zh, ODR stream,
710                  int num_input_setnames, const char **input_setnames,
711                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
712                  int *sort_status)
713 {
714     if (zebra_register_lock (zh, 0))
715         return;
716     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
717                    output_setname, sort_sequence, sort_status);
718     zebra_register_unlock (zh);
719 }
720
721 int zebra_deleleResultSet(ZebraHandle zh, int function,
722                           int num_setnames, char **setnames,
723                           int *statuses)
724 {
725     int i, status;
726     if (zebra_register_lock (zh, 0))
727         return Z_DeleteStatus_systemProblemAtTarget;
728     switch (function)
729     {
730     case Z_DeleteRequest_list:
731         resultSetDestroy (zh, num_setnames, setnames, statuses);
732         break;
733     case Z_DeleteRequest_all:
734         resultSetDestroy (zh, -1, 0, statuses);
735         break;
736     }
737     zebra_register_unlock (zh);
738     status = Z_DeleteStatus_success;
739     for (i = 0; i<num_setnames; i++)
740         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
741             status = statuses[i];
742     return status;
743 }
744
745 int zebra_errCode (ZebraHandle zh)
746 {
747     return zh->errCode;
748 }
749
750 const char *zebra_errString (ZebraHandle zh)
751 {
752     return diagbib1_str (zh->errCode);
753 }
754
755 char *zebra_errAdd (ZebraHandle zh)
756 {
757     return zh->errString;
758 }
759
760 int zebra_hits (ZebraHandle zh)
761 {
762     return zh->hits;
763 }
764
765 int zebra_auth (ZebraService zh, const char *user, const char *pass)
766 {
767     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
768     {
769         logf(LOG_APP,"AUTHOK:%s", user?user:"ANONYMOUS");
770         return 0;
771     }
772
773     logf(LOG_APP,"AUTHFAIL:%s", user?user:"ANONYMOUS");
774     return 1;
775 }
776
777 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
778 {
779     if (zebra_register_lock (zh, 1))
780         return;
781     xfree (zh->admin_databaseName);
782     zh->admin_databaseName = xstrdup(database);
783 }
784
785 void zebra_admin_import_end (ZebraHandle zh)
786 {
787     zebraExplain_flush (zh->service->zei, 1, zh);
788     extract_index (zh);
789     zebra_register_unlock (zh);
790 }
791
792 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
793 {
794     int sysno;
795     int i;
796     if (zh->service->active < 2)
797         return;
798     for (i = 0; i<segment->num_segmentRecords; i++)
799     {
800         Z_NamePlusRecord *npr = segment->segmentRecords[i];
801         const char *databaseName = npr->databaseName;
802
803         if (!databaseName)
804             databaseName = zh->admin_databaseName;
805         printf ("--------------%d--------------------\n", i);
806         if (npr->which == Z_NamePlusRecord_intermediateFragment)
807         {
808             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
809             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
810             {
811                 Odr_oct *oct = fragment->u.notExternallyTagged;
812                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
813                         oct->buf);
814                 
815                 sysno = 0;
816                 extract_rec_in_mem (zh, "grs.sgml",
817                                     oct->buf, oct->len,
818                                     databaseName,
819                                     0 /* delete_flag */,
820                                     0 /* test_mode */,
821                                     &sysno /* sysno */,
822                                     1 /* store_keys */,
823                                     1 /* store_data */,
824                                     0 /* match criteria */);
825             }
826         }
827     }
828 }
829
830 void zebra_admin_create (ZebraHandle zh, const char *database)
831 {
832     ZebraService zs = zh->service;
833     if (zebra_register_lock(zh, 1))
834     {
835         zh->errCode = 1019;
836         return;
837     }
838     /* announce database */
839     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
840     {
841         zh->errCode = 224;
842         zh->errString = "Database already exist";
843     }
844     zebraExplain_flush (zh->service->zei, 1, zh);
845     extract_index (zh);
846     zebra_register_unlock(zh);
847 }
848
849 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
850                        const char *input_str, int input_len,
851                        char *output_str, int output_len)
852 {
853     WRBUF wrbuf;
854     if (!zh->service->zebra_maps)
855         return -1;
856     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
857                           input_str, input_len);
858     if (!wrbuf)
859         return -2;
860     if (wrbuf_len(wrbuf) >= output_len)
861         return -3;
862     if (wrbuf_len(wrbuf))
863         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
864     output_str[wrbuf_len(wrbuf)] = '\0';
865     return wrbuf_len(wrbuf);
866 }
867
868 static void extract_init (struct recExtractCtrl *p, RecWord *w)
869 {
870     w->zebra_maps = p->zebra_maps;
871     w->seqnos = p->seqno;
872     w->attrSet = VAL_BIB1;
873     w->attrUse = 1016;
874     w->reg_type = 'w';
875     w->extractCtrl = p;
876 }
877
878 static void extract_add_index_string (RecWord *p, const char *string,
879                                       int length)
880 {
881     char *dst;
882     unsigned char attrSet;
883     unsigned short attrUse;
884     int lead = 0;
885     int diff = 0;
886     int *pseqno = &p->seqnos[p->reg_type];
887     ZebraHandle zh = p->extractCtrl->handle;
888     ZebraExplainInfo zei = zh->service->zei;
889     struct recKeys *keys = &zh->keys;
890
891     if (keys->buf_used+1024 > keys->buf_max)
892     {
893         char *b;
894
895         b = (char *) xmalloc (keys->buf_max += 128000);
896         if (keys->buf_used > 0)
897             memcpy (b, keys->buf, keys->buf_used);
898         xfree (keys->buf);
899         keys->buf = b;
900     }
901     dst = keys->buf + keys->buf_used;
902
903     attrSet = p->attrSet;
904     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
905         lead |= 1;
906     else
907         keys->prevAttrSet = attrSet;
908     attrUse = p->attrUse;
909     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
910         lead |= 2;
911     else
912         keys->prevAttrUse = attrUse;
913 #if 1
914     diff = 1 + *pseqno - keys->prevSeqNo;
915     if (diff >= 1 && diff <= 15)
916         lead |= (diff << 2);
917     else
918         diff = 0;
919 #endif
920     keys->prevSeqNo = *pseqno;
921     
922     *dst++ = lead;
923
924 #if SU_SCHEME
925     if ((lead & 3) < 3)
926     {
927         int ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
928         if (ch < 0)
929         {
930             ch = zebraExplain_addSU (zei, attrSet, attrUse);
931             yaz_log (LOG_LOG, "addSU set=%d use=%d SU=%d",
932                      attrSet, attrUse, ch);
933         }
934         assert (ch > 0);
935         memcpy (dst, &ch, sizeof(ch));
936         dst += sizeof(ch);
937     }
938 #else
939     if (!(lead & 1))
940     {
941         memcpy (dst, &attrSet, sizeof(attrSet));
942         dst += sizeof(attrSet);
943     }
944     if (!(lead & 2))
945     {
946         memcpy (dst, &attrUse, sizeof(attrUse));
947         dst += sizeof(attrUse);
948     }
949 #endif
950     *dst++ = p->reg_type;
951     memcpy (dst, string, length);
952     dst += length;
953     *dst++ = '\0';
954
955     if (!diff)
956     {
957         memcpy (dst, pseqno, sizeof(*pseqno));
958         dst += sizeof(*pseqno);
959     }
960     keys->buf_used = dst - keys->buf;
961     if (*pseqno)
962         (*pseqno)++;
963 }
964
965 static void extract_add_sort_string (RecWord *p, const char *string,
966                                      int length)
967 {
968     struct sortKey *sk;
969     ZebraHandle zh = p->extractCtrl->handle;
970     struct sortKey *sortKeys = zh->sortKeys;
971
972     for (sk = sortKeys; sk; sk = sk->next)
973         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
974             return;
975
976     sk = (struct sortKey *) xmalloc (sizeof(*sk));
977     sk->next = sortKeys;
978     sortKeys = sk;
979
980     sk->string = (char *) xmalloc (length);
981     sk->length = length;
982     memcpy (sk->string, string, length);
983
984     sk->attrSet = p->attrSet;
985     sk->attrUse = p->attrUse;
986 }
987
988 static void extract_add_string (RecWord *p, const char *string, int length)
989 {
990     assert (length > 0);
991     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
992         extract_add_sort_string (p, string, length);
993     else
994         extract_add_index_string (p, string, length);
995 }
996
997 static void extract_add_incomplete_field (RecWord *p)
998 {
999     const char *b = p->string;
1000     int remain = p->length;
1001     const char **map = 0;
1002
1003     if (remain > 0)
1004         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1005
1006     while (map)
1007     {
1008         char buf[IT_MAX_WORD+1];
1009         int i, remain;
1010
1011         /* Skip spaces */
1012         while (map && *map && **map == *CHR_SPACE)
1013         {
1014             remain = p->length - (b - p->string);
1015             if (remain > 0)
1016                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1017             else
1018                 map = 0;
1019         }
1020         if (!map)
1021             break;
1022         i = 0;
1023         while (map && *map && **map != *CHR_SPACE)
1024         {
1025             const char *cp = *map;
1026
1027             while (i < IT_MAX_WORD && *cp)
1028                 buf[i++] = *(cp++);
1029             remain = p->length - (b - p->string);
1030             if (remain > 0)
1031                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1032             else
1033                 map = 0;
1034         }
1035         if (!i)
1036             return;
1037         extract_add_string (p, buf, i);
1038     }
1039     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
1040 }
1041
1042 static void extract_add_complete_field (RecWord *p)
1043 {
1044     const char *b = p->string;
1045     char buf[IT_MAX_WORD+1];
1046     const char **map = 0;
1047     int i = 0, remain = p->length;
1048
1049     if (remain > 0)
1050         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
1051
1052     while (remain > 0 && i < IT_MAX_WORD)
1053     {
1054         while (map && *map && **map == *CHR_SPACE)
1055         {
1056             remain = p->length - (b - p->string);
1057             if (remain > 0)
1058                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1059             else
1060                 map = 0;
1061         }
1062         if (!map)
1063             break;
1064
1065         if (i && i < IT_MAX_WORD)
1066             buf[i++] = *CHR_SPACE;
1067         while (map && *map && **map != *CHR_SPACE)
1068         {
1069             const char *cp = *map;
1070
1071             if (i >= IT_MAX_WORD)
1072                 break;
1073             while (i < IT_MAX_WORD && *cp)
1074                 buf[i++] = *(cp++);
1075             remain = p->length  - (b - p->string);
1076             if (remain > 0)
1077                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
1078                                         remain);
1079             else
1080                 map = 0;
1081         }
1082     }
1083     if (!i)
1084         return;
1085     extract_add_string (p, buf, i);
1086 }
1087
1088 static void extract_token_add (RecWord *p)
1089 {
1090     WRBUF wrbuf;
1091     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
1092                                p->string, p->length)))
1093     {
1094         p->string = wrbuf_buf(wrbuf);
1095         p->length = wrbuf_len(wrbuf);
1096     }
1097     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
1098         extract_add_complete_field (p);
1099     else
1100         extract_add_incomplete_field(p);
1101 }
1102
1103 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
1104 {
1105     ZebraHandle zh = (ZebraHandle) (p->handle);
1106     zebraExplain_addSchema (zh->service->zei, oid);
1107 }
1108
1109 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
1110                                    int cmd, struct sortKey **skp)
1111 {
1112     struct sortKey *sk = *skp;
1113     SortIdx sortIdx = zh->service->sortIdx;
1114
1115     sortIdx_sysno (sortIdx, sysno);
1116     while (sk)
1117     {
1118         struct sortKey *sk_next = sk->next;
1119         sortIdx_type (sortIdx, sk->attrUse);
1120         sortIdx_add (sortIdx, sk->string, sk->length);
1121         xfree (sk->string);
1122         xfree (sk);
1123         sk = sk_next;
1124     }
1125     *skp = 0;
1126 }
1127
1128 struct encode_info {
1129     int  sysno;
1130     int  seqno;
1131     int  cmd;
1132     char buf[768];
1133 };
1134
1135 void encode_key_init (struct encode_info *i)
1136 {
1137     i->sysno = 0;
1138     i->seqno = 0;
1139     i->cmd = -1;
1140 }
1141
1142 char *encode_key_int (int d, char *bp)
1143 {
1144     if (d <= 63)
1145         *bp++ = d;
1146     else if (d <= 16383)
1147     {
1148         *bp++ = 64 + (d>>8);
1149         *bp++ = d  & 255;
1150     }
1151     else if (d <= 4194303)
1152     {
1153         *bp++ = 128 + (d>>16);
1154         *bp++ = (d>>8) & 255;
1155         *bp++ = d & 255;
1156     }
1157     else
1158     {
1159         *bp++ = 192 + (d>>24);
1160         *bp++ = (d>>16) & 255;
1161         *bp++ = (d>>8) & 255;
1162         *bp++ = d & 255;
1163     }
1164     return bp;
1165 }
1166
1167 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1168 {
1169     struct it_key key;
1170     char *bp = i->buf;
1171
1172     while ((*bp++ = *k++))
1173         ;
1174     memcpy (&key, k+1, sizeof(struct it_key));
1175     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1176     if (i->sysno != key.sysno)
1177     {
1178         i->sysno = key.sysno;
1179         i->seqno = 0;
1180     }
1181     else if (!i->seqno && !key.seqno && i->cmd == *k)
1182         return;
1183     bp = encode_key_int (key.seqno - i->seqno, bp);
1184     i->seqno = key.seqno;
1185     i->cmd = *k;
1186     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1187     {
1188         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1189         exit (1);
1190     }
1191 }
1192
1193 static void extract_flushWriteKeys (ZebraHandle zh)
1194 {
1195     FILE *outf;
1196     char out_fname[200];
1197     char *prevcp, *cp;
1198     struct encode_info encode_info;
1199     int ptr_i = zh->ptr_i;
1200 #if SORT_EXTRA
1201     int i;
1202 #endif
1203     if (!zh->key_buf || ptr_i <= 0)
1204         return;
1205
1206     (zh->key_file_no)++;
1207     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1208 #if !SORT_EXTRA
1209     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1210             key_qsort_compare);
1211     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1212
1213     if (!(outf = fopen (out_fname, "wb")))
1214     {
1215         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1216         exit (1);
1217     }
1218     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1219     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1220     
1221     encode_key_init (&encode_info);
1222     encode_key_write (cp, &encode_info, outf);
1223     
1224     while (--ptr_i > 0)
1225     {
1226         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1227         if (strcmp (cp, prevcp))
1228         {
1229             encode_key_init (&encode_info);
1230             encode_key_write (cp, &encode_info, outf);
1231             prevcp = cp;
1232         }
1233         else
1234             encode_key_write (cp + strlen(cp), &encode_info, outf);
1235     }
1236 #else
1237     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1238     extract_get_fname_tmp (out_fname, key_file_no);
1239
1240     if (!(outf = fopen (out_fname, "wb")))
1241     {
1242         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1243         exit (1);
1244     }
1245     logf (LOG_LOG, "writing section %d", key_file_no);
1246     i = ptr_i;
1247     prevcp =  key_buf[ptr_top-i];
1248     while (1)
1249         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1250         {
1251             key_y_len = strlen(prevcp)+1;
1252 #if 0
1253             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1254                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1255 #endif
1256             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1257                                    sizeof(char*), key_y_compare);
1258             cp = key_buf[ptr_top-ptr_i];
1259             --key_y_len;
1260             encode_key_init (&encode_info);
1261             encode_key_write (cp, &encode_info, outf);
1262             while (--ptr_i > i)
1263             {
1264                 cp = key_buf[ptr_top-ptr_i];
1265                 encode_key_write (cp+key_y_len, &encode_info, outf);
1266             }
1267             if (!i)
1268                 break;
1269             prevcp = key_buf[ptr_top-ptr_i];
1270         }
1271 #endif
1272     if (fclose (outf))
1273     {
1274         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1275         exit (1);
1276     }
1277     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1278     zh->ptr_i = 0;
1279     zh->key_buf_used = 0;
1280 }
1281
1282 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1283                                      int cmd, struct recKeys *reckeys)
1284 {
1285 #if SU_SCHEME
1286 #else
1287     unsigned char attrSet = (unsigned char) -1;
1288     unsigned short attrUse = (unsigned short) -1;
1289 #endif
1290     int seqno = 0;
1291     int off = 0;
1292     int ch = 0;
1293     ZebraExplainInfo zei = zh->service->zei;
1294
1295     if (!zh->key_buf)
1296     {
1297         int mem = 8*1024*1024;
1298         zh->key_buf = (char**) xmalloc (mem);
1299         zh->ptr_top = mem/sizeof(char*);
1300         zh->ptr_i = 0;
1301         zh->key_buf_used = 0;
1302         zh->key_file_no = 0;
1303     }
1304     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1305     while (off < reckeys->buf_used)
1306     {
1307         const char *src = reckeys->buf + off;
1308         struct it_key key;
1309         int lead;
1310     
1311         lead = *src++;
1312
1313 #if SU_SCHEME
1314         if ((lead & 3) < 3)
1315         {
1316             memcpy (&ch, src, sizeof(ch));
1317             src += sizeof(ch);
1318         }
1319 #else
1320         if (!(lead & 1))
1321         {
1322             memcpy (&attrSet, src, sizeof(attrSet));
1323             src += sizeof(attrSet);
1324         }
1325         if (!(lead & 2))
1326         {
1327             memcpy (&attrUse, src, sizeof(attrUse));
1328             src += sizeof(attrUse);
1329         }
1330 #endif
1331         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1332             extract_flushWriteKeys (zh);
1333         ++(zh->ptr_i);
1334         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1335             (char*)zh->key_buf + zh->key_buf_used;
1336 #if SU_SCHEME
1337 #else
1338         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1339         if (ch < 0)
1340             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1341 #endif
1342         assert (ch > 0);
1343         zh->key_buf_used +=
1344             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1345
1346         while (*src)
1347             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1348         src++;
1349         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1350         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1351
1352         if (lead & 60)
1353             seqno += ((lead>>2) & 15)-1;
1354         else
1355         {
1356             memcpy (&seqno, src, sizeof(seqno));
1357             src += sizeof(seqno);
1358         }
1359         key.seqno = seqno;
1360         key.sysno = sysno;
1361         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1362         (zh->key_buf_used) += sizeof(key);
1363         off = src - reckeys->buf;
1364     }
1365     assert (off == reckeys->buf_used);
1366 }
1367
1368 static void extract_index (ZebraHandle zh)
1369 {
1370     extract_flushWriteKeys (zh);
1371     zebra_index_merge (zh);
1372 }
1373
1374 static int explain_extract (void *handle, Record rec, data1_node *n)
1375 {
1376     ZebraHandle zh = (ZebraHandle) handle;
1377     struct recExtractCtrl extractCtrl;
1378     int i;
1379
1380     if (zebraExplain_curDatabase (zh->service->zei,
1381                                   rec->info[recInfo_databaseName]))
1382     {
1383         abort();
1384         if (zebraExplain_newDatabase (zh->service->zei,
1385                                       rec->info[recInfo_databaseName], 0))
1386             abort ();
1387     }
1388
1389     zh->keys.buf_used = 0;
1390     zh->keys.prevAttrUse = -1;
1391     zh->keys.prevAttrSet = -1;
1392     zh->keys.prevSeqNo = 0;
1393     zh->sortKeys = 0;
1394     
1395     extractCtrl.init = extract_init;
1396     extractCtrl.tokenAdd = extract_token_add;
1397     extractCtrl.schemaAdd = extract_schema_add;
1398     extractCtrl.dh = zh->service->dh;
1399     for (i = 0; i<256; i++)
1400         extractCtrl.seqno[i] = 0;
1401     extractCtrl.zebra_maps = zh->service->zebra_maps;
1402     extractCtrl.flagShowRecords = 0;
1403     extractCtrl.handle = handle;
1404     
1405     grs_extract_tree(&extractCtrl, n);
1406
1407     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1408
1409     if (rec->size[recInfo_delKeys])
1410     {
1411         struct recKeys delkeys;
1412         struct sortKey *sortKeys = 0;
1413
1414         delkeys.buf_used = rec->size[recInfo_delKeys];
1415         delkeys.buf = rec->info[recInfo_delKeys];
1416         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1417         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1418     }
1419     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1420     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1421
1422     xfree (rec->info[recInfo_delKeys]);
1423     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1424     rec->info[recInfo_delKeys] = zh->keys.buf;
1425     zh->keys.buf = NULL;
1426     zh->keys.buf_max = 0;
1427     return 0;
1428 }
1429
1430 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1431                                const char *buf, size_t buf_size,
1432                                const char *databaseName, int delete_flag,
1433                                int test_mode, int *sysno,
1434                                int store_keys, int store_data,
1435                                const char *match_criteria)
1436 {
1437     RecordAttr *recordAttr;
1438     struct recExtractCtrl extractCtrl;
1439     int i, r;
1440     RecType recType;
1441     char subType[1024];
1442     void *clientData;
1443     const char *fname = "<no file>";
1444     Record rec;
1445     long recordOffset = 0;
1446     struct zebra_fetch_control fc;
1447
1448     fc.fd = -1;
1449     fc.record_int_buf = buf;
1450     fc.record_int_len = buf_size;
1451     fc.record_int_pos = 0;
1452     fc.offset_end = 0;
1453     fc.record_offset = 0;
1454
1455     extractCtrl.offset = 0;
1456     extractCtrl.readf = zebra_record_int_read;
1457     extractCtrl.seekf = zebra_record_int_seek;
1458     extractCtrl.tellf = zebra_record_int_tell;
1459     extractCtrl.endf = zebra_record_int_end;
1460     extractCtrl.fh = &fc;
1461
1462     /* announce database */
1463     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1464     {
1465         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1466             return 0;
1467     }
1468     if (!(recType =
1469           recType_byName (zh->service->recTypes, recordType, subType,
1470                           &clientData)))
1471     {
1472         logf (LOG_WARN, "No such record type: %s", recordType);
1473         return 0;
1474     }
1475
1476     zh->keys.buf_used = 0;
1477     zh->keys.prevAttrUse = -1;
1478     zh->keys.prevAttrSet = -1;
1479     zh->keys.prevSeqNo = 0;
1480     zh->sortKeys = 0;
1481
1482     extractCtrl.subType = subType;
1483     extractCtrl.init = extract_init;
1484     extractCtrl.tokenAdd = extract_token_add;
1485     extractCtrl.schemaAdd = extract_schema_add;
1486     extractCtrl.dh = zh->service->dh;
1487     extractCtrl.handle = zh;
1488     extractCtrl.zebra_maps = zh->service->zebra_maps;
1489     extractCtrl.flagShowRecords = 0;
1490     for (i = 0; i<256; i++)
1491     {
1492         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1493             extractCtrl.seqno[i] = 1;
1494         else
1495             extractCtrl.seqno[i] = 0;
1496     }
1497
1498     r = (*recType->extract)(clientData, &extractCtrl);
1499
1500     if (r == RECCTRL_EXTRACT_EOF)
1501         return 0;
1502     else if (r == RECCTRL_EXTRACT_ERROR)
1503     {
1504         /* error occured during extraction ... */
1505 #if 1
1506         yaz_log (LOG_WARN, "extract error");
1507 #else
1508         if (rGroup->flagRw &&
1509             records_processed < rGroup->fileVerboseLimit)
1510         {
1511             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1512                   fname, (long) recordOffset);
1513         }
1514 #endif
1515         return 0;
1516     }
1517     if (zh->keys.buf_used == 0)
1518     {
1519         /* the extraction process returned no information - the record
1520            is probably empty - unless flagShowRecords is in use */
1521         if (test_mode)
1522             return 1;
1523         logf (LOG_WARN, "No keys generated for record");
1524         logf (LOG_WARN, " The file is probably empty");
1525         return 1;
1526     }
1527     /* match criteria */
1528
1529     if (! *sysno)
1530     {
1531         /* new record */
1532         if (delete_flag)
1533         {
1534             logf (LOG_LOG, "delete %s %s %ld", recordType,
1535                   fname, (long) recordOffset);
1536             logf (LOG_WARN, "cannot delete record above (seems new)");
1537             return 1;
1538         }
1539         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1540               (long) recordOffset);
1541         rec = rec_new (zh->service->records);
1542
1543         *sysno = rec->sysno;
1544
1545         recordAttr = rec_init_attr (zh->service->zei, rec);
1546
1547 #if 0
1548         if (matchStr)
1549         {
1550             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1551         }
1552 #endif
1553         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1554         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1555     }
1556     else
1557     {
1558         /* record already exists */
1559         struct recKeys delkeys;
1560
1561         rec = rec_get (zh->service->records, *sysno);
1562         assert (rec);
1563         
1564         recordAttr = rec_init_attr (zh->service->zei, rec);
1565
1566         if (recordAttr->runNumber ==
1567             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1568         {
1569             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1570                   fname, (long) recordOffset);
1571             rec_rm (&rec);
1572             return 1;
1573         }
1574         delkeys.buf_used = rec->size[recInfo_delKeys];
1575         delkeys.buf = rec->info[recInfo_delKeys];
1576         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1577         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1578         if (delete_flag)
1579         {
1580             /* record going to be deleted */
1581             if (!delkeys.buf_used)
1582             {
1583                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1584                       fname, (long) recordOffset);
1585                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1586             }
1587             else
1588             {
1589                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1590                       fname, (long) recordOffset);
1591 #if 0
1592                 if (matchStr)
1593                     dict_delete (matchDict, matchStr);
1594 #endif
1595                 rec_del (zh->service->records, &rec);
1596             }
1597             rec_rm (&rec);
1598             return 1;
1599         }
1600         else
1601         {
1602             /* record going to be updated */
1603             if (!delkeys.buf_used)
1604             {
1605                 logf (LOG_LOG, "update %s %s %ld", recordType,
1606                       fname, (long) recordOffset);
1607                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1608             }
1609             else
1610             {
1611                 logf (LOG_LOG, "update %s %s %ld", recordType,
1612                       fname, (long) recordOffset);
1613                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1614             }
1615         }
1616     }
1617     /* update file type */
1618     xfree (rec->info[recInfo_fileType]);
1619     rec->info[recInfo_fileType] =
1620         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1621
1622     /* update filename */
1623     xfree (rec->info[recInfo_filename]);
1624     rec->info[recInfo_filename] =
1625         rec_strdup (fname, &rec->size[recInfo_filename]);
1626
1627     /* update delete keys */
1628     xfree (rec->info[recInfo_delKeys]);
1629     if (zh->keys.buf_used > 0 && store_keys == 1)
1630     {
1631         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1632         rec->info[recInfo_delKeys] = zh->keys.buf;
1633         zh->keys.buf = NULL;
1634         zh->keys.buf_max = 0;
1635     }
1636     else
1637     {
1638         rec->info[recInfo_delKeys] = NULL;
1639         rec->size[recInfo_delKeys] = 0;
1640     }
1641
1642     /* save file size of original record */
1643     zebraExplain_recordBytesIncrement (zh->service->zei,
1644                                        - recordAttr->recordSize);
1645 #if 0
1646     recordAttr->recordSize = fi->file_moffset - recordOffset;
1647     if (!recordAttr->recordSize)
1648         recordAttr->recordSize = fi->file_max - recordOffset;
1649 #else
1650     recordAttr->recordSize = buf_size;
1651 #endif
1652     zebraExplain_recordBytesIncrement (zh->service->zei,
1653                                        recordAttr->recordSize);
1654
1655     /* set run-number for this record */
1656     recordAttr->runNumber =
1657         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1658
1659     /* update store data */
1660     xfree (rec->info[recInfo_storeData]);
1661     if (store_data == 1)
1662     {
1663         rec->size[recInfo_storeData] = recordAttr->recordSize;
1664         rec->info[recInfo_storeData] = (char *)
1665             xmalloc (recordAttr->recordSize);
1666 #if 1
1667         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1668 #else
1669         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1670         {
1671             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1672                   (long) recordOffset, fname);
1673             exit (1);
1674         }
1675         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1676             < recordAttr->recordSize)
1677         {
1678             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1679                   recordAttr->recordSize, fname);
1680             exit (1);
1681         }
1682 #endif
1683     }
1684     else
1685     {
1686         rec->info[recInfo_storeData] = NULL;
1687         rec->size[recInfo_storeData] = 0;
1688     }
1689     /* update database name */
1690     xfree (rec->info[recInfo_databaseName]);
1691     rec->info[recInfo_databaseName] =
1692         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1693
1694     /* update offset */
1695     recordAttr->recordOffset = recordOffset;
1696     
1697     /* commit this record */
1698     rec_put (zh->service->records, &rec);
1699
1700     return 0;
1701 }