Fixed problem with passwd db.
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.40  2000-11-29 15:21:31  adam
7  * Fixed problem with passwd db.
8  *
9  * Revision 1.39  2000/11/29 14:24:01  adam
10  * Script configure uses yaz pthreads options. Added locking for
11  * zebra_register_{lock,unlock}.
12  *
13  * Revision 1.38  2000/11/08 13:46:58  adam
14  * Fixed scan: server could break if bad attribute/database was selected.
15  * Work on remote update.
16  *
17  * Revision 1.37  2000/10/17 12:37:09  adam
18  * Fixed notification of live-updates. Fixed minor problem with mf_init
19  * where it didn't handle shadow area file names correctly.
20  *
21  * Revision 1.36  2000/09/06 08:59:36  adam
22  * Using read-only (for now) for server.
23  *
24  * Revision 1.35  2000/07/07 12:49:20  adam
25  * Optimized resultSetInsert{Rank,Sort}.
26  *
27  * Revision 1.34  2000/06/09 13:56:38  ian
28  * Added some logging on Authentication and searches.
29  *
30  * Revision 1.33  2000/05/18 12:01:36  adam
31  * System call times(2) used again. More 64-bit fixes.
32  *
33  * Revision 1.32  2000/04/19 14:35:59  adam
34  * WIN32 update (this version is known not to work on Windows).
35  *
36  * Revision 1.31  2000/04/05 10:07:02  adam
37  * Minor zebra compile fix.
38  *
39  * Revision 1.30  2000/04/05 09:49:35  adam
40  * On Unix, zebra/z'mbol uses automake.
41  *
42  * Revision 1.29  2000/03/20 19:08:36  adam
43  * Added remote record import using Z39.50 extended services and Segment
44  * Requests.
45  *
46  * Revision 1.28  2000/03/15 15:00:30  adam
47  * First work on threaded version.
48  *
49  * Revision 1.27  2000/02/24 12:31:17  adam
50  * Added zebra_string_norm.
51  *
52  * Revision 1.26  1999/11/30 13:48:03  adam
53  * Improved installation. Updated for inclusion of YAZ header files.
54  *
55  * Revision 1.25  1999/11/04 15:00:45  adam
56  * Implemented delete result set(s).
57  *
58  * Revision 1.24  1999/10/14 14:33:50  adam
59  * Added truncation 5=106.
60  *
61  * Revision 1.23  1999/09/07 11:36:32  adam
62  * Minor changes.
63  *
64  * Revision 1.22  1999/08/02 10:13:47  adam
65  * Fixed bug regarding zebra_hits.
66  *
67  * Revision 1.21  1999/07/14 10:59:26  adam
68  * Changed functions isc_getmethod, isams_getmethod.
69  * Improved fatal error handling (such as missing EXPLAIN schema).
70  *
71  * Revision 1.20  1999/07/06 12:28:04  adam
72  * Updated record index structure. Format includes version ID. Compression
73  * algorithm ID is stored for each record block.
74  *
75  * Revision 1.19  1999/05/26 07:49:13  adam
76  * C++ compilation.
77  *
78  * Revision 1.18  1999/05/15 14:36:38  adam
79  * Updated dictionary. Implemented "compression" of dictionary.
80  *
81  * Revision 1.17  1999/05/12 13:08:06  adam
82  * First version of ISAMS.
83  *
84  * Revision 1.16  1999/02/19 10:38:30  adam
85  * Implemented chdir-setting.
86  *
87  * Revision 1.15  1999/02/17 12:18:12  adam
88  * Fixed zebra_close so that a NULL pointer is ignored.
89  *
90  * Revision 1.14  1999/02/02 14:51:11  adam
91  * Updated WIN32 code specific sections. Changed header.
92  *
93  * Revision 1.13  1998/12/16 12:23:30  adam
94  * Added facility for database name mapping using resource mapdb.
95  *
96  * Revision 1.12  1998/11/16 10:18:10  adam
97  * Better error reporting for result sets.
98  *
99  * Revision 1.11  1998/10/16 08:14:34  adam
100  * Updated record control system.
101  *
102  * Revision 1.10  1998/09/22 10:03:42  adam
103  * Changed result sets to be persistent in the sense that they can
104  * be re-searched if needed.
105  * Fixed memory leak in rsm_or.
106  *
107  * Revision 1.9  1998/09/02 13:53:17  adam
108  * Extra parameter decode added to search routines to implement
109  * persistent queries.
110  *
111  * Revision 1.8  1998/08/24 17:29:23  adam
112  * Minor changes.
113  *
114  * Revision 1.7  1998/06/24 12:16:13  adam
115  * Support for relations on text operands. Open range support in
116  * DFA module (i.e. [-j], [g-]).
117  *
118  * Revision 1.6  1998/06/22 11:36:47  adam
119  * Added authentication check facility to zebra.
120  *
121  * Revision 1.5  1998/06/13 00:14:08  adam
122  * Minor changes.
123  *
124  * Revision 1.4  1998/06/12 12:22:12  adam
125  * Work on Zebra API.
126  *
127  * Revision 1.3  1998/05/27 16:57:44  adam
128  * Zebra returns surrogate diagnostic for single records when
129  * appropriate.
130  *
131  * Revision 1.2  1998/05/20 10:12:19  adam
132  * Implemented automatic EXPLAIN database maintenance.
133  * Modified Zebra to work with ASN.1 compiled version of YAZ.
134  *
135  * Revision 1.1  1998/03/05 08:45:13  adam
136  * New result set model and modular ranking system. Moved towards
137  * descent server API. System information stored as "SGML" records.
138  *
139  */
140
141 #include <assert.h>
142 #include <stdio.h>
143 #ifdef WIN32
144 #include <io.h>
145 #include <process.h>
146 #include <direct.h>
147 #else
148 #include <unistd.h>
149 #endif
150
151 #include <yaz/diagbib1.h>
152 #include "zserver.h"
153 #include <charmap.h>
154
155 static void zebra_chdir (ZebraService zh)
156 {
157     const char *dir = res_get (zh->res, "chdir");
158     if (!dir)
159         return;
160     logf (LOG_DEBUG, "chdir %s", dir);
161 #ifdef WIN32
162     _chdir(dir);
163 #else
164     chdir (dir);
165 #endif
166 }
167
168 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
169                                const char *buf, size_t buf_size,
170                                const char *databaseName, int delete_flag,
171                                int test_mode, int *sysno,
172                                int store_keys, int store_data,
173                                const char *match_criteria);
174
175 static int explain_extract (void *handle, Record rec, data1_node *n);
176 static void extract_index (ZebraHandle zh);
177
178 static void zebra_register_unlock (ZebraHandle zh);
179
180 static int zebra_register_activate (ZebraService zh, int rw);
181 static int zebra_register_deactivate (ZebraService zh);
182
183 static int zebra_register_lock (ZebraHandle zh, int rw)
184 {
185     time_t lastChange;
186     int state;
187     zh->errCode = 0;
188     zh->errString = 0;
189     if (!zh->service->active)
190     {
191         zh->errCode = 1019;
192         return 1;
193     }
194     
195 #if HAVE_SYS_TIMES_H
196     times (&zh->tms1);
197 #endif
198
199     zebra_mutex_cond_lock (&zh->service->session_lock);
200
201     state = zebra_server_lock_get_state(zh->service, &lastChange);
202
203     zebra_server_lock (zh->service, state);
204
205     switch (state)
206     {
207     case 'c':
208         state = 1;
209         break;
210     default:
211         state = 0;
212     }
213     if (rw)
214         logf (LOG_LOG, "Register in read/write mode");
215     else if (zh->service->registerState == state)
216     {
217         if (zh->service->registerChange >= lastChange)
218             return 0;
219         logf (LOG_LOG, "Register completely updated since last access");
220     }
221     else if (zh->service->registerState == -1)
222         logf (LOG_LOG, "Reading register using state %d pid=%ld", state,
223               (long) getpid());
224     else
225         logf (LOG_LOG, "Register has changed state from %d to %d",
226               zh->service->registerState, state);
227     zh->service->registerChange = lastChange;
228
229     zebra_register_deactivate (zh->service);
230
231     zh->service->registerState = state;
232
233     zebra_register_activate (zh->service, rw);
234     return 0;
235 }
236
237
238 static void zebra_register_unlock (ZebraHandle zh)
239 {
240     if (zh->service->registerState != -1)
241         zebra_server_unlock (zh->service, zh->service->registerState);
242     zebra_mutex_cond_unlock (&zh->service->session_lock);
243 #if HAVE_SYS_TIMES_H
244     times (&zh->tms2);
245     logf (LOG_LOG, "user/system: %ld/%ld",
246                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
247                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
248
249 #endif
250 }
251
252 ZebraHandle zebra_open (ZebraService zs)
253 {
254     ZebraHandle zh;
255
256     assert (zs);
257     if (zs->stop_flag)
258         return 0;
259
260     zh = (ZebraHandle) xmalloc (sizeof(*zh));
261     yaz_log (LOG_LOG, "zebra_open zs=%p returns %p", zs, zh);
262
263     zh->service = zs;
264     zh->sets = 0;
265     zh->destroyed = 0;
266     zh->errCode = 0;
267     zh->errString = 0;
268
269     zh->key_buf = 0;
270     zh->admin_databaseName = 0;
271     
272     zebra_mutex_cond_lock (&zs->session_lock);
273
274     zh->next = zs->sessions;
275     zs->sessions = zh;
276
277     zebra_mutex_cond_unlock (&zs->session_lock);
278
279     return zh;
280 }
281
282
283 ZebraService zebra_start (const char *configName)
284 {
285     ZebraService zh = xmalloc (sizeof(*zh));
286
287     yaz_log (LOG_LOG, "zebra_start %s", configName);
288
289     zh->configName = xstrdup(configName);
290     zh->sessions = 0;
291     zh->stop_flag = 0;
292     zh->active = 1;
293
294     zh->registerState = -1;
295     zh->registerChange = 0;
296
297     if (!(zh->res = res_open (zh->configName)))
298     {
299         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
300         return zh;
301     }
302     zebra_chdir (zh);
303     zebra_server_lock_init (zh);
304     zebra_mutex_cond_init (&zh->session_lock);
305     if (!res_get (zh->res, "passwd"))
306         zh->passwd_db = NULL;
307     else
308     {
309         zh->passwd_db = passwd_db_open ();
310         if (!zh->passwd_db)
311             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
312         else
313             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
314     }
315
316     return zh;
317 }
318
319 static int zebra_register_activate (ZebraService zh, int rw)
320 {
321     if (zh->active > 1)
322     {
323         yaz_log (LOG_LOG, "zebra_register_activate (ignored since active=%d)",
324                  zh->active);
325         return 0;
326     }
327     yaz_log (LOG_LOG, "zebra_register_activate shadow=%s",
328              zh->registerState ? "yes" : "no");
329
330     zh->dh = data1_create ();
331     if (!zh->dh)
332         return -1;
333     zh->bfs = bfs_create (res_get (zh->res, "register"));
334     if (!zh->bfs)
335     {
336         data1_destroy(zh->dh);
337         return -1;
338     }
339     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
340     bf_cache (zh->bfs, zh->registerState ? res_get (zh->res, "shadow") : NULL);
341     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
342     zh->recTypes = recTypes_init (zh->dh);
343     recTypes_default_handlers (zh->recTypes);
344
345     zh->records = NULL;
346     zh->zebra_maps = zebra_maps_open (zh->res);
347     zh->rank_classes = NULL;
348
349     zh->records = 0;
350     zh->dict = 0;
351     zh->sortIdx = 0;
352     zh->isams = 0;
353 #if ZMBOL
354     zh->isam = 0;
355     zh->isamc = 0;
356     zh->isamd = 0;
357 #endif
358     zh->zei = 0;
359     
360     zebraRankInstall (zh, rank1_class);
361
362     if (!(zh->records = rec_open (zh->bfs, rw, 0)))
363     {
364         logf (LOG_WARN, "rec_open");
365         return -1;
366     }
367     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, rw, 0)))
368     {
369         logf (LOG_WARN, "dict_open");
370         return -1;
371     }
372     if (!(zh->sortIdx = sortIdx_open (zh->bfs, rw)))
373     {
374         logf (LOG_WARN, "sortIdx_open");
375         return -1;
376     }
377     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
378     {
379         struct ISAMS_M_s isams_m;
380         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, rw,
381                                       key_isams_m(zh->res, &isams_m))))
382         {
383             logf (LOG_WARN, "isams_open");
384             return -1;
385         }
386     }
387 #if ZMBOL
388     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
389     {
390         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, rw,
391                                   sizeof (struct it_key), zh->res)))
392         {
393             logf (LOG_WARN, "is_open");
394             return -1;
395         }
396     }
397     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
398     {
399         struct ISAMC_M_s isamc_m;
400         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
401                                     rw, key_isamc_m(zh->res, &isamc_m))))
402         {
403             logf (LOG_WARN, "isc_open");
404             return -1;
405         }
406     }
407     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
408     {
409         struct ISAMD_M_s isamd_m;
410         
411         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
412                                       rw, key_isamd_m(zh->res, &isamd_m))))
413         {
414             logf (LOG_WARN, "isamd_open");
415             return -1;
416         }
417     }
418 #endif
419     zh->zei = zebraExplain_open (zh->records, zh->dh,
420                                  zh->res, rw, 0 /* rGroup */,
421                                  explain_extract);
422     if (!zh->zei)
423     {
424         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
425         return -1;
426     }
427     zh->active = 2;
428     yaz_log (LOG_LOG, "zebra_register_activate ok");
429     return 0;
430 }
431
432 void zebra_admin_shutdown (ZebraHandle zh)
433 {
434     zebra_mutex_cond_lock (&zh->service->session_lock);
435     zh->service->stop_flag = 1;
436     if (!zh->service->sessions)
437         zebra_register_deactivate(zh->service);
438     zh->service->active = 0;
439     zebra_mutex_cond_unlock (&zh->service->session_lock);
440 }
441
442 void zebra_admin_start (ZebraHandle zh)
443 {
444     ZebraService zs = zh->service;
445     zh->errCode = 0;
446     zebra_mutex_cond_lock (&zs->session_lock);
447     if (!zs->stop_flag)
448         zh->service->active = 1;
449     zebra_mutex_cond_unlock (&zs->session_lock);
450 }
451
452 static int zebra_register_deactivate (ZebraService zs)
453 {
454     zs->stop_flag = 0;
455     if (zs->active <= 1)
456     {
457         yaz_log(LOG_LOG, "zebra_register_deactivate (ignored since active=%d)",
458                 zs->active);
459         return 0;
460     }
461     yaz_log(LOG_LOG, "zebra_register_deactivate");
462     zebra_chdir (zs);
463     if (zs->records)
464     {
465         zebraExplain_close (zs->zei, 0);
466         dict_close (zs->dict);
467         sortIdx_close (zs->sortIdx);
468         if (zs->isams)
469             isams_close (zs->isams);
470 #if ZMBOL
471         if (zs->isam)
472             is_close (zs->isam);
473         if (zs->isamc)
474             isc_close (zs->isamc);
475         if (zs->isamd)
476             isamd_close (zs->isamd);
477 #endif
478         rec_close (&zs->records);
479     }
480     recTypes_destroy (zs->recTypes);
481     zebra_maps_close (zs->zebra_maps);
482     zebraRankDestroy (zs);
483     bfs_destroy (zs->bfs);
484     data1_destroy (zs->dh);
485
486     if (zs->passwd_db)
487         passwd_db_close (zs->passwd_db);
488     zs->active = 1;
489     return 0;
490 }
491
492 void zebra_stop(ZebraService zs)
493 {
494     if (!zs)
495         return ;
496     yaz_log (LOG_LOG, "zebra_stop");
497
498     assert (!zs->sessions);
499
500     zebra_mutex_cond_destroy (&zs->session_lock);
501
502     zebra_register_deactivate(zs);
503     res_close (zs->res);
504     xfree (zs->configName);
505     xfree (zs);
506 }
507
508 void zebra_close (ZebraHandle zh)
509 {
510     ZebraService zs = zh->service;
511     struct zebra_session **sp;
512
513     yaz_log (LOG_LOG, "zebra_close zh=%p", zh);
514     if (!zh)
515         return ;
516     resultSetDestroy (zh, -1, 0, 0);
517
518     if (zh->key_buf)
519     {
520         xfree (zh->key_buf);
521         zh->key_buf = 0;
522     }
523     xfree (zh->admin_databaseName);
524     zebra_mutex_cond_lock (&zs->session_lock);
525     sp = &zs->sessions;
526     while (1)
527     {
528         assert (*sp);
529         if (*sp == zh)
530         {
531             *sp = (*sp)->next;
532             break;
533         }
534         sp = &(*sp)->next;
535     }
536     if (!zs->sessions && zs->stop_flag)
537         zebra_register_deactivate(zs);
538     zebra_mutex_cond_unlock (&zs->session_lock);
539     xfree (zh);
540 }
541
542 struct map_baseinfo {
543     ZebraHandle zh;
544     NMEM mem;
545     int num_bases;
546     char **basenames;
547     int new_num_bases;
548     char **new_basenames;
549     int new_num_max;
550 };
551         
552 void map_basenames_func (void *vp, const char *name, const char *value)
553 {
554     struct map_baseinfo *p = (struct map_baseinfo *) vp;
555     int i, no;
556     char fromdb[128], todb[8][128];
557     
558     no =
559         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
560                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
561                 todb[5], todb[6], todb[7]);
562     if (no < 2)
563         return ;
564     no--;
565     for (i = 0; i<p->num_bases; i++)
566         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
567         {
568             p->basenames[i] = 0;
569             for (i = 0; i < no; i++)
570             {
571                 if (p->new_num_bases == p->new_num_max)
572                     return;
573                 p->new_basenames[(p->new_num_bases)++] = 
574                     nmem_strdup (p->mem, todb[i]);
575             }
576             return;
577         }
578 }
579
580 void map_basenames (ZebraHandle zh, ODR stream,
581                     int *num_bases, char ***basenames)
582 {
583     struct map_baseinfo info;
584     struct map_baseinfo *p = &info;
585     int i;
586
587     info.zh = zh;
588     info.num_bases = *num_bases;
589     info.basenames = *basenames;
590     info.new_num_max = 128;
591     info.new_num_bases = 0;
592     info.new_basenames = (char **)
593         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
594     info.mem = stream->mem;
595
596     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
597     
598     for (i = 0; i<p->num_bases; i++)
599         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
600         {
601             p->new_basenames[(p->new_num_bases)++] = 
602                 nmem_strdup (p->mem, p->basenames[i]);
603         }
604     *num_bases = info.new_num_bases;
605     *basenames = info.new_basenames;
606     for (i = 0; i<*num_bases; i++)
607         logf (LOG_LOG, "base %s", (*basenames)[i]);
608 }
609
610 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
611                        Z_RPNQuery *query, int num_bases, char **basenames, 
612                        const char *setname)
613 {
614     zh->hits = 0;
615     if (zebra_register_lock (zh, 0))
616         return;
617     map_basenames (zh, stream, &num_bases, &basenames);
618     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
619
620     zebra_register_unlock (zh);
621
622     logf(LOG_APP,"SEARCH:%d:",zh->hits);
623 }
624
625 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
626                              const char *setname, Z_RecordComposition *comp,
627                              oid_value input_format, int num_recs,
628                              ZebraRetrievalRecord *recs)
629 {
630     ZebraPosSet poset;
631     int i, *pos_array;
632
633     if (zebra_register_lock (zh, 0))
634         return;
635     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
636     for (i = 0; i<num_recs; i++)
637         pos_array[i] = recs[i].position;
638     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
639     if (!poset)
640     {
641         logf (LOG_DEBUG, "zebraPosSetCreate error");
642         zh->errCode = 30;
643         zh->errString = nmem_strdup (stream->mem, setname);
644     }
645     else
646     {
647         for (i = 0; i<num_recs; i++)
648         {
649             if (!poset[i].sysno)
650             {
651                 char num_str[20];
652
653                 sprintf (num_str, "%d", pos_array[i]);  
654                 zh->errCode = 13;
655                 zh->errString = nmem_strdup (stream->mem, num_str);
656                 break;
657             }
658             else
659             {
660                 recs[i].errCode =
661                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
662                                         stream, input_format, comp,
663                                         &recs[i].format, &recs[i].buf,
664                                         &recs[i].len,
665                                         &recs[i].base);
666                 recs[i].errString = NULL;
667             }
668         }
669         zebraPosSetDestroy (zh, poset, num_recs);
670     }
671     zebra_register_unlock (zh);
672     xfree (pos_array);
673 }
674
675 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
676                  oid_value attributeset,
677                  int num_bases, char **basenames,
678                  int *position, int *num_entries, ZebraScanEntry **entries,
679                  int *is_partial)
680 {
681     if (zebra_register_lock (zh, 0))
682     {
683         *entries = 0;
684         *num_entries = 0;
685         return;
686     }
687     map_basenames (zh, stream, &num_bases, &basenames);
688     rpn_scan (zh, stream, zapt, attributeset,
689               num_bases, basenames, position,
690               num_entries, entries, is_partial);
691     zebra_register_unlock (zh);
692 }
693
694 void zebra_sort (ZebraHandle zh, ODR stream,
695                  int num_input_setnames, const char **input_setnames,
696                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
697                  int *sort_status)
698 {
699     if (zebra_register_lock (zh, 0))
700         return;
701     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
702                    output_setname, sort_sequence, sort_status);
703     zebra_register_unlock (zh);
704 }
705
706 int zebra_deleleResultSet(ZebraHandle zh, int function,
707                           int num_setnames, char **setnames,
708                           int *statuses)
709 {
710     int i, status;
711     if (zebra_register_lock (zh, 0))
712         return Z_DeleteStatus_systemProblemAtTarget;
713     switch (function)
714     {
715     case Z_DeleteRequest_list:
716         resultSetDestroy (zh, num_setnames, setnames, statuses);
717         break;
718     case Z_DeleteRequest_all:
719         resultSetDestroy (zh, -1, 0, statuses);
720         break;
721     }
722     zebra_register_unlock (zh);
723     status = Z_DeleteStatus_success;
724     for (i = 0; i<num_setnames; i++)
725         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
726             status = statuses[i];
727     return status;
728 }
729
730 int zebra_errCode (ZebraHandle zh)
731 {
732     return zh->errCode;
733 }
734
735 const char *zebra_errString (ZebraHandle zh)
736 {
737     return diagbib1_str (zh->errCode);
738 }
739
740 char *zebra_errAdd (ZebraHandle zh)
741 {
742     return zh->errString;
743 }
744
745 int zebra_hits (ZebraHandle zh)
746 {
747     return zh->hits;
748 }
749
750 int zebra_auth (ZebraService zh, const char *user, const char *pass)
751 {
752     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
753     {
754         logf(LOG_APP,"AUTHOK:%s", user?user:"ANONYMOUS");
755         return 0;
756     }
757
758     logf(LOG_APP,"AUTHFAIL:%s", user?user:"ANONYMOUS");
759     return 1;
760 }
761
762 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
763 {
764     if (zebra_register_lock (zh, 1))
765         return;
766     xfree (zh->admin_databaseName);
767     zh->admin_databaseName = xstrdup(database);
768 }
769
770 void zebra_admin_import_end (ZebraHandle zh)
771 {
772     zebraExplain_flush (zh->service->zei, 1, zh);
773     extract_index (zh);
774     zebra_register_unlock (zh);
775 }
776
777 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
778 {
779     int sysno;
780     int i;
781     if (zh->service->active < 2)
782         return;
783     for (i = 0; i<segment->num_segmentRecords; i++)
784     {
785         Z_NamePlusRecord *npr = segment->segmentRecords[i];
786         const char *databaseName = npr->databaseName;
787
788         if (!databaseName)
789             databaseName = zh->admin_databaseName;
790         printf ("--------------%d--------------------\n", i);
791         if (npr->which == Z_NamePlusRecord_intermediateFragment)
792         {
793             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
794             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
795             {
796                 Odr_oct *oct = fragment->u.notExternallyTagged;
797                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
798                         oct->buf);
799                 
800                 sysno = 0;
801                 extract_rec_in_mem (zh, "grs.sgml",
802                                     oct->buf, oct->len,
803                                     databaseName,
804                                     0 /* delete_flag */,
805                                     0 /* test_mode */,
806                                     &sysno /* sysno */,
807                                     1 /* store_keys */,
808                                     1 /* store_data */,
809                                     0 /* match criteria */);
810             }
811         }
812     }
813 }
814
815 void zebra_admin_create (ZebraHandle zh, const char *database)
816 {
817     ZebraService zs = zh->service;
818     if (zebra_register_lock(zh, 1))
819     {
820         zh->errCode = 1019;
821         return;
822     }
823     /* announce database */
824     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
825     {
826         zh->errCode = 224;
827         zh->errString = "Database already exist";
828     }
829     zebraExplain_flush (zh->service->zei, 1, zh);
830     extract_index (zh);
831     zebra_register_unlock(zh);
832 }
833
834 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
835                        const char *input_str, int input_len,
836                        char *output_str, int output_len)
837 {
838     WRBUF wrbuf;
839     if (!zh->service->zebra_maps)
840         return -1;
841     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
842                           input_str, input_len);
843     if (!wrbuf)
844         return -2;
845     if (wrbuf_len(wrbuf) >= output_len)
846         return -3;
847     if (wrbuf_len(wrbuf))
848         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
849     output_str[wrbuf_len(wrbuf)] = '\0';
850     return wrbuf_len(wrbuf);
851 }
852
853 static void extract_init (struct recExtractCtrl *p, RecWord *w)
854 {
855     w->zebra_maps = p->zebra_maps;
856     w->seqnos = p->seqno;
857     w->attrSet = VAL_BIB1;
858     w->attrUse = 1016;
859     w->reg_type = 'w';
860     w->extractCtrl = p;
861 }
862
863 static void extract_add_index_string (RecWord *p, const char *string,
864                                       int length)
865 {
866     char *dst;
867     unsigned char attrSet;
868     unsigned short attrUse;
869     int lead = 0;
870     int diff = 0;
871     int *pseqno = &p->seqnos[p->reg_type];
872     ZebraHandle zh = p->extractCtrl->handle;
873     struct recKeys *keys = &zh->keys;
874
875     if (keys->buf_used+1024 > keys->buf_max)
876     {
877         char *b;
878
879         b = (char *) xmalloc (keys->buf_max += 128000);
880         if (keys->buf_used > 0)
881             memcpy (b, keys->buf, keys->buf_used);
882         xfree (keys->buf);
883         keys->buf = b;
884     }
885     dst = keys->buf + keys->buf_used;
886
887     attrSet = p->attrSet;
888     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
889         lead |= 1;
890     else
891         keys->prevAttrSet = attrSet;
892     attrUse = p->attrUse;
893     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
894         lead |= 2;
895     else
896         keys->prevAttrUse = attrUse;
897 #if 1
898     diff = 1 + *pseqno - keys->prevSeqNo;
899     if (diff >= 1 && diff <= 15)
900         lead |= (diff << 2);
901     else
902         diff = 0;
903 #endif
904     keys->prevSeqNo = *pseqno;
905     
906     *dst++ = lead;
907
908     if (!(lead & 1))
909     {
910         memcpy (dst, &attrSet, sizeof(attrSet));
911         dst += sizeof(attrSet);
912     }
913     if (!(lead & 2))
914     {
915         memcpy (dst, &attrUse, sizeof(attrUse));
916         dst += sizeof(attrUse);
917     }
918     *dst++ = p->reg_type;
919     memcpy (dst, string, length);
920     dst += length;
921     *dst++ = '\0';
922
923     if (!diff)
924     {
925         memcpy (dst, pseqno, sizeof(*pseqno));
926         dst += sizeof(*pseqno);
927     }
928     keys->buf_used = dst - keys->buf;
929     if (*pseqno)
930         (*pseqno)++;
931 }
932
933 static void extract_add_sort_string (RecWord *p, const char *string,
934                                      int length)
935 {
936     struct sortKey *sk;
937     ZebraHandle zh = p->extractCtrl->handle;
938     struct sortKey *sortKeys = zh->sortKeys;
939
940     for (sk = sortKeys; sk; sk = sk->next)
941         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
942             return;
943
944     sk = (struct sortKey *) xmalloc (sizeof(*sk));
945     sk->next = sortKeys;
946     sortKeys = sk;
947
948     sk->string = (char *) xmalloc (length);
949     sk->length = length;
950     memcpy (sk->string, string, length);
951
952     sk->attrSet = p->attrSet;
953     sk->attrUse = p->attrUse;
954 }
955
956 static void extract_add_string (RecWord *p, const char *string, int length)
957 {
958     assert (length > 0);
959     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
960         extract_add_sort_string (p, string, length);
961     else
962         extract_add_index_string (p, string, length);
963 }
964
965 static void extract_add_incomplete_field (RecWord *p)
966 {
967     const char *b = p->string;
968     int remain = p->length;
969     const char **map = 0;
970
971     if (remain > 0)
972         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
973
974     while (map)
975     {
976         char buf[IT_MAX_WORD+1];
977         int i, remain;
978
979         /* Skip spaces */
980         while (map && *map && **map == *CHR_SPACE)
981         {
982             remain = p->length - (b - p->string);
983             if (remain > 0)
984                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
985             else
986                 map = 0;
987         }
988         if (!map)
989             break;
990         i = 0;
991         while (map && *map && **map != *CHR_SPACE)
992         {
993             const char *cp = *map;
994
995             while (i < IT_MAX_WORD && *cp)
996                 buf[i++] = *(cp++);
997             remain = p->length - (b - p->string);
998             if (remain > 0)
999                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1000             else
1001                 map = 0;
1002         }
1003         if (!i)
1004             return;
1005         extract_add_string (p, buf, i);
1006     }
1007     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
1008 }
1009
1010 static void extract_add_complete_field (RecWord *p)
1011 {
1012     const char *b = p->string;
1013     char buf[IT_MAX_WORD+1];
1014     const char **map = 0;
1015     int i = 0, remain = p->length;
1016
1017     if (remain > 0)
1018         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
1019
1020     while (remain > 0 && i < IT_MAX_WORD)
1021     {
1022         while (map && *map && **map == *CHR_SPACE)
1023         {
1024             remain = p->length - (b - p->string);
1025             if (remain > 0)
1026                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1027             else
1028                 map = 0;
1029         }
1030         if (!map)
1031             break;
1032
1033         if (i && i < IT_MAX_WORD)
1034             buf[i++] = *CHR_SPACE;
1035         while (map && *map && **map != *CHR_SPACE)
1036         {
1037             const char *cp = *map;
1038
1039             if (i >= IT_MAX_WORD)
1040                 break;
1041             while (i < IT_MAX_WORD && *cp)
1042                 buf[i++] = *(cp++);
1043             remain = p->length  - (b - p->string);
1044             if (remain > 0)
1045                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
1046                                         remain);
1047             else
1048                 map = 0;
1049         }
1050     }
1051     if (!i)
1052         return;
1053     extract_add_string (p, buf, i);
1054 }
1055
1056 static void extract_token_add (RecWord *p)
1057 {
1058     WRBUF wrbuf;
1059     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
1060                                p->string, p->length)))
1061     {
1062         p->string = wrbuf_buf(wrbuf);
1063         p->length = wrbuf_len(wrbuf);
1064     }
1065     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
1066         extract_add_complete_field (p);
1067     else
1068         extract_add_incomplete_field(p);
1069 }
1070
1071 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
1072 {
1073     ZebraHandle zh = (ZebraHandle) (p->handle);
1074     zebraExplain_addSchema (zh->service->zei, oid);
1075 }
1076
1077 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
1078                                    int cmd, struct sortKey **skp)
1079 {
1080     struct sortKey *sk = *skp;
1081     SortIdx sortIdx = zh->service->sortIdx;
1082
1083     sortIdx_sysno (sortIdx, sysno);
1084     while (sk)
1085     {
1086         struct sortKey *sk_next = sk->next;
1087         sortIdx_type (sortIdx, sk->attrUse);
1088         sortIdx_add (sortIdx, sk->string, sk->length);
1089         xfree (sk->string);
1090         xfree (sk);
1091         sk = sk_next;
1092     }
1093     *skp = 0;
1094 }
1095
1096 struct encode_info {
1097     int  sysno;
1098     int  seqno;
1099     int  cmd;
1100     char buf[768];
1101 };
1102
1103 void encode_key_init (struct encode_info *i)
1104 {
1105     i->sysno = 0;
1106     i->seqno = 0;
1107     i->cmd = -1;
1108 }
1109
1110 char *encode_key_int (int d, char *bp)
1111 {
1112     if (d <= 63)
1113         *bp++ = d;
1114     else if (d <= 16383)
1115     {
1116         *bp++ = 64 + (d>>8);
1117         *bp++ = d  & 255;
1118     }
1119     else if (d <= 4194303)
1120     {
1121         *bp++ = 128 + (d>>16);
1122         *bp++ = (d>>8) & 255;
1123         *bp++ = d & 255;
1124     }
1125     else
1126     {
1127         *bp++ = 192 + (d>>24);
1128         *bp++ = (d>>16) & 255;
1129         *bp++ = (d>>8) & 255;
1130         *bp++ = d & 255;
1131     }
1132     return bp;
1133 }
1134
1135 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1136 {
1137     struct it_key key;
1138     char *bp = i->buf;
1139
1140     while ((*bp++ = *k++))
1141         ;
1142     memcpy (&key, k+1, sizeof(struct it_key));
1143     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1144     if (i->sysno != key.sysno)
1145     {
1146         i->sysno = key.sysno;
1147         i->seqno = 0;
1148     }
1149     else if (!i->seqno && !key.seqno && i->cmd == *k)
1150         return;
1151     bp = encode_key_int (key.seqno - i->seqno, bp);
1152     i->seqno = key.seqno;
1153     i->cmd = *k;
1154     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1155     {
1156         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1157         exit (1);
1158     }
1159 }
1160
1161 static void extract_flushWriteKeys (ZebraHandle zh)
1162 {
1163     FILE *outf;
1164     char out_fname[200];
1165     char *prevcp, *cp;
1166     struct encode_info encode_info;
1167     int ptr_i = zh->ptr_i;
1168 #if SORT_EXTRA
1169     int i;
1170 #endif
1171     if (!zh->key_buf || ptr_i <= 0)
1172         return;
1173
1174     (zh->key_file_no)++;
1175     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1176 #if !SORT_EXTRA
1177     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1178             key_qsort_compare);
1179     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1180
1181     if (!(outf = fopen (out_fname, "wb")))
1182     {
1183         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1184         exit (1);
1185     }
1186     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1187     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1188     
1189     encode_key_init (&encode_info);
1190     encode_key_write (cp, &encode_info, outf);
1191     
1192     while (--ptr_i > 0)
1193     {
1194         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1195         if (strcmp (cp, prevcp))
1196         {
1197             encode_key_init (&encode_info);
1198             encode_key_write (cp, &encode_info, outf);
1199             prevcp = cp;
1200         }
1201         else
1202             encode_key_write (cp + strlen(cp), &encode_info, outf);
1203     }
1204 #else
1205     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1206     extract_get_fname_tmp (out_fname, key_file_no);
1207
1208     if (!(outf = fopen (out_fname, "wb")))
1209     {
1210         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1211         exit (1);
1212     }
1213     logf (LOG_LOG, "writing section %d", key_file_no);
1214     i = ptr_i;
1215     prevcp =  key_buf[ptr_top-i];
1216     while (1)
1217         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1218         {
1219             key_y_len = strlen(prevcp)+1;
1220 #if 0
1221             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1222                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1223 #endif
1224             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1225                                    sizeof(char*), key_y_compare);
1226             cp = key_buf[ptr_top-ptr_i];
1227             --key_y_len;
1228             encode_key_init (&encode_info);
1229             encode_key_write (cp, &encode_info, outf);
1230             while (--ptr_i > i)
1231             {
1232                 cp = key_buf[ptr_top-ptr_i];
1233                 encode_key_write (cp+key_y_len, &encode_info, outf);
1234             }
1235             if (!i)
1236                 break;
1237             prevcp = key_buf[ptr_top-ptr_i];
1238         }
1239 #endif
1240     if (fclose (outf))
1241     {
1242         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1243         exit (1);
1244     }
1245     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1246     zh->ptr_i = 0;
1247     zh->key_buf_used = 0;
1248 }
1249
1250 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1251                                      int cmd, struct recKeys *reckeys)
1252 {
1253     unsigned char attrSet = (unsigned char) -1;
1254     unsigned short attrUse = (unsigned short) -1;
1255     int seqno = 0;
1256     int off = 0;
1257     ZebraExplainInfo zei = zh->service->zei;
1258
1259     if (!zh->key_buf)
1260     {
1261         int mem = 8*1024*1024;
1262         zh->key_buf = (char**) xmalloc (mem);
1263         zh->ptr_top = mem/sizeof(char*);
1264         zh->ptr_i = 0;
1265         zh->key_buf_used = 0;
1266         zh->key_file_no = 0;
1267     }
1268     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1269     while (off < reckeys->buf_used)
1270     {
1271         const char *src = reckeys->buf + off;
1272         struct it_key key;
1273         int lead, ch;
1274     
1275         lead = *src++;
1276
1277         if (!(lead & 1))
1278         {
1279             memcpy (&attrSet, src, sizeof(attrSet));
1280             src += sizeof(attrSet);
1281         }
1282         if (!(lead & 2))
1283         {
1284             memcpy (&attrUse, src, sizeof(attrUse));
1285             src += sizeof(attrUse);
1286         }
1287         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1288             extract_flushWriteKeys (zh);
1289         ++(zh->ptr_i);
1290         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1291             (char*)zh->key_buf + zh->key_buf_used;
1292
1293         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1294         if (ch < 0)
1295             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1296         assert (ch > 0);
1297         zh->key_buf_used +=
1298             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1299
1300         while (*src)
1301             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1302         src++;
1303         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1304         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1305
1306         if (lead & 60)
1307             seqno += ((lead>>2) & 15)-1;
1308         else
1309         {
1310             memcpy (&seqno, src, sizeof(seqno));
1311             src += sizeof(seqno);
1312         }
1313         key.seqno = seqno;
1314         key.sysno = sysno;
1315         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1316         (zh->key_buf_used) += sizeof(key);
1317         off = src - reckeys->buf;
1318     }
1319     assert (off == reckeys->buf_used);
1320 }
1321
1322 static void extract_index (ZebraHandle zh)
1323 {
1324     extract_flushWriteKeys (zh);
1325     zebra_index_merge (zh);
1326 }
1327
1328 static int explain_extract (void *handle, Record rec, data1_node *n)
1329 {
1330     ZebraHandle zh = (ZebraHandle) handle;
1331     struct recExtractCtrl extractCtrl;
1332     int i;
1333
1334     if (zebraExplain_curDatabase (zh->service->zei,
1335                                   rec->info[recInfo_databaseName]))
1336     {
1337         abort();
1338         if (zebraExplain_newDatabase (zh->service->zei,
1339                                       rec->info[recInfo_databaseName], 0))
1340             abort ();
1341     }
1342
1343     zh->keys.buf_used = 0;
1344     zh->keys.prevAttrUse = -1;
1345     zh->keys.prevAttrSet = -1;
1346     zh->keys.prevSeqNo = 0;
1347     zh->sortKeys = 0;
1348     
1349     extractCtrl.init = extract_init;
1350     extractCtrl.tokenAdd = extract_token_add;
1351     extractCtrl.schemaAdd = extract_schema_add;
1352     extractCtrl.dh = zh->service->dh;
1353     for (i = 0; i<256; i++)
1354         extractCtrl.seqno[i] = 0;
1355     extractCtrl.zebra_maps = zh->service->zebra_maps;
1356     extractCtrl.flagShowRecords = 0;
1357     extractCtrl.handle = handle;
1358     
1359     grs_extract_tree(&extractCtrl, n);
1360
1361     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1362
1363     if (rec->size[recInfo_delKeys])
1364     {
1365         struct recKeys delkeys;
1366         struct sortKey *sortKeys = 0;
1367
1368         delkeys.buf_used = rec->size[recInfo_delKeys];
1369         delkeys.buf = rec->info[recInfo_delKeys];
1370         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1371         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1372     }
1373     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1374     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1375
1376     xfree (rec->info[recInfo_delKeys]);
1377     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1378     rec->info[recInfo_delKeys] = zh->keys.buf;
1379     zh->keys.buf = NULL;
1380     zh->keys.buf_max = 0;
1381     return 0;
1382 }
1383
1384 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1385                                const char *buf, size_t buf_size,
1386                                const char *databaseName, int delete_flag,
1387                                int test_mode, int *sysno,
1388                                int store_keys, int store_data,
1389                                const char *match_criteria)
1390 {
1391     RecordAttr *recordAttr;
1392     struct recExtractCtrl extractCtrl;
1393     int i, r;
1394     RecType recType;
1395     char subType[1024];
1396     void *clientData;
1397     const char *fname = "<no file>";
1398     Record rec;
1399     long recordOffset = 0;
1400     struct zebra_fetch_control fc;
1401
1402     fc.fd = -1;
1403     fc.record_int_buf = buf;
1404     fc.record_int_len = buf_size;
1405     fc.record_int_pos = 0;
1406     fc.offset_end = 0;
1407     fc.record_offset = 0;
1408
1409     extractCtrl.offset = 0;
1410     extractCtrl.readf = zebra_record_int_read;
1411     extractCtrl.seekf = zebra_record_int_seek;
1412     extractCtrl.tellf = zebra_record_int_tell;
1413     extractCtrl.endf = zebra_record_int_end;
1414     extractCtrl.fh = &fc;
1415
1416     /* announce database */
1417     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1418     {
1419         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1420             return 0;
1421     }
1422     if (!(recType =
1423           recType_byName (zh->service->recTypes, recordType, subType,
1424                           &clientData)))
1425     {
1426         logf (LOG_WARN, "No such record type: %s", recordType);
1427         return 0;
1428     }
1429
1430     zh->keys.buf_used = 0;
1431     zh->keys.prevAttrUse = -1;
1432     zh->keys.prevAttrSet = -1;
1433     zh->keys.prevSeqNo = 0;
1434     zh->sortKeys = 0;
1435
1436     extractCtrl.subType = subType;
1437     extractCtrl.init = extract_init;
1438     extractCtrl.tokenAdd = extract_token_add;
1439     extractCtrl.schemaAdd = extract_schema_add;
1440     extractCtrl.dh = zh->service->dh;
1441     extractCtrl.handle = zh;
1442     extractCtrl.zebra_maps = zh->service->zebra_maps;
1443     extractCtrl.flagShowRecords = 0;
1444     for (i = 0; i<256; i++)
1445     {
1446         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1447             extractCtrl.seqno[i] = 1;
1448         else
1449             extractCtrl.seqno[i] = 0;
1450     }
1451
1452     r = (*recType->extract)(clientData, &extractCtrl);
1453
1454     if (r == RECCTRL_EXTRACT_EOF)
1455         return 0;
1456     else if (r == RECCTRL_EXTRACT_ERROR)
1457     {
1458         /* error occured during extraction ... */
1459 #if 1
1460         yaz_log (LOG_WARN, "extract error");
1461 #else
1462         if (rGroup->flagRw &&
1463             records_processed < rGroup->fileVerboseLimit)
1464         {
1465             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1466                   fname, (long) recordOffset);
1467         }
1468 #endif
1469         return 0;
1470     }
1471     if (zh->keys.buf_used == 0)
1472     {
1473         /* the extraction process returned no information - the record
1474            is probably empty - unless flagShowRecords is in use */
1475         if (test_mode)
1476             return 1;
1477         logf (LOG_WARN, "No keys generated for record");
1478         logf (LOG_WARN, " The file is probably empty");
1479         return 1;
1480     }
1481     /* match criteria */
1482
1483     if (! *sysno)
1484     {
1485         /* new record */
1486         if (delete_flag)
1487         {
1488             logf (LOG_LOG, "delete %s %s %ld", recordType,
1489                   fname, (long) recordOffset);
1490             logf (LOG_WARN, "cannot delete record above (seems new)");
1491             return 1;
1492         }
1493         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1494               (long) recordOffset);
1495         rec = rec_new (zh->service->records);
1496
1497         *sysno = rec->sysno;
1498
1499         recordAttr = rec_init_attr (zh->service->zei, rec);
1500
1501 #if 0
1502         if (matchStr)
1503         {
1504             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1505         }
1506 #endif
1507         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1508         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1509     }
1510     else
1511     {
1512         /* record already exists */
1513         struct recKeys delkeys;
1514
1515         rec = rec_get (zh->service->records, *sysno);
1516         assert (rec);
1517         
1518         recordAttr = rec_init_attr (zh->service->zei, rec);
1519
1520         if (recordAttr->runNumber ==
1521             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1522         {
1523             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1524                   fname, (long) recordOffset);
1525             rec_rm (&rec);
1526             return 1;
1527         }
1528         delkeys.buf_used = rec->size[recInfo_delKeys];
1529         delkeys.buf = rec->info[recInfo_delKeys];
1530         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1531         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1532         if (delete_flag)
1533         {
1534             /* record going to be deleted */
1535             if (!delkeys.buf_used)
1536             {
1537                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1538                       fname, (long) recordOffset);
1539                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1540             }
1541             else
1542             {
1543                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1544                       fname, (long) recordOffset);
1545 #if 0
1546                 if (matchStr)
1547                     dict_delete (matchDict, matchStr);
1548 #endif
1549                 rec_del (zh->service->records, &rec);
1550             }
1551             rec_rm (&rec);
1552             return 1;
1553         }
1554         else
1555         {
1556             /* record going to be updated */
1557             if (!delkeys.buf_used)
1558             {
1559                 logf (LOG_LOG, "update %s %s %ld", recordType,
1560                       fname, (long) recordOffset);
1561                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1562             }
1563             else
1564             {
1565                 logf (LOG_LOG, "update %s %s %ld", recordType,
1566                       fname, (long) recordOffset);
1567                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1568             }
1569         }
1570     }
1571     /* update file type */
1572     xfree (rec->info[recInfo_fileType]);
1573     rec->info[recInfo_fileType] =
1574         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1575
1576     /* update filename */
1577     xfree (rec->info[recInfo_filename]);
1578     rec->info[recInfo_filename] =
1579         rec_strdup (fname, &rec->size[recInfo_filename]);
1580
1581     /* update delete keys */
1582     xfree (rec->info[recInfo_delKeys]);
1583     if (zh->keys.buf_used > 0 && store_keys == 1)
1584     {
1585         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1586         rec->info[recInfo_delKeys] = zh->keys.buf;
1587         zh->keys.buf = NULL;
1588         zh->keys.buf_max = 0;
1589     }
1590     else
1591     {
1592         rec->info[recInfo_delKeys] = NULL;
1593         rec->size[recInfo_delKeys] = 0;
1594     }
1595
1596     /* save file size of original record */
1597     zebraExplain_recordBytesIncrement (zh->service->zei,
1598                                        - recordAttr->recordSize);
1599 #if 0
1600     recordAttr->recordSize = fi->file_moffset - recordOffset;
1601     if (!recordAttr->recordSize)
1602         recordAttr->recordSize = fi->file_max - recordOffset;
1603 #else
1604     recordAttr->recordSize = buf_size;
1605 #endif
1606     zebraExplain_recordBytesIncrement (zh->service->zei,
1607                                        recordAttr->recordSize);
1608
1609     /* set run-number for this record */
1610     recordAttr->runNumber =
1611         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1612
1613     /* update store data */
1614     xfree (rec->info[recInfo_storeData]);
1615     if (store_data == 1)
1616     {
1617         rec->size[recInfo_storeData] = recordAttr->recordSize;
1618         rec->info[recInfo_storeData] = (char *)
1619             xmalloc (recordAttr->recordSize);
1620 #if 1
1621         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1622 #else
1623         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1624         {
1625             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1626                   (long) recordOffset, fname);
1627             exit (1);
1628         }
1629         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1630             < recordAttr->recordSize)
1631         {
1632             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1633                   recordAttr->recordSize, fname);
1634             exit (1);
1635         }
1636 #endif
1637     }
1638     else
1639     {
1640         rec->info[recInfo_storeData] = NULL;
1641         rec->size[recInfo_storeData] = 0;
1642     }
1643     /* update database name */
1644     xfree (rec->info[recInfo_databaseName]);
1645     rec->info[recInfo_databaseName] =
1646         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1647
1648     /* update offset */
1649     recordAttr->recordOffset = recordOffset;
1650     
1651     /* commit this record */
1652     rec_put (zh->service->records, &rec);
1653
1654     return 0;
1655 }