Termlist source implemented (so that we can index values of XML/SGML
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.43  2000-12-05 12:22:53  adam
7  * Termlist source implemented (so that we can index values of XML/SGML
8  * attributes).
9  *
10  * Revision 1.42  2000/12/05 10:01:44  adam
11  * Fixed bug regarding user-defined attribute sets.
12  *
13  * Revision 1.41  2000/12/01 17:59:08  adam
14  * Fixed bug regarding online updates on WIN32.
15  * When zebra.cfg is not available the server will not abort.
16  *
17  * Revision 1.40  2000/11/29 15:21:31  adam
18  * Fixed problem with passwd db.
19  *
20  * Revision 1.39  2000/11/29 14:24:01  adam
21  * Script configure uses yaz pthreads options. Added locking for
22  * zebra_register_{lock,unlock}.
23  *
24  * Revision 1.38  2000/11/08 13:46:58  adam
25  * Fixed scan: server could break if bad attribute/database was selected.
26  * Work on remote update.
27  *
28  * Revision 1.37  2000/10/17 12:37:09  adam
29  * Fixed notification of live-updates. Fixed minor problem with mf_init
30  * where it didn't handle shadow area file names correctly.
31  *
32  * Revision 1.36  2000/09/06 08:59:36  adam
33  * Using read-only (for now) for server.
34  *
35  * Revision 1.35  2000/07/07 12:49:20  adam
36  * Optimized resultSetInsert{Rank,Sort}.
37  *
38  * Revision 1.34  2000/06/09 13:56:38  ian
39  * Added some logging on Authentication and searches.
40  *
41  * Revision 1.33  2000/05/18 12:01:36  adam
42  * System call times(2) used again. More 64-bit fixes.
43  *
44  * Revision 1.32  2000/04/19 14:35:59  adam
45  * WIN32 update (this version is known not to work on Windows).
46  *
47  * Revision 1.31  2000/04/05 10:07:02  adam
48  * Minor zebra compile fix.
49  *
50  * Revision 1.30  2000/04/05 09:49:35  adam
51  * On Unix, zebra/z'mbol uses automake.
52  *
53  * Revision 1.29  2000/03/20 19:08:36  adam
54  * Added remote record import using Z39.50 extended services and Segment
55  * Requests.
56  *
57  * Revision 1.28  2000/03/15 15:00:30  adam
58  * First work on threaded version.
59  *
60  * Revision 1.27  2000/02/24 12:31:17  adam
61  * Added zebra_string_norm.
62  *
63  * Revision 1.26  1999/11/30 13:48:03  adam
64  * Improved installation. Updated for inclusion of YAZ header files.
65  *
66  * Revision 1.25  1999/11/04 15:00:45  adam
67  * Implemented delete result set(s).
68  *
69  * Revision 1.24  1999/10/14 14:33:50  adam
70  * Added truncation 5=106.
71  *
72  * Revision 1.23  1999/09/07 11:36:32  adam
73  * Minor changes.
74  *
75  * Revision 1.22  1999/08/02 10:13:47  adam
76  * Fixed bug regarding zebra_hits.
77  *
78  * Revision 1.21  1999/07/14 10:59:26  adam
79  * Changed functions isc_getmethod, isams_getmethod.
80  * Improved fatal error handling (such as missing EXPLAIN schema).
81  *
82  * Revision 1.20  1999/07/06 12:28:04  adam
83  * Updated record index structure. Format includes version ID. Compression
84  * algorithm ID is stored for each record block.
85  *
86  * Revision 1.19  1999/05/26 07:49:13  adam
87  * C++ compilation.
88  *
89  * Revision 1.18  1999/05/15 14:36:38  adam
90  * Updated dictionary. Implemented "compression" of dictionary.
91  *
92  * Revision 1.17  1999/05/12 13:08:06  adam
93  * First version of ISAMS.
94  *
95  * Revision 1.16  1999/02/19 10:38:30  adam
96  * Implemented chdir-setting.
97  *
98  * Revision 1.15  1999/02/17 12:18:12  adam
99  * Fixed zebra_close so that a NULL pointer is ignored.
100  *
101  * Revision 1.14  1999/02/02 14:51:11  adam
102  * Updated WIN32 code specific sections. Changed header.
103  *
104  * Revision 1.13  1998/12/16 12:23:30  adam
105  * Added facility for database name mapping using resource mapdb.
106  *
107  * Revision 1.12  1998/11/16 10:18:10  adam
108  * Better error reporting for result sets.
109  *
110  * Revision 1.11  1998/10/16 08:14:34  adam
111  * Updated record control system.
112  *
113  * Revision 1.10  1998/09/22 10:03:42  adam
114  * Changed result sets to be persistent in the sense that they can
115  * be re-searched if needed.
116  * Fixed memory leak in rsm_or.
117  *
118  * Revision 1.9  1998/09/02 13:53:17  adam
119  * Extra parameter decode added to search routines to implement
120  * persistent queries.
121  *
122  * Revision 1.8  1998/08/24 17:29:23  adam
123  * Minor changes.
124  *
125  * Revision 1.7  1998/06/24 12:16:13  adam
126  * Support for relations on text operands. Open range support in
127  * DFA module (i.e. [-j], [g-]).
128  *
129  * Revision 1.6  1998/06/22 11:36:47  adam
130  * Added authentication check facility to zebra.
131  *
132  * Revision 1.5  1998/06/13 00:14:08  adam
133  * Minor changes.
134  *
135  * Revision 1.4  1998/06/12 12:22:12  adam
136  * Work on Zebra API.
137  *
138  * Revision 1.3  1998/05/27 16:57:44  adam
139  * Zebra returns surrogate diagnostic for single records when
140  * appropriate.
141  *
142  * Revision 1.2  1998/05/20 10:12:19  adam
143  * Implemented automatic EXPLAIN database maintenance.
144  * Modified Zebra to work with ASN.1 compiled version of YAZ.
145  *
146  * Revision 1.1  1998/03/05 08:45:13  adam
147  * New result set model and modular ranking system. Moved towards
148  * descent server API. System information stored as "SGML" records.
149  *
150  */
151
152 #include <assert.h>
153 #include <stdio.h>
154 #ifdef WIN32
155 #include <io.h>
156 #include <process.h>
157 #include <direct.h>
158 #else
159 #include <unistd.h>
160 #endif
161
162 #include <yaz/diagbib1.h>
163 #include "zserver.h"
164 #include <charmap.h>
165
166 static void zebra_chdir (ZebraService zh)
167 {
168     const char *dir = res_get (zh->res, "chdir");
169     if (!dir)
170         return;
171     logf (LOG_DEBUG, "chdir %s", dir);
172 #ifdef WIN32
173     _chdir(dir);
174 #else
175     chdir (dir);
176 #endif
177 }
178
179 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
180                                const char *buf, size_t buf_size,
181                                const char *databaseName, int delete_flag,
182                                int test_mode, int *sysno,
183                                int store_keys, int store_data,
184                                const char *match_criteria);
185
186 static int explain_extract (void *handle, Record rec, data1_node *n);
187 static void extract_index (ZebraHandle zh);
188
189 static void zebra_register_unlock (ZebraHandle zh);
190
191 static int zebra_register_activate (ZebraService zh, int rw);
192 static int zebra_register_deactivate (ZebraService zh);
193
194 static int zebra_register_lock (ZebraHandle zh, int rw)
195 {
196     time_t lastChange;
197     int state;
198     zh->errCode = 0;
199     zh->errString = 0;
200     if (!zh->service->active)
201     {
202         zh->errCode = 1019;
203         return 1;
204     }
205     
206 #if HAVE_SYS_TIMES_H
207     times (&zh->tms1);
208 #endif
209
210     zebra_mutex_cond_lock (&zh->service->session_lock);
211
212     state = zebra_server_lock_get_state(zh->service, &lastChange);
213
214     zebra_server_lock (zh->service, state);
215
216     switch (state)
217     {
218     case 'c':
219         state = 1;
220         break;
221     default:
222         state = 0;
223     }
224     if (rw)
225         logf (LOG_LOG, "Register in read/write mode");
226     else if (zh->service->registerState == state)
227     {
228         logf (LOG_DEBUG, "registerChange = %ld lastChange = %ld",
229             (long) zh->service->registerChange, (long)lastChange);
230         if (zh->service->registerChange >= lastChange)
231         {
232             return 0;
233         }
234         logf (LOG_LOG, "Register completely updated since last access");
235     }
236     else if (zh->service->registerState == -1)
237         logf (LOG_LOG, "Reading register using state %d pid=%ld", state,
238               (long) getpid());
239     else
240         logf (LOG_LOG, "Register has changed state from %d to %d",
241               zh->service->registerState, state);
242     zh->service->registerChange = lastChange;
243
244     zebra_register_deactivate (zh->service);
245
246     zh->service->registerState = state;
247
248     zebra_register_activate (zh->service, rw);
249     return 0;
250 }
251
252
253 static void zebra_register_unlock (ZebraHandle zh)
254 {
255     if (zh->service->registerState != -1)
256         zebra_server_unlock (zh->service, zh->service->registerState);
257     zebra_mutex_cond_unlock (&zh->service->session_lock);
258 #if HAVE_SYS_TIMES_H
259     times (&zh->tms2);
260     logf (LOG_LOG, "user/system: %ld/%ld",
261                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
262                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
263
264 #endif
265 }
266
267 ZebraHandle zebra_open (ZebraService zs)
268 {
269     ZebraHandle zh;
270
271     assert (zs);
272     if (zs->stop_flag)
273         return 0;
274
275     zh = (ZebraHandle) xmalloc (sizeof(*zh));
276     yaz_log (LOG_LOG, "zebra_open zs=%p returns %p", zs, zh);
277
278     zh->service = zs;
279     zh->sets = 0;
280     zh->destroyed = 0;
281     zh->errCode = 0;
282     zh->errString = 0;
283
284     zh->key_buf = 0;
285     zh->admin_databaseName = 0;
286     
287     zebra_mutex_cond_lock (&zs->session_lock);
288
289     zh->next = zs->sessions;
290     zs->sessions = zh;
291
292     zebra_mutex_cond_unlock (&zs->session_lock);
293
294     return zh;
295 }
296
297
298 ZebraService zebra_start (const char *configName)
299 {
300     ZebraService zh = xmalloc (sizeof(*zh));
301
302     yaz_log (LOG_LOG, "zebra_start %s", configName);
303
304     zh->configName = xstrdup(configName);
305     zh->sessions = 0;
306     zh->stop_flag = 0;
307     zh->active = 1;
308
309     zh->registerState = -1;
310     zh->registerChange = 0;
311
312     if (!(zh->res = res_open (zh->configName)))
313     {
314         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
315 //      return zh;
316     }
317     zebra_chdir (zh);
318     zebra_server_lock_init (zh);
319     zebra_mutex_cond_init (&zh->session_lock);
320     if (!res_get (zh->res, "passwd"))
321         zh->passwd_db = NULL;
322     else
323     {
324         zh->passwd_db = passwd_db_open ();
325         if (!zh->passwd_db)
326             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
327         else
328             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
329     }
330
331     return zh;
332 }
333
334 static int zebra_register_activate (ZebraService zh, int rw)
335 {
336     if (zh->active > 1)
337     {
338         yaz_log (LOG_LOG, "zebra_register_activate (ignored since active=%d)",
339                  zh->active);
340         return 0;
341     }
342     yaz_log (LOG_LOG, "zebra_register_activate shadow=%s",
343              zh->registerState ? "yes" : "no");
344
345     zh->dh = data1_create ();
346     if (!zh->dh)
347         return -1;
348     zh->bfs = bfs_create (res_get (zh->res, "register"));
349     if (!zh->bfs)
350     {
351         data1_destroy(zh->dh);
352         return -1;
353     }
354     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
355     bf_cache (zh->bfs, zh->registerState ? res_get (zh->res, "shadow") : NULL);
356     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
357     zh->recTypes = recTypes_init (zh->dh);
358     recTypes_default_handlers (zh->recTypes);
359
360     zh->records = NULL;
361     zh->zebra_maps = zebra_maps_open (zh->res);
362     zh->rank_classes = NULL;
363
364     zh->records = 0;
365     zh->dict = 0;
366     zh->sortIdx = 0;
367     zh->isams = 0;
368 #if ZMBOL
369     zh->isam = 0;
370     zh->isamc = 0;
371     zh->isamd = 0;
372 #endif
373     zh->zei = 0;
374     
375     zebraRankInstall (zh, rank1_class);
376
377     if (!(zh->records = rec_open (zh->bfs, rw, 0)))
378     {
379         logf (LOG_WARN, "rec_open");
380         return -1;
381     }
382     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, rw, 0)))
383     {
384         logf (LOG_WARN, "dict_open");
385         return -1;
386     }
387     if (!(zh->sortIdx = sortIdx_open (zh->bfs, rw)))
388     {
389         logf (LOG_WARN, "sortIdx_open");
390         return -1;
391     }
392     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
393     {
394         struct ISAMS_M_s isams_m;
395         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, rw,
396                                       key_isams_m(zh->res, &isams_m))))
397         {
398             logf (LOG_WARN, "isams_open");
399             return -1;
400         }
401     }
402 #if ZMBOL
403     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
404     {
405         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, rw,
406                                   sizeof (struct it_key), zh->res)))
407         {
408             logf (LOG_WARN, "is_open");
409             return -1;
410         }
411     }
412     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
413     {
414         struct ISAMC_M_s isamc_m;
415         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
416                                     rw, key_isamc_m(zh->res, &isamc_m))))
417         {
418             logf (LOG_WARN, "isc_open");
419             return -1;
420         }
421     }
422     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
423     {
424         struct ISAMD_M_s isamd_m;
425         
426         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
427                                       rw, key_isamd_m(zh->res, &isamd_m))))
428         {
429             logf (LOG_WARN, "isamd_open");
430             return -1;
431         }
432     }
433 #endif
434     zh->zei = zebraExplain_open (zh->records, zh->dh,
435                                  zh->res, rw, 0 /* rGroup */,
436                                  explain_extract);
437     if (!zh->zei)
438     {
439         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
440         return -1;
441     }
442     zh->active = 2;
443     yaz_log (LOG_LOG, "zebra_register_activate ok");
444     return 0;
445 }
446
447 void zebra_admin_shutdown (ZebraHandle zh)
448 {
449     zebra_mutex_cond_lock (&zh->service->session_lock);
450     zh->service->stop_flag = 1;
451     if (!zh->service->sessions)
452         zebra_register_deactivate(zh->service);
453     zh->service->active = 0;
454     zebra_mutex_cond_unlock (&zh->service->session_lock);
455 }
456
457 void zebra_admin_start (ZebraHandle zh)
458 {
459     ZebraService zs = zh->service;
460     zh->errCode = 0;
461     zebra_mutex_cond_lock (&zs->session_lock);
462     if (!zs->stop_flag)
463         zh->service->active = 1;
464     zebra_mutex_cond_unlock (&zs->session_lock);
465 }
466
467 static int zebra_register_deactivate (ZebraService zs)
468 {
469     zs->stop_flag = 0;
470     if (zs->active <= 1)
471     {
472         yaz_log(LOG_LOG, "zebra_register_deactivate (ignored since active=%d)",
473                 zs->active);
474         return 0;
475     }
476     yaz_log(LOG_LOG, "zebra_register_deactivate");
477     zebra_chdir (zs);
478     if (zs->records)
479     {
480         zebraExplain_close (zs->zei, 0);
481         dict_close (zs->dict);
482         sortIdx_close (zs->sortIdx);
483         if (zs->isams)
484             isams_close (zs->isams);
485 #if ZMBOL
486         if (zs->isam)
487             is_close (zs->isam);
488         if (zs->isamc)
489             isc_close (zs->isamc);
490         if (zs->isamd)
491             isamd_close (zs->isamd);
492 #endif
493         rec_close (&zs->records);
494     }
495     recTypes_destroy (zs->recTypes);
496     zebra_maps_close (zs->zebra_maps);
497     zebraRankDestroy (zs);
498     bfs_destroy (zs->bfs);
499     data1_destroy (zs->dh);
500
501     if (zs->passwd_db)
502         passwd_db_close (zs->passwd_db);
503     zs->active = 1;
504     return 0;
505 }
506
507 void zebra_stop(ZebraService zs)
508 {
509     if (!zs)
510         return ;
511     yaz_log (LOG_LOG, "zebra_stop");
512
513     zebra_mutex_cond_lock (&zs->session_lock);
514     while (zs->sessions)
515         zebra_close (zs->sessions);
516
517     zebra_mutex_cond_unlock (&zs->session_lock);
518
519     zebra_mutex_cond_destroy (&zs->session_lock);
520
521     zebra_register_deactivate(zs);
522     res_close (zs->res);
523     xfree (zs->configName);
524     xfree (zs);
525 }
526
527 void zebra_close (ZebraHandle zh)
528 {
529     ZebraService zs = zh->service;
530     struct zebra_session **sp;
531
532     yaz_log (LOG_LOG, "zebra_close zh=%p", zh);
533     if (!zh)
534         return ;
535     resultSetDestroy (zh, -1, 0, 0);
536
537     if (zh->key_buf)
538     {
539         xfree (zh->key_buf);
540         zh->key_buf = 0;
541     }
542     xfree (zh->admin_databaseName);
543     zebra_mutex_cond_lock (&zs->session_lock);
544     sp = &zs->sessions;
545     while (1)
546     {
547         assert (*sp);
548         if (*sp == zh)
549         {
550             *sp = (*sp)->next;
551             break;
552         }
553         sp = &(*sp)->next;
554     }
555     if (!zs->sessions && zs->stop_flag)
556         zebra_register_deactivate(zs);
557     zebra_mutex_cond_unlock (&zs->session_lock);
558     xfree (zh);
559 }
560
561 struct map_baseinfo {
562     ZebraHandle zh;
563     NMEM mem;
564     int num_bases;
565     char **basenames;
566     int new_num_bases;
567     char **new_basenames;
568     int new_num_max;
569 };
570         
571 void map_basenames_func (void *vp, const char *name, const char *value)
572 {
573     struct map_baseinfo *p = (struct map_baseinfo *) vp;
574     int i, no;
575     char fromdb[128], todb[8][128];
576     
577     no =
578         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
579                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
580                 todb[5], todb[6], todb[7]);
581     if (no < 2)
582         return ;
583     no--;
584     for (i = 0; i<p->num_bases; i++)
585         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
586         {
587             p->basenames[i] = 0;
588             for (i = 0; i < no; i++)
589             {
590                 if (p->new_num_bases == p->new_num_max)
591                     return;
592                 p->new_basenames[(p->new_num_bases)++] = 
593                     nmem_strdup (p->mem, todb[i]);
594             }
595             return;
596         }
597 }
598
599 void map_basenames (ZebraHandle zh, ODR stream,
600                     int *num_bases, char ***basenames)
601 {
602     struct map_baseinfo info;
603     struct map_baseinfo *p = &info;
604     int i;
605
606     info.zh = zh;
607     info.num_bases = *num_bases;
608     info.basenames = *basenames;
609     info.new_num_max = 128;
610     info.new_num_bases = 0;
611     info.new_basenames = (char **)
612         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
613     info.mem = stream->mem;
614
615     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
616     
617     for (i = 0; i<p->num_bases; i++)
618         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
619         {
620             p->new_basenames[(p->new_num_bases)++] = 
621                 nmem_strdup (p->mem, p->basenames[i]);
622         }
623     *num_bases = info.new_num_bases;
624     *basenames = info.new_basenames;
625     for (i = 0; i<*num_bases; i++)
626         logf (LOG_LOG, "base %s", (*basenames)[i]);
627 }
628
629 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
630                        Z_RPNQuery *query, int num_bases, char **basenames, 
631                        const char *setname)
632 {
633     zh->hits = 0;
634     if (zebra_register_lock (zh, 0))
635         return;
636     map_basenames (zh, stream, &num_bases, &basenames);
637     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
638
639     zebra_register_unlock (zh);
640
641     logf(LOG_APP,"SEARCH:%d:",zh->hits);
642 }
643
644 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
645                              const char *setname, Z_RecordComposition *comp,
646                              oid_value input_format, int num_recs,
647                              ZebraRetrievalRecord *recs)
648 {
649     ZebraPosSet poset;
650     int i, *pos_array;
651
652     if (zebra_register_lock (zh, 0))
653         return;
654     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
655     for (i = 0; i<num_recs; i++)
656         pos_array[i] = recs[i].position;
657     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
658     if (!poset)
659     {
660         logf (LOG_DEBUG, "zebraPosSetCreate error");
661         zh->errCode = 30;
662         zh->errString = nmem_strdup (stream->mem, setname);
663     }
664     else
665     {
666         for (i = 0; i<num_recs; i++)
667         {
668             if (!poset[i].sysno)
669             {
670                 char num_str[20];
671
672                 sprintf (num_str, "%d", pos_array[i]);  
673                 zh->errCode = 13;
674                 zh->errString = nmem_strdup (stream->mem, num_str);
675                 break;
676             }
677             else
678             {
679                 recs[i].errCode =
680                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
681                                         stream, input_format, comp,
682                                         &recs[i].format, &recs[i].buf,
683                                         &recs[i].len,
684                                         &recs[i].base);
685                 recs[i].errString = NULL;
686             }
687         }
688         zebraPosSetDestroy (zh, poset, num_recs);
689     }
690     zebra_register_unlock (zh);
691     xfree (pos_array);
692 }
693
694 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
695                  oid_value attributeset,
696                  int num_bases, char **basenames,
697                  int *position, int *num_entries, ZebraScanEntry **entries,
698                  int *is_partial)
699 {
700     if (zebra_register_lock (zh, 0))
701     {
702         *entries = 0;
703         *num_entries = 0;
704         return;
705     }
706     map_basenames (zh, stream, &num_bases, &basenames);
707     rpn_scan (zh, stream, zapt, attributeset,
708               num_bases, basenames, position,
709               num_entries, entries, is_partial);
710     zebra_register_unlock (zh);
711 }
712
713 void zebra_sort (ZebraHandle zh, ODR stream,
714                  int num_input_setnames, const char **input_setnames,
715                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
716                  int *sort_status)
717 {
718     if (zebra_register_lock (zh, 0))
719         return;
720     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
721                    output_setname, sort_sequence, sort_status);
722     zebra_register_unlock (zh);
723 }
724
725 int zebra_deleleResultSet(ZebraHandle zh, int function,
726                           int num_setnames, char **setnames,
727                           int *statuses)
728 {
729     int i, status;
730     if (zebra_register_lock (zh, 0))
731         return Z_DeleteStatus_systemProblemAtTarget;
732     switch (function)
733     {
734     case Z_DeleteRequest_list:
735         resultSetDestroy (zh, num_setnames, setnames, statuses);
736         break;
737     case Z_DeleteRequest_all:
738         resultSetDestroy (zh, -1, 0, statuses);
739         break;
740     }
741     zebra_register_unlock (zh);
742     status = Z_DeleteStatus_success;
743     for (i = 0; i<num_setnames; i++)
744         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
745             status = statuses[i];
746     return status;
747 }
748
749 int zebra_errCode (ZebraHandle zh)
750 {
751     return zh->errCode;
752 }
753
754 const char *zebra_errString (ZebraHandle zh)
755 {
756     return diagbib1_str (zh->errCode);
757 }
758
759 char *zebra_errAdd (ZebraHandle zh)
760 {
761     return zh->errString;
762 }
763
764 int zebra_hits (ZebraHandle zh)
765 {
766     return zh->hits;
767 }
768
769 int zebra_auth (ZebraService zh, const char *user, const char *pass)
770 {
771     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
772     {
773         logf(LOG_APP,"AUTHOK:%s", user?user:"ANONYMOUS");
774         return 0;
775     }
776
777     logf(LOG_APP,"AUTHFAIL:%s", user?user:"ANONYMOUS");
778     return 1;
779 }
780
781 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
782 {
783     if (zebra_register_lock (zh, 1))
784         return;
785     xfree (zh->admin_databaseName);
786     zh->admin_databaseName = xstrdup(database);
787 }
788
789 void zebra_admin_import_end (ZebraHandle zh)
790 {
791     zebraExplain_flush (zh->service->zei, 1, zh);
792     extract_index (zh);
793     zebra_register_unlock (zh);
794 }
795
796 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
797 {
798     int sysno;
799     int i;
800     if (zh->service->active < 2)
801         return;
802     for (i = 0; i<segment->num_segmentRecords; i++)
803     {
804         Z_NamePlusRecord *npr = segment->segmentRecords[i];
805         const char *databaseName = npr->databaseName;
806
807         if (!databaseName)
808             databaseName = zh->admin_databaseName;
809         printf ("--------------%d--------------------\n", i);
810         if (npr->which == Z_NamePlusRecord_intermediateFragment)
811         {
812             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
813             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
814             {
815                 Odr_oct *oct = fragment->u.notExternallyTagged;
816                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
817                         oct->buf);
818                 
819                 sysno = 0;
820                 extract_rec_in_mem (zh, "grs.sgml",
821                                     oct->buf, oct->len,
822                                     databaseName,
823                                     0 /* delete_flag */,
824                                     0 /* test_mode */,
825                                     &sysno /* sysno */,
826                                     1 /* store_keys */,
827                                     1 /* store_data */,
828                                     0 /* match criteria */);
829             }
830         }
831     }
832 }
833
834 void zebra_admin_create (ZebraHandle zh, const char *database)
835 {
836     ZebraService zs = zh->service;
837     if (zebra_register_lock(zh, 1))
838     {
839         zh->errCode = 1019;
840         return;
841     }
842     /* announce database */
843     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
844     {
845         zh->errCode = 224;
846         zh->errString = "Database already exist";
847     }
848     zebraExplain_flush (zh->service->zei, 1, zh);
849     extract_index (zh);
850     zebra_register_unlock(zh);
851 }
852
853 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
854                        const char *input_str, int input_len,
855                        char *output_str, int output_len)
856 {
857     WRBUF wrbuf;
858     if (!zh->service->zebra_maps)
859         return -1;
860     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
861                           input_str, input_len);
862     if (!wrbuf)
863         return -2;
864     if (wrbuf_len(wrbuf) >= output_len)
865         return -3;
866     if (wrbuf_len(wrbuf))
867         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
868     output_str[wrbuf_len(wrbuf)] = '\0';
869     return wrbuf_len(wrbuf);
870 }
871
872 static void extract_init (struct recExtractCtrl *p, RecWord *w)
873 {
874     w->zebra_maps = p->zebra_maps;
875     w->seqnos = p->seqno;
876     w->attrSet = VAL_BIB1;
877     w->attrUse = 1016;
878     w->reg_type = 'w';
879     w->extractCtrl = p;
880 }
881
882 static void extract_add_index_string (RecWord *p, const char *string,
883                                       int length)
884 {
885     char *dst;
886     unsigned char attrSet;
887     unsigned short attrUse;
888     int lead = 0;
889     int diff = 0;
890     int *pseqno = &p->seqnos[p->reg_type];
891     ZebraHandle zh = p->extractCtrl->handle;
892     ZebraExplainInfo zei = zh->service->zei;
893     struct recKeys *keys = &zh->keys;
894
895     if (keys->buf_used+1024 > keys->buf_max)
896     {
897         char *b;
898
899         b = (char *) xmalloc (keys->buf_max += 128000);
900         if (keys->buf_used > 0)
901             memcpy (b, keys->buf, keys->buf_used);
902         xfree (keys->buf);
903         keys->buf = b;
904     }
905     dst = keys->buf + keys->buf_used;
906
907     attrSet = p->attrSet;
908     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
909         lead |= 1;
910     else
911         keys->prevAttrSet = attrSet;
912     attrUse = p->attrUse;
913     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
914         lead |= 2;
915     else
916         keys->prevAttrUse = attrUse;
917 #if 1
918     diff = 1 + *pseqno - keys->prevSeqNo;
919     if (diff >= 1 && diff <= 15)
920         lead |= (diff << 2);
921     else
922         diff = 0;
923 #endif
924     keys->prevSeqNo = *pseqno;
925     
926     *dst++ = lead;
927
928 #if SU_SCHEME
929     if ((lead & 3) < 3)
930     {
931         int ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
932         if (ch < 0)
933         {
934             ch = zebraExplain_addSU (zei, attrSet, attrUse);
935             yaz_log (LOG_LOG, "addSU set=%d use=%d SU=%d",
936                      attrSet, attrUse, ch);
937         }
938         assert (ch > 0);
939         memcpy (dst, &ch, sizeof(ch));
940         dst += sizeof(ch);
941     }
942 #else
943     if (!(lead & 1))
944     {
945         memcpy (dst, &attrSet, sizeof(attrSet));
946         dst += sizeof(attrSet);
947     }
948     if (!(lead & 2))
949     {
950         memcpy (dst, &attrUse, sizeof(attrUse));
951         dst += sizeof(attrUse);
952     }
953 #endif
954     *dst++ = p->reg_type;
955     memcpy (dst, string, length);
956     dst += length;
957     *dst++ = '\0';
958
959     if (!diff)
960     {
961         memcpy (dst, pseqno, sizeof(*pseqno));
962         dst += sizeof(*pseqno);
963     }
964     keys->buf_used = dst - keys->buf;
965     if (*pseqno)
966         (*pseqno)++;
967 }
968
969 static void extract_add_sort_string (RecWord *p, const char *string,
970                                      int length)
971 {
972     struct sortKey *sk;
973     ZebraHandle zh = p->extractCtrl->handle;
974     struct sortKey *sortKeys = zh->sortKeys;
975
976     for (sk = sortKeys; sk; sk = sk->next)
977         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
978             return;
979
980     sk = (struct sortKey *) xmalloc (sizeof(*sk));
981     sk->next = sortKeys;
982     sortKeys = sk;
983
984     sk->string = (char *) xmalloc (length);
985     sk->length = length;
986     memcpy (sk->string, string, length);
987
988     sk->attrSet = p->attrSet;
989     sk->attrUse = p->attrUse;
990 }
991
992 static void extract_add_string (RecWord *p, const char *string, int length)
993 {
994     assert (length > 0);
995     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
996         extract_add_sort_string (p, string, length);
997     else
998         extract_add_index_string (p, string, length);
999 }
1000
1001 static void extract_add_incomplete_field (RecWord *p)
1002 {
1003     const char *b = p->string;
1004     int remain = p->length;
1005     const char **map = 0;
1006
1007     if (remain > 0)
1008         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1009
1010     while (map)
1011     {
1012         char buf[IT_MAX_WORD+1];
1013         int i, remain;
1014
1015         /* Skip spaces */
1016         while (map && *map && **map == *CHR_SPACE)
1017         {
1018             remain = p->length - (b - p->string);
1019             if (remain > 0)
1020                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1021             else
1022                 map = 0;
1023         }
1024         if (!map)
1025             break;
1026         i = 0;
1027         while (map && *map && **map != *CHR_SPACE)
1028         {
1029             const char *cp = *map;
1030
1031             while (i < IT_MAX_WORD && *cp)
1032                 buf[i++] = *(cp++);
1033             remain = p->length - (b - p->string);
1034             if (remain > 0)
1035                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1036             else
1037                 map = 0;
1038         }
1039         if (!i)
1040             return;
1041         extract_add_string (p, buf, i);
1042     }
1043     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
1044 }
1045
1046 static void extract_add_complete_field (RecWord *p)
1047 {
1048     const char *b = p->string;
1049     char buf[IT_MAX_WORD+1];
1050     const char **map = 0;
1051     int i = 0, remain = p->length;
1052
1053     if (remain > 0)
1054         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
1055
1056     while (remain > 0 && i < IT_MAX_WORD)
1057     {
1058         while (map && *map && **map == *CHR_SPACE)
1059         {
1060             remain = p->length - (b - p->string);
1061             if (remain > 0)
1062                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1063             else
1064                 map = 0;
1065         }
1066         if (!map)
1067             break;
1068
1069         if (i && i < IT_MAX_WORD)
1070             buf[i++] = *CHR_SPACE;
1071         while (map && *map && **map != *CHR_SPACE)
1072         {
1073             const char *cp = *map;
1074
1075             if (i >= IT_MAX_WORD)
1076                 break;
1077             while (i < IT_MAX_WORD && *cp)
1078                 buf[i++] = *(cp++);
1079             remain = p->length  - (b - p->string);
1080             if (remain > 0)
1081                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
1082                                         remain);
1083             else
1084                 map = 0;
1085         }
1086     }
1087     if (!i)
1088         return;
1089     extract_add_string (p, buf, i);
1090 }
1091
1092 static void extract_token_add (RecWord *p)
1093 {
1094     WRBUF wrbuf;
1095     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
1096                                p->string, p->length)))
1097     {
1098         p->string = wrbuf_buf(wrbuf);
1099         p->length = wrbuf_len(wrbuf);
1100     }
1101     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
1102         extract_add_complete_field (p);
1103     else
1104         extract_add_incomplete_field(p);
1105 }
1106
1107 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
1108 {
1109     ZebraHandle zh = (ZebraHandle) (p->handle);
1110     zebraExplain_addSchema (zh->service->zei, oid);
1111 }
1112
1113 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
1114                                    int cmd, struct sortKey **skp)
1115 {
1116     struct sortKey *sk = *skp;
1117     SortIdx sortIdx = zh->service->sortIdx;
1118
1119     sortIdx_sysno (sortIdx, sysno);
1120     while (sk)
1121     {
1122         struct sortKey *sk_next = sk->next;
1123         sortIdx_type (sortIdx, sk->attrUse);
1124         sortIdx_add (sortIdx, sk->string, sk->length);
1125         xfree (sk->string);
1126         xfree (sk);
1127         sk = sk_next;
1128     }
1129     *skp = 0;
1130 }
1131
1132 struct encode_info {
1133     int  sysno;
1134     int  seqno;
1135     int  cmd;
1136     char buf[768];
1137 };
1138
1139 void encode_key_init (struct encode_info *i)
1140 {
1141     i->sysno = 0;
1142     i->seqno = 0;
1143     i->cmd = -1;
1144 }
1145
1146 char *encode_key_int (int d, char *bp)
1147 {
1148     if (d <= 63)
1149         *bp++ = d;
1150     else if (d <= 16383)
1151     {
1152         *bp++ = 64 + (d>>8);
1153         *bp++ = d  & 255;
1154     }
1155     else if (d <= 4194303)
1156     {
1157         *bp++ = 128 + (d>>16);
1158         *bp++ = (d>>8) & 255;
1159         *bp++ = d & 255;
1160     }
1161     else
1162     {
1163         *bp++ = 192 + (d>>24);
1164         *bp++ = (d>>16) & 255;
1165         *bp++ = (d>>8) & 255;
1166         *bp++ = d & 255;
1167     }
1168     return bp;
1169 }
1170
1171 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1172 {
1173     struct it_key key;
1174     char *bp = i->buf;
1175
1176     while ((*bp++ = *k++))
1177         ;
1178     memcpy (&key, k+1, sizeof(struct it_key));
1179     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1180     if (i->sysno != key.sysno)
1181     {
1182         i->sysno = key.sysno;
1183         i->seqno = 0;
1184     }
1185     else if (!i->seqno && !key.seqno && i->cmd == *k)
1186         return;
1187     bp = encode_key_int (key.seqno - i->seqno, bp);
1188     i->seqno = key.seqno;
1189     i->cmd = *k;
1190     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1191     {
1192         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1193         exit (1);
1194     }
1195 }
1196
1197 static void extract_flushWriteKeys (ZebraHandle zh)
1198 {
1199     FILE *outf;
1200     char out_fname[200];
1201     char *prevcp, *cp;
1202     struct encode_info encode_info;
1203     int ptr_i = zh->ptr_i;
1204 #if SORT_EXTRA
1205     int i;
1206 #endif
1207     if (!zh->key_buf || ptr_i <= 0)
1208         return;
1209
1210     (zh->key_file_no)++;
1211     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1212 #if !SORT_EXTRA
1213     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1214             key_qsort_compare);
1215     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1216
1217     if (!(outf = fopen (out_fname, "wb")))
1218     {
1219         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1220         exit (1);
1221     }
1222     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1223     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1224     
1225     encode_key_init (&encode_info);
1226     encode_key_write (cp, &encode_info, outf);
1227     
1228     while (--ptr_i > 0)
1229     {
1230         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1231         if (strcmp (cp, prevcp))
1232         {
1233             encode_key_init (&encode_info);
1234             encode_key_write (cp, &encode_info, outf);
1235             prevcp = cp;
1236         }
1237         else
1238             encode_key_write (cp + strlen(cp), &encode_info, outf);
1239     }
1240 #else
1241     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1242     extract_get_fname_tmp (out_fname, key_file_no);
1243
1244     if (!(outf = fopen (out_fname, "wb")))
1245     {
1246         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1247         exit (1);
1248     }
1249     logf (LOG_LOG, "writing section %d", key_file_no);
1250     i = ptr_i;
1251     prevcp =  key_buf[ptr_top-i];
1252     while (1)
1253         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1254         {
1255             key_y_len = strlen(prevcp)+1;
1256 #if 0
1257             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1258                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1259 #endif
1260             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1261                                    sizeof(char*), key_y_compare);
1262             cp = key_buf[ptr_top-ptr_i];
1263             --key_y_len;
1264             encode_key_init (&encode_info);
1265             encode_key_write (cp, &encode_info, outf);
1266             while (--ptr_i > i)
1267             {
1268                 cp = key_buf[ptr_top-ptr_i];
1269                 encode_key_write (cp+key_y_len, &encode_info, outf);
1270             }
1271             if (!i)
1272                 break;
1273             prevcp = key_buf[ptr_top-ptr_i];
1274         }
1275 #endif
1276     if (fclose (outf))
1277     {
1278         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1279         exit (1);
1280     }
1281     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1282     zh->ptr_i = 0;
1283     zh->key_buf_used = 0;
1284 }
1285
1286 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1287                                      int cmd, struct recKeys *reckeys)
1288 {
1289 #if SU_SCHEME
1290 #else
1291     unsigned char attrSet = (unsigned char) -1;
1292     unsigned short attrUse = (unsigned short) -1;
1293 #endif
1294     int seqno = 0;
1295     int off = 0;
1296     int ch = 0;
1297     ZebraExplainInfo zei = zh->service->zei;
1298
1299     if (!zh->key_buf)
1300     {
1301         int mem = 8*1024*1024;
1302         zh->key_buf = (char**) xmalloc (mem);
1303         zh->ptr_top = mem/sizeof(char*);
1304         zh->ptr_i = 0;
1305         zh->key_buf_used = 0;
1306         zh->key_file_no = 0;
1307     }
1308     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1309     while (off < reckeys->buf_used)
1310     {
1311         const char *src = reckeys->buf + off;
1312         struct it_key key;
1313         int lead;
1314     
1315         lead = *src++;
1316
1317 #if SU_SCHEME
1318         if ((lead & 3) < 3)
1319         {
1320             memcpy (&ch, src, sizeof(ch));
1321             src += sizeof(ch);
1322         }
1323 #else
1324         if (!(lead & 1))
1325         {
1326             memcpy (&attrSet, src, sizeof(attrSet));
1327             src += sizeof(attrSet);
1328         }
1329         if (!(lead & 2))
1330         {
1331             memcpy (&attrUse, src, sizeof(attrUse));
1332             src += sizeof(attrUse);
1333         }
1334 #endif
1335         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1336             extract_flushWriteKeys (zh);
1337         ++(zh->ptr_i);
1338         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1339             (char*)zh->key_buf + zh->key_buf_used;
1340 #if SU_SCHEME
1341 #else
1342         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1343         if (ch < 0)
1344             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1345 #endif
1346         assert (ch > 0);
1347         zh->key_buf_used +=
1348             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1349
1350         while (*src)
1351             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1352         src++;
1353         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1354         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1355
1356         if (lead & 60)
1357             seqno += ((lead>>2) & 15)-1;
1358         else
1359         {
1360             memcpy (&seqno, src, sizeof(seqno));
1361             src += sizeof(seqno);
1362         }
1363         key.seqno = seqno;
1364         key.sysno = sysno;
1365         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1366         (zh->key_buf_used) += sizeof(key);
1367         off = src - reckeys->buf;
1368     }
1369     assert (off == reckeys->buf_used);
1370 }
1371
1372 static void extract_index (ZebraHandle zh)
1373 {
1374     extract_flushWriteKeys (zh);
1375     zebra_index_merge (zh);
1376 }
1377
1378 static int explain_extract (void *handle, Record rec, data1_node *n)
1379 {
1380     ZebraHandle zh = (ZebraHandle) handle;
1381     struct recExtractCtrl extractCtrl;
1382     int i;
1383
1384     if (zebraExplain_curDatabase (zh->service->zei,
1385                                   rec->info[recInfo_databaseName]))
1386     {
1387         abort();
1388         if (zebraExplain_newDatabase (zh->service->zei,
1389                                       rec->info[recInfo_databaseName], 0))
1390             abort ();
1391     }
1392
1393     zh->keys.buf_used = 0;
1394     zh->keys.prevAttrUse = -1;
1395     zh->keys.prevAttrSet = -1;
1396     zh->keys.prevSeqNo = 0;
1397     zh->sortKeys = 0;
1398     
1399     extractCtrl.init = extract_init;
1400     extractCtrl.tokenAdd = extract_token_add;
1401     extractCtrl.schemaAdd = extract_schema_add;
1402     extractCtrl.dh = zh->service->dh;
1403     for (i = 0; i<256; i++)
1404         extractCtrl.seqno[i] = 0;
1405     extractCtrl.zebra_maps = zh->service->zebra_maps;
1406     extractCtrl.flagShowRecords = 0;
1407     extractCtrl.handle = handle;
1408     
1409     grs_extract_tree(&extractCtrl, n);
1410
1411     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1412
1413     if (rec->size[recInfo_delKeys])
1414     {
1415         struct recKeys delkeys;
1416         struct sortKey *sortKeys = 0;
1417
1418         delkeys.buf_used = rec->size[recInfo_delKeys];
1419         delkeys.buf = rec->info[recInfo_delKeys];
1420         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1421         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1422     }
1423     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1424     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1425
1426     xfree (rec->info[recInfo_delKeys]);
1427     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1428     rec->info[recInfo_delKeys] = zh->keys.buf;
1429     zh->keys.buf = NULL;
1430     zh->keys.buf_max = 0;
1431     return 0;
1432 }
1433
1434 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1435                                const char *buf, size_t buf_size,
1436                                const char *databaseName, int delete_flag,
1437                                int test_mode, int *sysno,
1438                                int store_keys, int store_data,
1439                                const char *match_criteria)
1440 {
1441     RecordAttr *recordAttr;
1442     struct recExtractCtrl extractCtrl;
1443     int i, r;
1444     RecType recType;
1445     char subType[1024];
1446     void *clientData;
1447     const char *fname = "<no file>";
1448     Record rec;
1449     long recordOffset = 0;
1450     struct zebra_fetch_control fc;
1451
1452     fc.fd = -1;
1453     fc.record_int_buf = buf;
1454     fc.record_int_len = buf_size;
1455     fc.record_int_pos = 0;
1456     fc.offset_end = 0;
1457     fc.record_offset = 0;
1458
1459     extractCtrl.offset = 0;
1460     extractCtrl.readf = zebra_record_int_read;
1461     extractCtrl.seekf = zebra_record_int_seek;
1462     extractCtrl.tellf = zebra_record_int_tell;
1463     extractCtrl.endf = zebra_record_int_end;
1464     extractCtrl.fh = &fc;
1465
1466     /* announce database */
1467     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1468     {
1469         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1470             return 0;
1471     }
1472     if (!(recType =
1473           recType_byName (zh->service->recTypes, recordType, subType,
1474                           &clientData)))
1475     {
1476         logf (LOG_WARN, "No such record type: %s", recordType);
1477         return 0;
1478     }
1479
1480     zh->keys.buf_used = 0;
1481     zh->keys.prevAttrUse = -1;
1482     zh->keys.prevAttrSet = -1;
1483     zh->keys.prevSeqNo = 0;
1484     zh->sortKeys = 0;
1485
1486     extractCtrl.subType = subType;
1487     extractCtrl.init = extract_init;
1488     extractCtrl.tokenAdd = extract_token_add;
1489     extractCtrl.schemaAdd = extract_schema_add;
1490     extractCtrl.dh = zh->service->dh;
1491     extractCtrl.handle = zh;
1492     extractCtrl.zebra_maps = zh->service->zebra_maps;
1493     extractCtrl.flagShowRecords = 0;
1494     for (i = 0; i<256; i++)
1495     {
1496         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1497             extractCtrl.seqno[i] = 1;
1498         else
1499             extractCtrl.seqno[i] = 0;
1500     }
1501
1502     r = (*recType->extract)(clientData, &extractCtrl);
1503
1504     if (r == RECCTRL_EXTRACT_EOF)
1505         return 0;
1506     else if (r == RECCTRL_EXTRACT_ERROR)
1507     {
1508         /* error occured during extraction ... */
1509 #if 1
1510         yaz_log (LOG_WARN, "extract error");
1511 #else
1512         if (rGroup->flagRw &&
1513             records_processed < rGroup->fileVerboseLimit)
1514         {
1515             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1516                   fname, (long) recordOffset);
1517         }
1518 #endif
1519         return 0;
1520     }
1521     if (zh->keys.buf_used == 0)
1522     {
1523         /* the extraction process returned no information - the record
1524            is probably empty - unless flagShowRecords is in use */
1525         if (test_mode)
1526             return 1;
1527         logf (LOG_WARN, "No keys generated for record");
1528         logf (LOG_WARN, " The file is probably empty");
1529         return 1;
1530     }
1531     /* match criteria */
1532
1533     if (! *sysno)
1534     {
1535         /* new record */
1536         if (delete_flag)
1537         {
1538             logf (LOG_LOG, "delete %s %s %ld", recordType,
1539                   fname, (long) recordOffset);
1540             logf (LOG_WARN, "cannot delete record above (seems new)");
1541             return 1;
1542         }
1543         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1544               (long) recordOffset);
1545         rec = rec_new (zh->service->records);
1546
1547         *sysno = rec->sysno;
1548
1549         recordAttr = rec_init_attr (zh->service->zei, rec);
1550
1551 #if 0
1552         if (matchStr)
1553         {
1554             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1555         }
1556 #endif
1557         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1558         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1559     }
1560     else
1561     {
1562         /* record already exists */
1563         struct recKeys delkeys;
1564
1565         rec = rec_get (zh->service->records, *sysno);
1566         assert (rec);
1567         
1568         recordAttr = rec_init_attr (zh->service->zei, rec);
1569
1570         if (recordAttr->runNumber ==
1571             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1572         {
1573             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1574                   fname, (long) recordOffset);
1575             rec_rm (&rec);
1576             return 1;
1577         }
1578         delkeys.buf_used = rec->size[recInfo_delKeys];
1579         delkeys.buf = rec->info[recInfo_delKeys];
1580         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1581         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1582         if (delete_flag)
1583         {
1584             /* record going to be deleted */
1585             if (!delkeys.buf_used)
1586             {
1587                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1588                       fname, (long) recordOffset);
1589                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1590             }
1591             else
1592             {
1593                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1594                       fname, (long) recordOffset);
1595 #if 0
1596                 if (matchStr)
1597                     dict_delete (matchDict, matchStr);
1598 #endif
1599                 rec_del (zh->service->records, &rec);
1600             }
1601             rec_rm (&rec);
1602             return 1;
1603         }
1604         else
1605         {
1606             /* record going to be updated */
1607             if (!delkeys.buf_used)
1608             {
1609                 logf (LOG_LOG, "update %s %s %ld", recordType,
1610                       fname, (long) recordOffset);
1611                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1612             }
1613             else
1614             {
1615                 logf (LOG_LOG, "update %s %s %ld", recordType,
1616                       fname, (long) recordOffset);
1617                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1618             }
1619         }
1620     }
1621     /* update file type */
1622     xfree (rec->info[recInfo_fileType]);
1623     rec->info[recInfo_fileType] =
1624         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1625
1626     /* update filename */
1627     xfree (rec->info[recInfo_filename]);
1628     rec->info[recInfo_filename] =
1629         rec_strdup (fname, &rec->size[recInfo_filename]);
1630
1631     /* update delete keys */
1632     xfree (rec->info[recInfo_delKeys]);
1633     if (zh->keys.buf_used > 0 && store_keys == 1)
1634     {
1635         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1636         rec->info[recInfo_delKeys] = zh->keys.buf;
1637         zh->keys.buf = NULL;
1638         zh->keys.buf_max = 0;
1639     }
1640     else
1641     {
1642         rec->info[recInfo_delKeys] = NULL;
1643         rec->size[recInfo_delKeys] = 0;
1644     }
1645
1646     /* save file size of original record */
1647     zebraExplain_recordBytesIncrement (zh->service->zei,
1648                                        - recordAttr->recordSize);
1649 #if 0
1650     recordAttr->recordSize = fi->file_moffset - recordOffset;
1651     if (!recordAttr->recordSize)
1652         recordAttr->recordSize = fi->file_max - recordOffset;
1653 #else
1654     recordAttr->recordSize = buf_size;
1655 #endif
1656     zebraExplain_recordBytesIncrement (zh->service->zei,
1657                                        recordAttr->recordSize);
1658
1659     /* set run-number for this record */
1660     recordAttr->runNumber =
1661         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1662
1663     /* update store data */
1664     xfree (rec->info[recInfo_storeData]);
1665     if (store_data == 1)
1666     {
1667         rec->size[recInfo_storeData] = recordAttr->recordSize;
1668         rec->info[recInfo_storeData] = (char *)
1669             xmalloc (recordAttr->recordSize);
1670 #if 1
1671         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1672 #else
1673         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1674         {
1675             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1676                   (long) recordOffset, fname);
1677             exit (1);
1678         }
1679         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1680             < recordAttr->recordSize)
1681         {
1682             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1683                   recordAttr->recordSize, fname);
1684             exit (1);
1685         }
1686 #endif
1687     }
1688     else
1689     {
1690         rec->info[recInfo_storeData] = NULL;
1691         rec->size[recInfo_storeData] = 0;
1692     }
1693     /* update database name */
1694     xfree (rec->info[recInfo_databaseName]);
1695     rec->info[recInfo_databaseName] =
1696         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1697
1698     /* update offset */
1699     recordAttr->recordOffset = recordOffset;
1700     
1701     /* commit this record */
1702     rec_put (zh->service->records, &rec);
1703
1704     return 0;
1705 }