Fixed notification of live-updates. Fixed minor problem with mf_init
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.37  2000-10-17 12:37:09  adam
7  * Fixed notification of live-updates. Fixed minor problem with mf_init
8  * where it didn't handle shadow area file names correctly.
9  *
10  * Revision 1.36  2000/09/06 08:59:36  adam
11  * Using read-only (for now) for server.
12  *
13  * Revision 1.35  2000/07/07 12:49:20  adam
14  * Optimized resultSetInsert{Rank,Sort}.
15  *
16  * Revision 1.34  2000/06/09 13:56:38  ian
17  * Added some logging on Authentication and searches.
18  *
19  * Revision 1.33  2000/05/18 12:01:36  adam
20  * System call times(2) used again. More 64-bit fixes.
21  *
22  * Revision 1.32  2000/04/19 14:35:59  adam
23  * WIN32 update (this version is known not to work on Windows).
24  *
25  * Revision 1.31  2000/04/05 10:07:02  adam
26  * Minor zebra compile fix.
27  *
28  * Revision 1.30  2000/04/05 09:49:35  adam
29  * On Unix, zebra/z'mbol uses automake.
30  *
31  * Revision 1.29  2000/03/20 19:08:36  adam
32  * Added remote record import using Z39.50 extended services and Segment
33  * Requests.
34  *
35  * Revision 1.28  2000/03/15 15:00:30  adam
36  * First work on threaded version.
37  *
38  * Revision 1.27  2000/02/24 12:31:17  adam
39  * Added zebra_string_norm.
40  *
41  * Revision 1.26  1999/11/30 13:48:03  adam
42  * Improved installation. Updated for inclusion of YAZ header files.
43  *
44  * Revision 1.25  1999/11/04 15:00:45  adam
45  * Implemented delete result set(s).
46  *
47  * Revision 1.24  1999/10/14 14:33:50  adam
48  * Added truncation 5=106.
49  *
50  * Revision 1.23  1999/09/07 11:36:32  adam
51  * Minor changes.
52  *
53  * Revision 1.22  1999/08/02 10:13:47  adam
54  * Fixed bug regarding zebra_hits.
55  *
56  * Revision 1.21  1999/07/14 10:59:26  adam
57  * Changed functions isc_getmethod, isams_getmethod.
58  * Improved fatal error handling (such as missing EXPLAIN schema).
59  *
60  * Revision 1.20  1999/07/06 12:28:04  adam
61  * Updated record index structure. Format includes version ID. Compression
62  * algorithm ID is stored for each record block.
63  *
64  * Revision 1.19  1999/05/26 07:49:13  adam
65  * C++ compilation.
66  *
67  * Revision 1.18  1999/05/15 14:36:38  adam
68  * Updated dictionary. Implemented "compression" of dictionary.
69  *
70  * Revision 1.17  1999/05/12 13:08:06  adam
71  * First version of ISAMS.
72  *
73  * Revision 1.16  1999/02/19 10:38:30  adam
74  * Implemented chdir-setting.
75  *
76  * Revision 1.15  1999/02/17 12:18:12  adam
77  * Fixed zebra_close so that a NULL pointer is ignored.
78  *
79  * Revision 1.14  1999/02/02 14:51:11  adam
80  * Updated WIN32 code specific sections. Changed header.
81  *
82  * Revision 1.13  1998/12/16 12:23:30  adam
83  * Added facility for database name mapping using resource mapdb.
84  *
85  * Revision 1.12  1998/11/16 10:18:10  adam
86  * Better error reporting for result sets.
87  *
88  * Revision 1.11  1998/10/16 08:14:34  adam
89  * Updated record control system.
90  *
91  * Revision 1.10  1998/09/22 10:03:42  adam
92  * Changed result sets to be persistent in the sense that they can
93  * be re-searched if needed.
94  * Fixed memory leak in rsm_or.
95  *
96  * Revision 1.9  1998/09/02 13:53:17  adam
97  * Extra parameter decode added to search routines to implement
98  * persistent queries.
99  *
100  * Revision 1.8  1998/08/24 17:29:23  adam
101  * Minor changes.
102  *
103  * Revision 1.7  1998/06/24 12:16:13  adam
104  * Support for relations on text operands. Open range support in
105  * DFA module (i.e. [-j], [g-]).
106  *
107  * Revision 1.6  1998/06/22 11:36:47  adam
108  * Added authentication check facility to zebra.
109  *
110  * Revision 1.5  1998/06/13 00:14:08  adam
111  * Minor changes.
112  *
113  * Revision 1.4  1998/06/12 12:22:12  adam
114  * Work on Zebra API.
115  *
116  * Revision 1.3  1998/05/27 16:57:44  adam
117  * Zebra returns surrogate diagnostic for single records when
118  * appropriate.
119  *
120  * Revision 1.2  1998/05/20 10:12:19  adam
121  * Implemented automatic EXPLAIN database maintenance.
122  * Modified Zebra to work with ASN.1 compiled version of YAZ.
123  *
124  * Revision 1.1  1998/03/05 08:45:13  adam
125  * New result set model and modular ranking system. Moved towards
126  * descent server API. System information stored as "SGML" records.
127  *
128  */
129
130 #include <assert.h>
131 #include <stdio.h>
132 #ifdef WIN32
133 #include <io.h>
134 #include <process.h>
135 #include <direct.h>
136 #else
137 #include <unistd.h>
138 #endif
139
140 #include <yaz/diagbib1.h>
141 #include "zserver.h"
142 #include <charmap.h>
143
144 static void zebra_chdir (ZebraService zh)
145 {
146     const char *dir = res_get (zh->res, "chdir");
147     if (!dir)
148         return;
149     logf (LOG_DEBUG, "chdir %s", dir);
150 #ifdef WIN32
151     _chdir(dir);
152 #else
153     chdir (dir);
154 #endif
155 }
156
157 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
158                                const char *buf, size_t buf_size,
159                                const char *databaseName, int delete_flag,
160                                int test_mode, int *sysno,
161                                int store_keys, int store_data,
162                                const char *match_criteria);
163
164 static int explain_extract (void *handle, Record rec, data1_node *n);
165 static void extract_index (ZebraHandle zh);
166
167 static void zebra_register_unlock (ZebraHandle zh);
168
169 static int zebra_register_activate (ZebraService zh, int rw);
170 static int zebra_register_deactivate (ZebraService zh);
171
172 static int zebra_register_lock (ZebraHandle zh)
173 {
174     time_t lastChange;
175     int state;
176     zh->errCode = 0;
177     zh->errString = 0;
178     if (!zh->service->active)
179     {
180         zh->errCode = 1019;
181         return 1;
182     }
183     
184 #if HAVE_SYS_TIMES_H
185     times (&zh->tms1);
186 #endif
187
188     state = zebra_server_lock_get_state(zh->service, &lastChange);
189
190     zebra_server_lock (zh->service, state);
191
192     switch (state)
193     {
194     case 'c':
195         state = 1;
196         break;
197     default:
198         state = 0;
199     }
200     if (zh->service->registerState == state)
201     {
202         if (zh->service->registerChange >= lastChange)
203             return 0;
204         logf (LOG_LOG, "Register completely updated since last access");
205     }
206     else if (zh->service->registerState == -1)
207         logf (LOG_LOG, "Reading register using state %d pid=%ld", state,
208               (long) getpid());
209     else
210         logf (LOG_LOG, "Register has changed state from %d to %d",
211               zh->service->registerState, state);
212     zh->service->registerChange = lastChange;
213
214     zebra_register_deactivate (zh->service);
215
216     zh->service->registerState = state;
217
218     zebra_register_activate (zh->service, 0);
219     return 0;
220 }
221
222
223 static void zebra_register_unlock (ZebraHandle zh)
224 {
225     if (zh->service->registerState != -1)
226         zebra_server_unlock (zh->service, zh->service->registerState);
227 #if HAVE_SYS_TIMES_H
228     times (&zh->tms2);
229     logf (LOG_LOG, "user/system: %ld/%ld",
230                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
231                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
232
233 #endif
234 }
235
236 ZebraHandle zebra_open (ZebraService zs)
237 {
238     ZebraHandle zh;
239
240     assert (zs);
241     if (zs->stop_flag)
242         return 0;
243
244     zh = (ZebraHandle) xmalloc (sizeof(*zh));
245
246     zh->service = zs;
247     zh->sets = 0;
248     zh->destroyed = 0;
249     zh->errCode = 0;
250     zh->errString = 0;
251
252     zh->key_buf = 0;
253     zh->admin_databaseName = 0;
254     
255     zebra_mutex_cond_lock (&zs->session_lock);
256
257     zh->next = zs->sessions;
258     zs->sessions = zh;
259
260     zebra_mutex_cond_unlock (&zs->session_lock);
261
262     return zh;
263 }
264
265
266 ZebraService zebra_start (const char *configName)
267 {
268     ZebraService zh = xmalloc (sizeof(*zh));
269
270     yaz_log (LOG_LOG, "zebra_start %s", configName);
271
272     zh->configName = xstrdup(configName);
273     zh->sessions = 0;
274     zh->stop_flag = 0;
275     zh->active = 1;
276
277     zh->registerState = -1;
278     zh->registerChange = 0;
279
280     if (!(zh->res = res_open (zh->configName)))
281     {
282         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
283         return zh;
284     }
285     zebra_chdir (zh);
286     zebra_server_lock_init (zh);
287     zebra_mutex_cond_init (&zh->session_lock);
288     return zh;
289 }
290
291 static int zebra_register_activate (ZebraService zh, int rw)
292 {
293     if (zh->active > 1)
294         return 0;
295     yaz_log (LOG_LOG, "zebra_register_activate shadow=%s",
296              zh->registerState ? "yes" : "no");
297
298     zh->dh = data1_create ();
299     if (!zh->dh)
300         return -1;
301     zh->bfs = bfs_create (res_get (zh->res, "register"));
302     if (!zh->bfs)
303     {
304         data1_destroy(zh->dh);
305         return -1;
306     }
307     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
308     bf_cache (zh->bfs, zh->registerState ? res_get (zh->res, "shadow") : NULL);
309     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
310     zh->recTypes = recTypes_init (zh->dh);
311     recTypes_default_handlers (zh->recTypes);
312
313     zh->records = NULL;
314     zh->zebra_maps = zebra_maps_open (zh->res);
315     zh->rank_classes = NULL;
316
317     zh->records = 0;
318     zh->dict = 0;
319     zh->sortIdx = 0;
320     zh->isams = 0;
321 #if ZMBOL
322     zh->isam = 0;
323     zh->isamc = 0;
324     zh->isamd = 0;
325 #endif
326     zh->zei = 0;
327     
328     zebraRankInstall (zh, rank1_class);
329
330     if (!res_get (zh->res, "passwd"))
331         zh->passwd_db = NULL;
332     else
333     {
334         zh->passwd_db = passwd_db_open ();
335         if (!zh->passwd_db)
336             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
337         else
338             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
339     }
340
341     if (!(zh->records = rec_open (zh->bfs, rw, 0)))
342     {
343         logf (LOG_WARN, "rec_open");
344         return -1;
345     }
346     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, rw, 0)))
347     {
348         logf (LOG_WARN, "dict_open");
349         return -1;
350     }
351     if (!(zh->sortIdx = sortIdx_open (zh->bfs, rw)))
352     {
353         logf (LOG_WARN, "sortIdx_open");
354         return -1;
355     }
356     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
357     {
358         struct ISAMS_M_s isams_m;
359         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, rw,
360                                       key_isams_m(zh->res, &isams_m))))
361         {
362             logf (LOG_WARN, "isams_open");
363             return -1;
364         }
365     }
366 #if ZMBOL
367     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
368     {
369         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, rw,
370                                   sizeof (struct it_key), zh->res)))
371         {
372             logf (LOG_WARN, "is_open");
373             return -1;
374         }
375     }
376     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
377     {
378         struct ISAMC_M_s isamc_m;
379         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
380                                     rw, key_isamc_m(zh->res, &isamc_m))))
381         {
382             logf (LOG_WARN, "isc_open");
383             return -1;
384         }
385     }
386     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
387     {
388         struct ISAMD_M_s isamd_m;
389         
390         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
391                                       rw, key_isamd_m(zh->res, &isamd_m))))
392         {
393             logf (LOG_WARN, "isamd_open");
394             return -1;
395         }
396     }
397 #endif
398     zh->zei = zebraExplain_open (zh->records, zh->dh,
399                                  zh->res, rw, 0 /* rGroup */,
400                                  explain_extract);
401     if (!zh->zei)
402     {
403         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
404         return -1;
405     }
406     zh->active = 2;
407     yaz_log (LOG_LOG, "zebra_register_activate ok");
408     return 0;
409 }
410
411 void zebra_admin_shutdown (ZebraHandle zh)
412 {
413     zebra_register_lock (zh);
414     zebraExplain_flush (zh->service->zei, 1, zh);
415     extract_index (zh);
416
417     zebra_register_unlock (zh);
418     zebra_mutex_cond_lock (&zh->service->session_lock);
419     zh->service->stop_flag = 1;
420     if (!zh->service->sessions)
421         zebra_register_deactivate(zh->service);
422     zh->service->active = 0;
423     zebra_mutex_cond_unlock (&zh->service->session_lock);
424 }
425
426 void zebra_admin_start (ZebraHandle zh)
427 {
428     ZebraService zs = zh->service;
429     zh->errCode = 0;
430     zebra_mutex_cond_lock (&zs->session_lock);
431     if (!zs->stop_flag)
432         zh->service->active = 1;
433     zebra_mutex_cond_unlock (&zs->session_lock);
434 }
435
436 static int zebra_register_deactivate (ZebraService zh)
437 {
438     zh->stop_flag = 0;
439     if (zh->active <= 1)
440         return 0;
441     yaz_log(LOG_LOG, "zebra_register_deactivate");
442     zebra_chdir (zh);
443     if (zh->records)
444     {
445         zebraExplain_close (zh->zei, 0);
446         dict_close (zh->dict);
447         sortIdx_close (zh->sortIdx);
448         if (zh->isams)
449             isams_close (zh->isams);
450 #if ZMBOL
451         if (zh->isam)
452             is_close (zh->isam);
453         if (zh->isamc)
454             isc_close (zh->isamc);
455         if (zh->isamd)
456             isamd_close (zh->isamd);
457 #endif
458         rec_close (&zh->records);
459     }
460     recTypes_destroy (zh->recTypes);
461     zebra_maps_close (zh->zebra_maps);
462     zebraRankDestroy (zh);
463     bfs_destroy (zh->bfs);
464     data1_destroy (zh->dh);
465
466     if (zh->passwd_db)
467         passwd_db_close (zh->passwd_db);
468     zh->active = 1;
469     return 0;
470 }
471
472 void zebra_stop(ZebraService zh)
473 {
474     if (!zh)
475         return ;
476     yaz_log (LOG_LOG, "zebra_stop");
477
478     assert (!zh->sessions);
479
480     zebra_mutex_cond_destroy (&zh->session_lock);
481
482     zebra_register_deactivate(zh);
483     res_close (zh->res);
484     xfree (zh->configName);
485     xfree (zh);
486 }
487
488 void zebra_close (ZebraHandle zh)
489 {
490     ZebraService zs = zh->service;
491     struct zebra_session **sp;
492     if (!zh)
493         return ;
494     resultSetDestroy (zh, -1, 0, 0);
495
496     if (zh->key_buf)
497     {
498         xfree (zh->key_buf);
499         zh->key_buf = 0;
500     }
501     xfree (zh->admin_databaseName);
502     zebra_mutex_cond_lock (&zs->session_lock);
503     sp = &zs->sessions;
504     while (1)
505     {
506         assert (*sp);
507         if (*sp == zh)
508         {
509             *sp = (*sp)->next;
510             break;
511         }
512         sp = &(*sp)->next;
513     }
514     if (!zs->sessions && zs->stop_flag)
515         zebra_register_deactivate(zs);
516     zebra_mutex_cond_unlock (&zs->session_lock);
517     xfree (zh);
518 }
519
520 struct map_baseinfo {
521     ZebraHandle zh;
522     NMEM mem;
523     int num_bases;
524     char **basenames;
525     int new_num_bases;
526     char **new_basenames;
527     int new_num_max;
528 };
529         
530 void map_basenames_func (void *vp, const char *name, const char *value)
531 {
532     struct map_baseinfo *p = (struct map_baseinfo *) vp;
533     int i, no;
534     char fromdb[128], todb[8][128];
535     
536     no =
537         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
538                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
539                 todb[5], todb[6], todb[7]);
540     if (no < 2)
541         return ;
542     no--;
543     for (i = 0; i<p->num_bases; i++)
544         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
545         {
546             p->basenames[i] = 0;
547             for (i = 0; i < no; i++)
548             {
549                 if (p->new_num_bases == p->new_num_max)
550                     return;
551                 p->new_basenames[(p->new_num_bases)++] = 
552                     nmem_strdup (p->mem, todb[i]);
553             }
554             return;
555         }
556 }
557
558 void map_basenames (ZebraHandle zh, ODR stream,
559                     int *num_bases, char ***basenames)
560 {
561     struct map_baseinfo info;
562     struct map_baseinfo *p = &info;
563     int i;
564
565     info.zh = zh;
566     info.num_bases = *num_bases;
567     info.basenames = *basenames;
568     info.new_num_max = 128;
569     info.new_num_bases = 0;
570     info.new_basenames = (char **)
571         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
572     info.mem = stream->mem;
573
574     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
575     
576     for (i = 0; i<p->num_bases; i++)
577         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
578         {
579             p->new_basenames[(p->new_num_bases)++] = 
580                 nmem_strdup (p->mem, p->basenames[i]);
581         }
582     *num_bases = info.new_num_bases;
583     *basenames = info.new_basenames;
584     for (i = 0; i<*num_bases; i++)
585         logf (LOG_LOG, "base %s", (*basenames)[i]);
586 }
587
588 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
589                        Z_RPNQuery *query, int num_bases, char **basenames, 
590                        const char *setname)
591 {
592     zh->hits = 0;
593     if (zebra_register_lock (zh))
594         return;
595     map_basenames (zh, stream, &num_bases, &basenames);
596     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
597
598     zebra_register_unlock (zh);
599
600     logf(LOG_APP,"SEARCH:%d:",zh->hits);
601 }
602
603 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
604                              const char *setname, Z_RecordComposition *comp,
605                              oid_value input_format, int num_recs,
606                              ZebraRetrievalRecord *recs)
607 {
608     ZebraPosSet poset;
609     int i, *pos_array;
610
611     if (zebra_register_lock (zh))
612         return;
613     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
614     for (i = 0; i<num_recs; i++)
615         pos_array[i] = recs[i].position;
616     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
617     if (!poset)
618     {
619         logf (LOG_DEBUG, "zebraPosSetCreate error");
620         zh->errCode = 30;
621         zh->errString = nmem_strdup (stream->mem, setname);
622     }
623     else
624     {
625         for (i = 0; i<num_recs; i++)
626         {
627             if (!poset[i].sysno)
628             {
629                 char num_str[20];
630
631                 sprintf (num_str, "%d", pos_array[i]);  
632                 zh->errCode = 13;
633                 zh->errString = nmem_strdup (stream->mem, num_str);
634                 break;
635             }
636             else
637             {
638                 recs[i].errCode =
639                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
640                                         stream, input_format, comp,
641                                         &recs[i].format, &recs[i].buf,
642                                         &recs[i].len,
643                                         &recs[i].base);
644                 recs[i].errString = NULL;
645             }
646         }
647         zebraPosSetDestroy (zh, poset, num_recs);
648     }
649     zebra_register_unlock (zh);
650     xfree (pos_array);
651 }
652
653 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
654                  oid_value attributeset,
655                  int num_bases, char **basenames,
656                  int *position, int *num_entries, ZebraScanEntry **entries,
657                  int *is_partial)
658 {
659     if (zebra_register_lock (zh))
660     {
661         *entries = 0;
662         *num_entries = 0;
663         return;
664     }
665     map_basenames (zh, stream, &num_bases, &basenames);
666     rpn_scan (zh, stream, zapt, attributeset,
667               num_bases, basenames, position,
668               num_entries, entries, is_partial);
669     zebra_register_unlock (zh);
670 }
671
672 void zebra_sort (ZebraHandle zh, ODR stream,
673                  int num_input_setnames, const char **input_setnames,
674                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
675                  int *sort_status)
676 {
677     if (zebra_register_lock (zh))
678         return;
679     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
680                    output_setname, sort_sequence, sort_status);
681     zebra_register_unlock (zh);
682 }
683
684 int zebra_deleleResultSet(ZebraHandle zh, int function,
685                           int num_setnames, char **setnames,
686                           int *statuses)
687 {
688     int i, status;
689     if (zebra_register_lock (zh))
690         return Z_DeleteStatus_systemProblemAtTarget;
691     switch (function)
692     {
693     case Z_DeleteRequest_list:
694         resultSetDestroy (zh, num_setnames, setnames, statuses);
695         break;
696     case Z_DeleteRequest_all:
697         resultSetDestroy (zh, -1, 0, statuses);
698         break;
699     }
700     zebra_register_unlock (zh);
701     status = Z_DeleteStatus_success;
702     for (i = 0; i<num_setnames; i++)
703         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
704             status = statuses[i];
705     return status;
706 }
707
708 int zebra_errCode (ZebraHandle zh)
709 {
710     return zh->errCode;
711 }
712
713 const char *zebra_errString (ZebraHandle zh)
714 {
715     return diagbib1_str (zh->errCode);
716 }
717
718 char *zebra_errAdd (ZebraHandle zh)
719 {
720     return zh->errString;
721 }
722
723 int zebra_hits (ZebraHandle zh)
724 {
725     return zh->hits;
726 }
727
728 int zebra_auth (ZebraService zh, const char *user, const char *pass)
729 {
730     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
731     {
732         logf(LOG_APP,"AUTHOK:%s", user?user:"ANONYMOUS");
733         return 0;
734     }
735
736     logf(LOG_APP,"AUTHFAIL:%s", user?user:"ANONYMOUS");
737     return 1;
738 }
739
740 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
741 {
742     if (zebra_register_lock (zh))
743         return;
744     xfree (zh->admin_databaseName);
745     zh->admin_databaseName = xstrdup(database);
746     zebra_register_unlock(zh);
747 }
748
749 void zebra_admin_import_end (ZebraHandle zh)
750 {
751     zebraExplain_flush (zh->service->zei, 1, zh);
752     extract_index (zh);
753 }
754
755 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
756 {
757     int sysno;
758     int i;
759     if (zebra_register_lock (zh))
760         return;
761     for (i = 0; i<segment->num_segmentRecords; i++)
762     {
763         Z_NamePlusRecord *npr = segment->segmentRecords[i];
764         const char *databaseName = npr->databaseName;
765
766         if (!databaseName)
767             databaseName = zh->admin_databaseName;
768         printf ("--------------%d--------------------\n", i);
769         if (npr->which == Z_NamePlusRecord_intermediateFragment)
770         {
771             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
772             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
773             {
774                 Odr_oct *oct = fragment->u.notExternallyTagged;
775                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
776                         oct->buf);
777                 
778                 sysno = 0;
779                 extract_rec_in_mem (zh, "grs.sgml",
780                                     oct->buf, oct->len,
781                                     databaseName,
782                                     0 /* delete_flag */,
783                                     0 /* test_mode */,
784                                     &sysno /* sysno */,
785                                     1 /* store_keys */,
786                                     1 /* store_data */,
787                                     0 /* match criteria */);
788             }
789         }
790     }
791     zebra_register_unlock(zh);
792 }
793
794 void zebra_admin_create (ZebraHandle zh, const char *database)
795 {
796     ZebraService zs = zh->service;
797     if (zebra_register_lock(zh))
798     {
799         zh->errCode = 1019;
800         return;
801     }
802     /* announce database */
803     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
804     {
805         zh->errCode = 224;
806         zh->errString = "Database already exist";
807     }
808     zebra_register_unlock(zh);
809 }
810
811 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
812                        const char *input_str, int input_len,
813                        char *output_str, int output_len)
814 {
815     WRBUF wrbuf;
816     if (!zh->service->zebra_maps)
817         return -1;
818     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
819                           input_str, input_len);
820     if (!wrbuf)
821         return -2;
822     if (wrbuf_len(wrbuf) >= output_len)
823         return -3;
824     if (wrbuf_len(wrbuf))
825         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
826     output_str[wrbuf_len(wrbuf)] = '\0';
827     return wrbuf_len(wrbuf);
828 }
829
830 static void extract_init (struct recExtractCtrl *p, RecWord *w)
831 {
832     w->zebra_maps = p->zebra_maps;
833     w->seqnos = p->seqno;
834     w->attrSet = VAL_BIB1;
835     w->attrUse = 1016;
836     w->reg_type = 'w';
837     w->extractCtrl = p;
838 }
839
840 static void extract_add_index_string (RecWord *p, const char *string,
841                                       int length)
842 {
843     char *dst;
844     unsigned char attrSet;
845     unsigned short attrUse;
846     int lead = 0;
847     int diff = 0;
848     int *pseqno = &p->seqnos[p->reg_type];
849     ZebraHandle zh = p->extractCtrl->handle;
850     struct recKeys *keys = &zh->keys;
851
852     if (keys->buf_used+1024 > keys->buf_max)
853     {
854         char *b;
855
856         b = (char *) xmalloc (keys->buf_max += 128000);
857         if (keys->buf_used > 0)
858             memcpy (b, keys->buf, keys->buf_used);
859         xfree (keys->buf);
860         keys->buf = b;
861     }
862     dst = keys->buf + keys->buf_used;
863
864     attrSet = p->attrSet;
865     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
866         lead |= 1;
867     else
868         keys->prevAttrSet = attrSet;
869     attrUse = p->attrUse;
870     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
871         lead |= 2;
872     else
873         keys->prevAttrUse = attrUse;
874 #if 1
875     diff = 1 + *pseqno - keys->prevSeqNo;
876     if (diff >= 1 && diff <= 15)
877         lead |= (diff << 2);
878     else
879         diff = 0;
880 #endif
881     keys->prevSeqNo = *pseqno;
882     
883     *dst++ = lead;
884
885     if (!(lead & 1))
886     {
887         memcpy (dst, &attrSet, sizeof(attrSet));
888         dst += sizeof(attrSet);
889     }
890     if (!(lead & 2))
891     {
892         memcpy (dst, &attrUse, sizeof(attrUse));
893         dst += sizeof(attrUse);
894     }
895     *dst++ = p->reg_type;
896     memcpy (dst, string, length);
897     dst += length;
898     *dst++ = '\0';
899
900     if (!diff)
901     {
902         memcpy (dst, pseqno, sizeof(*pseqno));
903         dst += sizeof(*pseqno);
904     }
905     keys->buf_used = dst - keys->buf;
906     if (*pseqno)
907         (*pseqno)++;
908 }
909
910 static void extract_add_sort_string (RecWord *p, const char *string,
911                                      int length)
912 {
913     struct sortKey *sk;
914     ZebraHandle zh = p->extractCtrl->handle;
915     struct sortKey *sortKeys = zh->sortKeys;
916
917     for (sk = sortKeys; sk; sk = sk->next)
918         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
919             return;
920
921     sk = (struct sortKey *) xmalloc (sizeof(*sk));
922     sk->next = sortKeys;
923     sortKeys = sk;
924
925     sk->string = (char *) xmalloc (length);
926     sk->length = length;
927     memcpy (sk->string, string, length);
928
929     sk->attrSet = p->attrSet;
930     sk->attrUse = p->attrUse;
931 }
932
933 static void extract_add_string (RecWord *p, const char *string, int length)
934 {
935     assert (length > 0);
936     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
937         extract_add_sort_string (p, string, length);
938     else
939         extract_add_index_string (p, string, length);
940 }
941
942 static void extract_add_incomplete_field (RecWord *p)
943 {
944     const char *b = p->string;
945     int remain = p->length;
946     const char **map = 0;
947
948     if (remain > 0)
949         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
950
951     while (map)
952     {
953         char buf[IT_MAX_WORD+1];
954         int i, remain;
955
956         /* Skip spaces */
957         while (map && *map && **map == *CHR_SPACE)
958         {
959             remain = p->length - (b - p->string);
960             if (remain > 0)
961                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
962             else
963                 map = 0;
964         }
965         if (!map)
966             break;
967         i = 0;
968         while (map && *map && **map != *CHR_SPACE)
969         {
970             const char *cp = *map;
971
972             while (i < IT_MAX_WORD && *cp)
973                 buf[i++] = *(cp++);
974             remain = p->length - (b - p->string);
975             if (remain > 0)
976                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
977             else
978                 map = 0;
979         }
980         if (!i)
981             return;
982         extract_add_string (p, buf, i);
983     }
984     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
985 }
986
987 static void extract_add_complete_field (RecWord *p)
988 {
989     const char *b = p->string;
990     char buf[IT_MAX_WORD+1];
991     const char **map = 0;
992     int i = 0, remain = p->length;
993
994     if (remain > 0)
995         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
996
997     while (remain > 0 && i < IT_MAX_WORD)
998     {
999         while (map && *map && **map == *CHR_SPACE)
1000         {
1001             remain = p->length - (b - p->string);
1002             if (remain > 0)
1003                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
1004             else
1005                 map = 0;
1006         }
1007         if (!map)
1008             break;
1009
1010         if (i && i < IT_MAX_WORD)
1011             buf[i++] = *CHR_SPACE;
1012         while (map && *map && **map != *CHR_SPACE)
1013         {
1014             const char *cp = *map;
1015
1016             if (i >= IT_MAX_WORD)
1017                 break;
1018             while (i < IT_MAX_WORD && *cp)
1019                 buf[i++] = *(cp++);
1020             remain = p->length  - (b - p->string);
1021             if (remain > 0)
1022                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
1023                                         remain);
1024             else
1025                 map = 0;
1026         }
1027     }
1028     if (!i)
1029         return;
1030     extract_add_string (p, buf, i);
1031 }
1032
1033 static void extract_token_add (RecWord *p)
1034 {
1035     WRBUF wrbuf;
1036     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
1037                                p->string, p->length)))
1038     {
1039         p->string = wrbuf_buf(wrbuf);
1040         p->length = wrbuf_len(wrbuf);
1041     }
1042     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
1043         extract_add_complete_field (p);
1044     else
1045         extract_add_incomplete_field(p);
1046 }
1047
1048 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
1049 {
1050     ZebraHandle zh = (ZebraHandle) (p->handle);
1051     zebraExplain_addSchema (zh->service->zei, oid);
1052 }
1053
1054 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
1055                                    int cmd, struct sortKey **skp)
1056 {
1057     struct sortKey *sk = *skp;
1058     SortIdx sortIdx = zh->service->sortIdx;
1059
1060     sortIdx_sysno (sortIdx, sysno);
1061     while (sk)
1062     {
1063         struct sortKey *sk_next = sk->next;
1064         sortIdx_type (sortIdx, sk->attrUse);
1065         sortIdx_add (sortIdx, sk->string, sk->length);
1066         xfree (sk->string);
1067         xfree (sk);
1068         sk = sk_next;
1069     }
1070     *skp = 0;
1071 }
1072
1073 struct encode_info {
1074     int  sysno;
1075     int  seqno;
1076     int  cmd;
1077     char buf[768];
1078 };
1079
1080 void encode_key_init (struct encode_info *i)
1081 {
1082     i->sysno = 0;
1083     i->seqno = 0;
1084     i->cmd = -1;
1085 }
1086
1087 char *encode_key_int (int d, char *bp)
1088 {
1089     if (d <= 63)
1090         *bp++ = d;
1091     else if (d <= 16383)
1092     {
1093         *bp++ = 64 + (d>>8);
1094         *bp++ = d  & 255;
1095     }
1096     else if (d <= 4194303)
1097     {
1098         *bp++ = 128 + (d>>16);
1099         *bp++ = (d>>8) & 255;
1100         *bp++ = d & 255;
1101     }
1102     else
1103     {
1104         *bp++ = 192 + (d>>24);
1105         *bp++ = (d>>16) & 255;
1106         *bp++ = (d>>8) & 255;
1107         *bp++ = d & 255;
1108     }
1109     return bp;
1110 }
1111
1112 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1113 {
1114     struct it_key key;
1115     char *bp = i->buf;
1116
1117     while ((*bp++ = *k++))
1118         ;
1119     memcpy (&key, k+1, sizeof(struct it_key));
1120     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1121     if (i->sysno != key.sysno)
1122     {
1123         i->sysno = key.sysno;
1124         i->seqno = 0;
1125     }
1126     else if (!i->seqno && !key.seqno && i->cmd == *k)
1127         return;
1128     bp = encode_key_int (key.seqno - i->seqno, bp);
1129     i->seqno = key.seqno;
1130     i->cmd = *k;
1131     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1132     {
1133         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1134         exit (1);
1135     }
1136 }
1137
1138 static void extract_flushWriteKeys (ZebraHandle zh)
1139 {
1140     FILE *outf;
1141     char out_fname[200];
1142     char *prevcp, *cp;
1143     struct encode_info encode_info;
1144     int ptr_i = zh->ptr_i;
1145 #if SORT_EXTRA
1146     int i;
1147 #endif
1148     if (!zh->key_buf || ptr_i <= 0)
1149         return;
1150
1151     (zh->key_file_no)++;
1152     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1153 #if !SORT_EXTRA
1154     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1155             key_qsort_compare);
1156     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1157
1158     if (!(outf = fopen (out_fname, "wb")))
1159     {
1160         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1161         exit (1);
1162     }
1163     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1164     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1165     
1166     encode_key_init (&encode_info);
1167     encode_key_write (cp, &encode_info, outf);
1168     
1169     while (--ptr_i > 0)
1170     {
1171         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1172         if (strcmp (cp, prevcp))
1173         {
1174             encode_key_init (&encode_info);
1175             encode_key_write (cp, &encode_info, outf);
1176             prevcp = cp;
1177         }
1178         else
1179             encode_key_write (cp + strlen(cp), &encode_info, outf);
1180     }
1181 #else
1182     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1183     extract_get_fname_tmp (out_fname, key_file_no);
1184
1185     if (!(outf = fopen (out_fname, "wb")))
1186     {
1187         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1188         exit (1);
1189     }
1190     logf (LOG_LOG, "writing section %d", key_file_no);
1191     i = ptr_i;
1192     prevcp =  key_buf[ptr_top-i];
1193     while (1)
1194         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1195         {
1196             key_y_len = strlen(prevcp)+1;
1197 #if 0
1198             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1199                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1200 #endif
1201             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1202                                    sizeof(char*), key_y_compare);
1203             cp = key_buf[ptr_top-ptr_i];
1204             --key_y_len;
1205             encode_key_init (&encode_info);
1206             encode_key_write (cp, &encode_info, outf);
1207             while (--ptr_i > i)
1208             {
1209                 cp = key_buf[ptr_top-ptr_i];
1210                 encode_key_write (cp+key_y_len, &encode_info, outf);
1211             }
1212             if (!i)
1213                 break;
1214             prevcp = key_buf[ptr_top-ptr_i];
1215         }
1216 #endif
1217     if (fclose (outf))
1218     {
1219         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1220         exit (1);
1221     }
1222     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1223     zh->ptr_i = 0;
1224     zh->key_buf_used = 0;
1225 }
1226
1227 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1228                                      int cmd, struct recKeys *reckeys)
1229 {
1230     unsigned char attrSet = (unsigned char) -1;
1231     unsigned short attrUse = (unsigned short) -1;
1232     int seqno = 0;
1233     int off = 0;
1234     ZebraExplainInfo zei = zh->service->zei;
1235
1236     if (!zh->key_buf)
1237     {
1238         int mem = 8*1024*1024;
1239         zh->key_buf = (char**) xmalloc (mem);
1240         zh->ptr_top = mem/sizeof(char*);
1241         zh->ptr_i = 0;
1242         zh->key_buf_used = 0;
1243         zh->key_file_no = 0;
1244     }
1245     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1246     while (off < reckeys->buf_used)
1247     {
1248         const char *src = reckeys->buf + off;
1249         struct it_key key;
1250         int lead, ch;
1251     
1252         lead = *src++;
1253
1254         if (!(lead & 1))
1255         {
1256             memcpy (&attrSet, src, sizeof(attrSet));
1257             src += sizeof(attrSet);
1258         }
1259         if (!(lead & 2))
1260         {
1261             memcpy (&attrUse, src, sizeof(attrUse));
1262             src += sizeof(attrUse);
1263         }
1264         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1265             extract_flushWriteKeys (zh);
1266         ++(zh->ptr_i);
1267         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1268             (char*)zh->key_buf + zh->key_buf_used;
1269
1270         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1271         if (ch < 0)
1272             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1273         assert (ch > 0);
1274         zh->key_buf_used +=
1275             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1276
1277         while (*src)
1278             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1279         src++;
1280         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1281         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1282
1283         if (lead & 60)
1284             seqno += ((lead>>2) & 15)-1;
1285         else
1286         {
1287             memcpy (&seqno, src, sizeof(seqno));
1288             src += sizeof(seqno);
1289         }
1290         key.seqno = seqno;
1291         key.sysno = sysno;
1292         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1293         (zh->key_buf_used) += sizeof(key);
1294         off = src - reckeys->buf;
1295     }
1296     assert (off == reckeys->buf_used);
1297 }
1298
1299 static void extract_index (ZebraHandle zh)
1300 {
1301     extract_flushWriteKeys (zh);
1302     zebra_index_merge (zh);
1303 }
1304
1305 static int explain_extract (void *handle, Record rec, data1_node *n)
1306 {
1307     ZebraHandle zh = (ZebraHandle) handle;
1308     struct recExtractCtrl extractCtrl;
1309     int i;
1310
1311     if (zebraExplain_curDatabase (zh->service->zei,
1312                                   rec->info[recInfo_databaseName]))
1313     {
1314         abort();
1315         if (zebraExplain_newDatabase (zh->service->zei,
1316                                       rec->info[recInfo_databaseName], 0))
1317             abort ();
1318     }
1319
1320     zh->keys.buf_used = 0;
1321     zh->keys.prevAttrUse = -1;
1322     zh->keys.prevAttrSet = -1;
1323     zh->keys.prevSeqNo = 0;
1324     zh->sortKeys = 0;
1325     
1326     extractCtrl.init = extract_init;
1327     extractCtrl.tokenAdd = extract_token_add;
1328     extractCtrl.schemaAdd = extract_schema_add;
1329     extractCtrl.dh = zh->service->dh;
1330     for (i = 0; i<256; i++)
1331         extractCtrl.seqno[i] = 0;
1332     extractCtrl.zebra_maps = zh->service->zebra_maps;
1333     extractCtrl.flagShowRecords = 0;
1334     extractCtrl.handle = handle;
1335     
1336     grs_extract_tree(&extractCtrl, n);
1337
1338     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1339
1340     if (rec->size[recInfo_delKeys])
1341     {
1342         struct recKeys delkeys;
1343         struct sortKey *sortKeys = 0;
1344
1345         delkeys.buf_used = rec->size[recInfo_delKeys];
1346         delkeys.buf = rec->info[recInfo_delKeys];
1347         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1348         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1349     }
1350     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1351     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1352
1353     xfree (rec->info[recInfo_delKeys]);
1354     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1355     rec->info[recInfo_delKeys] = zh->keys.buf;
1356     zh->keys.buf = NULL;
1357     zh->keys.buf_max = 0;
1358     return 0;
1359 }
1360
1361 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1362                                const char *buf, size_t buf_size,
1363                                const char *databaseName, int delete_flag,
1364                                int test_mode, int *sysno,
1365                                int store_keys, int store_data,
1366                                const char *match_criteria)
1367 {
1368     RecordAttr *recordAttr;
1369     struct recExtractCtrl extractCtrl;
1370     int i, r;
1371     RecType recType;
1372     char subType[1024];
1373     void *clientData;
1374     const char *fname = "<no file>";
1375     Record rec;
1376     long recordOffset = 0;
1377     struct zebra_fetch_control fc;
1378
1379     fc.fd = -1;
1380     fc.record_int_buf = buf;
1381     fc.record_int_len = buf_size;
1382     fc.record_int_pos = 0;
1383     fc.offset_end = 0;
1384     fc.record_offset = 0;
1385
1386     extractCtrl.offset = 0;
1387     extractCtrl.readf = zebra_record_int_read;
1388     extractCtrl.seekf = zebra_record_int_seek;
1389     extractCtrl.tellf = zebra_record_int_tell;
1390     extractCtrl.endf = zebra_record_int_end;
1391     extractCtrl.fh = &fc;
1392
1393     /* announce database */
1394     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1395     {
1396         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1397             return 0;
1398     }
1399     if (!(recType =
1400           recType_byName (zh->service->recTypes, recordType, subType,
1401                           &clientData)))
1402     {
1403         logf (LOG_WARN, "No such record type: %s", recordType);
1404         return 0;
1405     }
1406
1407     zh->keys.buf_used = 0;
1408     zh->keys.prevAttrUse = -1;
1409     zh->keys.prevAttrSet = -1;
1410     zh->keys.prevSeqNo = 0;
1411     zh->sortKeys = 0;
1412
1413     extractCtrl.subType = subType;
1414     extractCtrl.init = extract_init;
1415     extractCtrl.tokenAdd = extract_token_add;
1416     extractCtrl.schemaAdd = extract_schema_add;
1417     extractCtrl.dh = zh->service->dh;
1418     extractCtrl.handle = zh;
1419     extractCtrl.zebra_maps = zh->service->zebra_maps;
1420     extractCtrl.flagShowRecords = 0;
1421     for (i = 0; i<256; i++)
1422     {
1423         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1424             extractCtrl.seqno[i] = 1;
1425         else
1426             extractCtrl.seqno[i] = 0;
1427     }
1428
1429     r = (*recType->extract)(clientData, &extractCtrl);
1430
1431     if (r == RECCTRL_EXTRACT_EOF)
1432         return 0;
1433     else if (r == RECCTRL_EXTRACT_ERROR)
1434     {
1435         /* error occured during extraction ... */
1436 #if 1
1437         yaz_log (LOG_WARN, "extract error");
1438 #else
1439         if (rGroup->flagRw &&
1440             records_processed < rGroup->fileVerboseLimit)
1441         {
1442             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1443                   fname, (long) recordOffset);
1444         }
1445 #endif
1446         return 0;
1447     }
1448     if (zh->keys.buf_used == 0)
1449     {
1450         /* the extraction process returned no information - the record
1451            is probably empty - unless flagShowRecords is in use */
1452         if (test_mode)
1453             return 1;
1454         logf (LOG_WARN, "No keys generated for record");
1455         logf (LOG_WARN, " The file is probably empty");
1456         return 1;
1457     }
1458     /* match criteria */
1459
1460     if (! *sysno)
1461     {
1462         /* new record */
1463         if (delete_flag)
1464         {
1465             logf (LOG_LOG, "delete %s %s %ld", recordType,
1466                   fname, (long) recordOffset);
1467             logf (LOG_WARN, "cannot delete record above (seems new)");
1468             return 1;
1469         }
1470         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1471               (long) recordOffset);
1472         rec = rec_new (zh->service->records);
1473
1474         *sysno = rec->sysno;
1475
1476         recordAttr = rec_init_attr (zh->service->zei, rec);
1477
1478 #if 0
1479         if (matchStr)
1480         {
1481             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1482         }
1483 #endif
1484         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1485         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1486     }
1487     else
1488     {
1489         /* record already exists */
1490         struct recKeys delkeys;
1491
1492         rec = rec_get (zh->service->records, *sysno);
1493         assert (rec);
1494         
1495         recordAttr = rec_init_attr (zh->service->zei, rec);
1496
1497         if (recordAttr->runNumber ==
1498             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1499         {
1500             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1501                   fname, (long) recordOffset);
1502             rec_rm (&rec);
1503             return 1;
1504         }
1505         delkeys.buf_used = rec->size[recInfo_delKeys];
1506         delkeys.buf = rec->info[recInfo_delKeys];
1507         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1508         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1509         if (delete_flag)
1510         {
1511             /* record going to be deleted */
1512             if (!delkeys.buf_used)
1513             {
1514                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1515                       fname, (long) recordOffset);
1516                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1517             }
1518             else
1519             {
1520                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1521                       fname, (long) recordOffset);
1522 #if 0
1523                 if (matchStr)
1524                     dict_delete (matchDict, matchStr);
1525 #endif
1526                 rec_del (zh->service->records, &rec);
1527             }
1528             rec_rm (&rec);
1529             return 1;
1530         }
1531         else
1532         {
1533             /* record going to be updated */
1534             if (!delkeys.buf_used)
1535             {
1536                 logf (LOG_LOG, "update %s %s %ld", recordType,
1537                       fname, (long) recordOffset);
1538                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1539             }
1540             else
1541             {
1542                 logf (LOG_LOG, "update %s %s %ld", recordType,
1543                       fname, (long) recordOffset);
1544                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1545             }
1546         }
1547     }
1548     /* update file type */
1549     xfree (rec->info[recInfo_fileType]);
1550     rec->info[recInfo_fileType] =
1551         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1552
1553     /* update filename */
1554     xfree (rec->info[recInfo_filename]);
1555     rec->info[recInfo_filename] =
1556         rec_strdup (fname, &rec->size[recInfo_filename]);
1557
1558     /* update delete keys */
1559     xfree (rec->info[recInfo_delKeys]);
1560     if (zh->keys.buf_used > 0 && store_keys == 1)
1561     {
1562         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1563         rec->info[recInfo_delKeys] = zh->keys.buf;
1564         zh->keys.buf = NULL;
1565         zh->keys.buf_max = 0;
1566     }
1567     else
1568     {
1569         rec->info[recInfo_delKeys] = NULL;
1570         rec->size[recInfo_delKeys] = 0;
1571     }
1572
1573     /* save file size of original record */
1574     zebraExplain_recordBytesIncrement (zh->service->zei,
1575                                        - recordAttr->recordSize);
1576 #if 0
1577     recordAttr->recordSize = fi->file_moffset - recordOffset;
1578     if (!recordAttr->recordSize)
1579         recordAttr->recordSize = fi->file_max - recordOffset;
1580 #else
1581     recordAttr->recordSize = buf_size;
1582 #endif
1583     zebraExplain_recordBytesIncrement (zh->service->zei,
1584                                        recordAttr->recordSize);
1585
1586     /* set run-number for this record */
1587     recordAttr->runNumber =
1588         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1589
1590     /* update store data */
1591     xfree (rec->info[recInfo_storeData]);
1592     if (store_data == 1)
1593     {
1594         rec->size[recInfo_storeData] = recordAttr->recordSize;
1595         rec->info[recInfo_storeData] = (char *)
1596             xmalloc (recordAttr->recordSize);
1597 #if 1
1598         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1599 #else
1600         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1601         {
1602             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1603                   (long) recordOffset, fname);
1604             exit (1);
1605         }
1606         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1607             < recordAttr->recordSize)
1608         {
1609             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1610                   recordAttr->recordSize, fname);
1611             exit (1);
1612         }
1613 #endif
1614     }
1615     else
1616     {
1617         rec->info[recInfo_storeData] = NULL;
1618         rec->size[recInfo_storeData] = 0;
1619     }
1620     /* update database name */
1621     xfree (rec->info[recInfo_databaseName]);
1622     rec->info[recInfo_databaseName] =
1623         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1624
1625     /* update offset */
1626     recordAttr->recordOffset = recordOffset;
1627     
1628     /* commit this record */
1629     rec_put (zh->service->records, &rec);
1630
1631     return 0;
1632 }