b8181a5177ac027d93ab77fea68a70b3589e71ef
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.33  2000-05-18 12:01:36  adam
7  * System call times(2) used again. More 64-bit fixes.
8  *
9  * Revision 1.32  2000/04/19 14:35:59  adam
10  * WIN32 update (this version is known not to work on Windows).
11  *
12  * Revision 1.31  2000/04/05 10:07:02  adam
13  * Minor zebra compile fix.
14  *
15  * Revision 1.30  2000/04/05 09:49:35  adam
16  * On Unix, zebra/z'mbol uses automake.
17  *
18  * Revision 1.29  2000/03/20 19:08:36  adam
19  * Added remote record import using Z39.50 extended services and Segment
20  * Requests.
21  *
22  * Revision 1.28  2000/03/15 15:00:30  adam
23  * First work on threaded version.
24  *
25  * Revision 1.27  2000/02/24 12:31:17  adam
26  * Added zebra_string_norm.
27  *
28  * Revision 1.26  1999/11/30 13:48:03  adam
29  * Improved installation. Updated for inclusion of YAZ header files.
30  *
31  * Revision 1.25  1999/11/04 15:00:45  adam
32  * Implemented delete result set(s).
33  *
34  * Revision 1.24  1999/10/14 14:33:50  adam
35  * Added truncation 5=106.
36  *
37  * Revision 1.23  1999/09/07 11:36:32  adam
38  * Minor changes.
39  *
40  * Revision 1.22  1999/08/02 10:13:47  adam
41  * Fixed bug regarding zebra_hits.
42  *
43  * Revision 1.21  1999/07/14 10:59:26  adam
44  * Changed functions isc_getmethod, isams_getmethod.
45  * Improved fatal error handling (such as missing EXPLAIN schema).
46  *
47  * Revision 1.20  1999/07/06 12:28:04  adam
48  * Updated record index structure. Format includes version ID. Compression
49  * algorithm ID is stored for each record block.
50  *
51  * Revision 1.19  1999/05/26 07:49:13  adam
52  * C++ compilation.
53  *
54  * Revision 1.18  1999/05/15 14:36:38  adam
55  * Updated dictionary. Implemented "compression" of dictionary.
56  *
57  * Revision 1.17  1999/05/12 13:08:06  adam
58  * First version of ISAMS.
59  *
60  * Revision 1.16  1999/02/19 10:38:30  adam
61  * Implemented chdir-setting.
62  *
63  * Revision 1.15  1999/02/17 12:18:12  adam
64  * Fixed zebra_close so that a NULL pointer is ignored.
65  *
66  * Revision 1.14  1999/02/02 14:51:11  adam
67  * Updated WIN32 code specific sections. Changed header.
68  *
69  * Revision 1.13  1998/12/16 12:23:30  adam
70  * Added facility for database name mapping using resource mapdb.
71  *
72  * Revision 1.12  1998/11/16 10:18:10  adam
73  * Better error reporting for result sets.
74  *
75  * Revision 1.11  1998/10/16 08:14:34  adam
76  * Updated record control system.
77  *
78  * Revision 1.10  1998/09/22 10:03:42  adam
79  * Changed result sets to be persistent in the sense that they can
80  * be re-searched if needed.
81  * Fixed memory leak in rsm_or.
82  *
83  * Revision 1.9  1998/09/02 13:53:17  adam
84  * Extra parameter decode added to search routines to implement
85  * persistent queries.
86  *
87  * Revision 1.8  1998/08/24 17:29:23  adam
88  * Minor changes.
89  *
90  * Revision 1.7  1998/06/24 12:16:13  adam
91  * Support for relations on text operands. Open range support in
92  * DFA module (i.e. [-j], [g-]).
93  *
94  * Revision 1.6  1998/06/22 11:36:47  adam
95  * Added authentication check facility to zebra.
96  *
97  * Revision 1.5  1998/06/13 00:14:08  adam
98  * Minor changes.
99  *
100  * Revision 1.4  1998/06/12 12:22:12  adam
101  * Work on Zebra API.
102  *
103  * Revision 1.3  1998/05/27 16:57:44  adam
104  * Zebra returns surrogate diagnostic for single records when
105  * appropriate.
106  *
107  * Revision 1.2  1998/05/20 10:12:19  adam
108  * Implemented automatic EXPLAIN database maintenance.
109  * Modified Zebra to work with ASN.1 compiled version of YAZ.
110  *
111  * Revision 1.1  1998/03/05 08:45:13  adam
112  * New result set model and modular ranking system. Moved towards
113  * descent server API. System information stored as "SGML" records.
114  *
115  */
116
117 #include <assert.h>
118 #include <stdio.h>
119 #ifdef WIN32
120 #include <io.h>
121 #include <process.h>
122 #include <direct.h>
123 #else
124 #include <unistd.h>
125 #endif
126
127 #include <yaz/diagbib1.h>
128 #include "zserver.h"
129 #include <charmap.h>
130
131 static void zebra_chdir (ZebraService zh)
132 {
133     const char *dir = res_get (zh->res, "chdir");
134     if (!dir)
135         return;
136     logf (LOG_DEBUG, "chdir %s", dir);
137 #ifdef WIN32
138     _chdir(dir);
139 #else
140     chdir (dir);
141 #endif
142 }
143
144 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
145                                const char *buf, size_t buf_size,
146                                const char *databaseName, int delete_flag,
147                                int test_mode, int *sysno,
148                                int store_keys, int store_data,
149                                const char *match_criteria);
150
151 static int explain_extract (void *handle, Record rec, data1_node *n);
152 static void extract_index (ZebraHandle zh);
153
154 static void zebra_register_unlock (ZebraHandle zh);
155
156 static int zebra_register_lock (ZebraHandle zh)
157 {
158     zh->errCode = 0;
159     zh->errString = 0;
160     if (!zh->service->active)
161     {
162         zh->errCode = 1019;
163         return 1;
164     }
165 #if HAVE_SYS_TIMES_H
166     times (&zh->tms1);
167 #endif
168     return 0;
169 }
170
171 static void zebra_register_unlock (ZebraHandle zh)
172 {
173 #if HAVE_SYS_TIMES_H
174     times (&zh->tms2);
175     logf (LOG_LOG, "user/system: %ld/%ld",
176                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
177                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
178
179 #endif
180 }
181
182 ZebraHandle zebra_open (ZebraService zs)
183 {
184     ZebraHandle zh;
185
186     assert (zs);
187     if (zs->stop_flag)
188         return 0;
189
190     zh = (ZebraHandle) xmalloc (sizeof(*zh));
191
192     zh->service = zs;
193     zh->sets = 0;
194     zh->destroyed = 0;
195     zh->errCode = 0;
196     zh->errString = 0;
197
198     zh->key_buf = 0;
199     zh->admin_databaseName = 0;
200     
201     zebra_mutex_cond_lock (&zs->session_lock);
202
203     zh->next = zs->sessions;
204     zs->sessions = zh;
205
206     zebra_mutex_cond_unlock (&zs->session_lock);
207     return zh;
208 }
209
210 static int zebra_register_activate (ZebraService zh);
211 static int zebra_register_deactivate (ZebraService zh);
212
213 ZebraService zebra_start (const char *configName)
214 {
215     ZebraService zh = xmalloc (sizeof(*zh));
216
217     yaz_log (LOG_LOG, "zebra_start %s", configName);
218
219     zh->configName = xstrdup(configName);
220     zh->sessions = 0;
221     zh->stop_flag = 0;
222     zh->active = 0;
223     zebra_mutex_cond_init (&zh->session_lock);
224     zebra_register_activate (zh);
225     return zh;
226 }
227
228 static int zebra_register_activate (ZebraService zh)
229 {
230     if (zh->active)
231         return 0;
232     yaz_log (LOG_LOG, "zebra_register_activate");
233     if (!(zh->res = res_open (zh->configName)))
234     {
235         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
236         return -1;
237     }
238     zebra_chdir (zh);
239     zh->dh = data1_create ();
240     if (!zh->dh)
241         return -1;
242     zh->bfs = bfs_create (res_get (zh->res, "register"));
243     if (!zh->bfs)
244     {
245         data1_destroy(zh->dh);
246         return -1;
247     }
248     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
249     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
250     zh->registerState = -1;  /* trigger open of registers! */
251     zh->registerChange = 0;
252     zh->recTypes = recTypes_init (zh->dh);
253     recTypes_default_handlers (zh->recTypes);
254
255     zh->records = NULL;
256     zh->zebra_maps = zebra_maps_open (zh->res);
257     zh->rank_classes = NULL;
258
259     zh->records = 0;
260     zh->dict = 0;
261     zh->sortIdx = 0;
262     zh->isams = 0;
263 #if ZMBOL
264     zh->isam = 0;
265     zh->isamc = 0;
266     zh->isamd = 0;
267 #endif
268     zh->zei = 0;
269     
270     zebraRankInstall (zh, rank1_class);
271
272     if (!res_get (zh->res, "passwd"))
273         zh->passwd_db = NULL;
274     else
275     {
276         zh->passwd_db = passwd_db_open ();
277         if (!zh->passwd_db)
278             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
279         else
280             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
281     }
282
283     if (!(zh->records = rec_open (zh->bfs, 1, 0)))
284     {
285         logf (LOG_WARN, "rec_open");
286         return -1;
287     }
288     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, 1, 0)))
289     {
290         logf (LOG_WARN, "dict_open");
291         return -1;
292     }
293     if (!(zh->sortIdx = sortIdx_open (zh->bfs, 0)))
294     {
295         logf (LOG_WARN, "sortIdx_open");
296         return -1;
297     }
298     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
299     {
300         struct ISAMS_M_s isams_m;
301         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, 1,
302                                       key_isams_m(zh->res, &isams_m))))
303         {
304             logf (LOG_WARN, "isams_open");
305             return -1;
306         }
307     }
308 #if ZMBOL
309     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
310     {
311         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, 1,
312                                   sizeof (struct it_key), zh->res)))
313         {
314             logf (LOG_WARN, "is_open");
315             return -1;
316         }
317     }
318     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
319     {
320         struct ISAMC_M_s isamc_m;
321         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
322                                     1, key_isamc_m(zh->res, &isamc_m))))
323         {
324             logf (LOG_WARN, "isc_open");
325             return -1;
326         }
327     }
328     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
329     {
330         struct ISAMD_M_s isamd_m;
331         
332         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
333                                       1, key_isamd_m(zh->res, &isamd_m))))
334         {
335             logf (LOG_WARN, "isamd_open");
336             return -1;
337         }
338     }
339 #endif
340     zh->zei = zebraExplain_open (zh->records, zh->dh,
341                                  zh->res, 1, 0 /* rGroup */,
342                                  explain_extract);
343     if (!zh->zei)
344     {
345         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
346         return -1;
347     }
348     zh->active = 1;
349     yaz_log (LOG_LOG, "zebra_register_activate ok");
350     return 0;
351 }
352
353 void zebra_admin_shutdown (ZebraHandle zh)
354 {
355     zebraExplain_flush (zh->service->zei, 1, zh);
356     extract_index (zh);
357
358     zebra_mutex_cond_lock (&zh->service->session_lock);
359     zh->service->stop_flag = 1;
360     if (!zh->service->sessions)
361         zebra_register_deactivate(zh->service);
362     zebra_mutex_cond_unlock (&zh->service->session_lock);
363 }
364
365 void zebra_admin_start (ZebraHandle zh)
366 {
367     ZebraService zs = zh->service;
368     zh->errCode = 0;
369     zebra_mutex_cond_lock (&zs->session_lock);
370     if (!zs->stop_flag)
371         zebra_register_activate(zs);
372     zebra_mutex_cond_unlock (&zs->session_lock);
373 }
374
375 static int zebra_register_deactivate (ZebraService zh)
376 {
377     zh->stop_flag = 0;
378     if (!zh->active)
379         return 0;
380     yaz_log(LOG_LOG, "zebra_register_deactivate");
381     zebra_chdir (zh);
382     if (zh->records)
383     {
384         zebraExplain_close (zh->zei, 1);
385         dict_close (zh->dict);
386         sortIdx_close (zh->sortIdx);
387         if (zh->isams)
388             isams_close (zh->isams);
389 #if ZMBOL
390         if (zh->isam)
391             is_close (zh->isam);
392         if (zh->isamc)
393             isc_close (zh->isamc);
394         if (zh->isamd)
395             isamd_close (zh->isamd);
396 #endif
397         rec_close (&zh->records);
398     }
399     recTypes_destroy (zh->recTypes);
400     zebra_maps_close (zh->zebra_maps);
401     zebraRankDestroy (zh);
402     bfs_destroy (zh->bfs);
403     data1_destroy (zh->dh);
404
405     if (zh->passwd_db)
406         passwd_db_close (zh->passwd_db);
407     res_close (zh->res);
408     zh->active = 0;
409     return 0;
410 }
411
412 void zebra_stop(ZebraService zh)
413 {
414     if (!zh)
415         return ;
416     yaz_log (LOG_LOG, "zebra_stop");
417
418     assert (!zh->sessions);
419
420     zebra_mutex_cond_destroy (&zh->session_lock);
421
422     zebra_register_deactivate(zh);
423     xfree (zh->configName);
424     xfree (zh);
425 }
426
427 void zebra_close (ZebraHandle zh)
428 {
429     ZebraService zs = zh->service;
430     struct zebra_session **sp;
431     if (!zh)
432         return ;
433     resultSetDestroy (zh, -1, 0, 0);
434
435     if (zh->key_buf)
436     {
437         xfree (zh->key_buf);
438         zh->key_buf = 0;
439     }
440     xfree (zh->admin_databaseName);
441     zebra_mutex_cond_lock (&zs->session_lock);
442     sp = &zs->sessions;
443     while (1)
444     {
445         assert (*sp);
446         if (*sp == zh)
447         {
448             *sp = (*sp)->next;
449             break;
450         }
451         sp = &(*sp)->next;
452     }
453     if (!zs->sessions && zs->stop_flag)
454         zebra_register_deactivate(zs);
455     zebra_mutex_cond_unlock (&zs->session_lock);
456     xfree (zh);
457 }
458
459 struct map_baseinfo {
460     ZebraHandle zh;
461     NMEM mem;
462     int num_bases;
463     char **basenames;
464     int new_num_bases;
465     char **new_basenames;
466     int new_num_max;
467 };
468         
469 void map_basenames_func (void *vp, const char *name, const char *value)
470 {
471     struct map_baseinfo *p = (struct map_baseinfo *) vp;
472     int i, no;
473     char fromdb[128], todb[8][128];
474     
475     no =
476         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
477                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
478                 todb[5], todb[6], todb[7]);
479     if (no < 2)
480         return ;
481     no--;
482     for (i = 0; i<p->num_bases; i++)
483         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
484         {
485             p->basenames[i] = 0;
486             for (i = 0; i < no; i++)
487             {
488                 if (p->new_num_bases == p->new_num_max)
489                     return;
490                 p->new_basenames[(p->new_num_bases)++] = 
491                     nmem_strdup (p->mem, todb[i]);
492             }
493             return;
494         }
495 }
496
497 void map_basenames (ZebraHandle zh, ODR stream,
498                     int *num_bases, char ***basenames)
499 {
500     struct map_baseinfo info;
501     struct map_baseinfo *p = &info;
502     int i;
503
504     info.zh = zh;
505     info.num_bases = *num_bases;
506     info.basenames = *basenames;
507     info.new_num_max = 128;
508     info.new_num_bases = 0;
509     info.new_basenames = (char **)
510         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
511     info.mem = stream->mem;
512
513     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
514     
515     for (i = 0; i<p->num_bases; i++)
516         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
517         {
518             p->new_basenames[(p->new_num_bases)++] = 
519                 nmem_strdup (p->mem, p->basenames[i]);
520         }
521     *num_bases = info.new_num_bases;
522     *basenames = info.new_basenames;
523     for (i = 0; i<*num_bases; i++)
524         logf (LOG_LOG, "base %s", (*basenames)[i]);
525 }
526
527 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
528                        Z_RPNQuery *query, int num_bases, char **basenames, 
529                        const char *setname)
530 {
531     zh->hits = 0;
532     if (zebra_register_lock (zh))
533         return;
534     map_basenames (zh, stream, &num_bases, &basenames);
535     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
536
537     zebra_register_unlock (zh);
538 }
539
540 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
541                              const char *setname, Z_RecordComposition *comp,
542                              oid_value input_format, int num_recs,
543                              ZebraRetrievalRecord *recs)
544 {
545     ZebraPosSet poset;
546     int i, *pos_array;
547
548     if (zebra_register_lock (zh))
549         return;
550     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
551     for (i = 0; i<num_recs; i++)
552         pos_array[i] = recs[i].position;
553     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
554     if (!poset)
555     {
556         logf (LOG_DEBUG, "zebraPosSetCreate error");
557         zh->errCode = 30;
558         zh->errString = nmem_strdup (stream->mem, setname);
559     }
560     else
561     {
562         for (i = 0; i<num_recs; i++)
563         {
564             if (!poset[i].sysno)
565             {
566                 char num_str[20];
567
568                 sprintf (num_str, "%d", pos_array[i]);  
569                 zh->errCode = 13;
570                 zh->errString = nmem_strdup (stream->mem, num_str);
571                 break;
572             }
573             else
574             {
575                 recs[i].errCode =
576                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
577                                         stream, input_format, comp,
578                                         &recs[i].format, &recs[i].buf,
579                                         &recs[i].len,
580                                         &recs[i].base);
581                 recs[i].errString = NULL;
582             }
583         }
584         zebraPosSetDestroy (zh, poset, num_recs);
585     }
586     zebra_register_unlock (zh);
587     xfree (pos_array);
588 }
589
590 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
591                  oid_value attributeset,
592                  int num_bases, char **basenames,
593                  int *position, int *num_entries, ZebraScanEntry **entries,
594                  int *is_partial)
595 {
596     if (zebra_register_lock (zh))
597     {
598         *entries = 0;
599         *num_entries = 0;
600         return;
601     }
602     map_basenames (zh, stream, &num_bases, &basenames);
603     rpn_scan (zh, stream, zapt, attributeset,
604               num_bases, basenames, position,
605               num_entries, entries, is_partial);
606     zebra_register_unlock (zh);
607 }
608
609 void zebra_sort (ZebraHandle zh, ODR stream,
610                  int num_input_setnames, const char **input_setnames,
611                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
612                  int *sort_status)
613 {
614     if (zebra_register_lock (zh))
615         return;
616     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
617                    output_setname, sort_sequence, sort_status);
618     zebra_register_unlock (zh);
619 }
620
621 int zebra_deleleResultSet(ZebraHandle zh, int function,
622                           int num_setnames, char **setnames,
623                           int *statuses)
624 {
625     int i, status;
626     if (zebra_register_lock (zh))
627         return Z_DeleteStatus_systemProblemAtTarget;
628     switch (function)
629     {
630     case Z_DeleteRequest_list:
631         resultSetDestroy (zh, num_setnames, setnames, statuses);
632         break;
633     case Z_DeleteRequest_all:
634         resultSetDestroy (zh, -1, 0, statuses);
635         break;
636     }
637     zebra_register_unlock (zh);
638     status = Z_DeleteStatus_success;
639     for (i = 0; i<num_setnames; i++)
640         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
641             status = statuses[i];
642     return status;
643 }
644
645 int zebra_errCode (ZebraHandle zh)
646 {
647     return zh->errCode;
648 }
649
650 const char *zebra_errString (ZebraHandle zh)
651 {
652     return diagbib1_str (zh->errCode);
653 }
654
655 char *zebra_errAdd (ZebraHandle zh)
656 {
657     return zh->errString;
658 }
659
660 int zebra_hits (ZebraHandle zh)
661 {
662     return zh->hits;
663 }
664
665 int zebra_auth (ZebraService zh, const char *user, const char *pass)
666 {
667     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
668         return 0;
669     return 1;
670 }
671
672 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
673 {
674     if (zebra_register_lock (zh))
675         return;
676     xfree (zh->admin_databaseName);
677     zh->admin_databaseName = xstrdup(database);
678     zebra_register_unlock(zh);
679 }
680
681 void zebra_admin_import_end (ZebraHandle zh)
682 {
683     zebraExplain_flush (zh->service->zei, 1, zh);
684     extract_index (zh);
685 }
686
687 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
688 {
689     int sysno;
690     int i;
691     if (zebra_register_lock (zh))
692         return;
693     for (i = 0; i<segment->num_segmentRecords; i++)
694     {
695         Z_NamePlusRecord *npr = segment->segmentRecords[i];
696         const char *databaseName = npr->databaseName;
697
698         if (!databaseName)
699             databaseName = zh->admin_databaseName;
700         printf ("--------------%d--------------------\n", i);
701         if (npr->which == Z_NamePlusRecord_intermediateFragment)
702         {
703             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
704             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
705             {
706                 Odr_oct *oct = fragment->u.notExternallyTagged;
707                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
708                         oct->buf);
709                 
710                 sysno = 0;
711                 extract_rec_in_mem (zh, "grs.sgml",
712                                     oct->buf, oct->len,
713                                     databaseName,
714                                     0 /* delete_flag */,
715                                     0 /* test_mode */,
716                                     &sysno /* sysno */,
717                                     1 /* store_keys */,
718                                     1 /* store_data */,
719                                     0 /* match criteria */);
720             }
721         }
722     }
723     zebra_register_unlock(zh);
724 }
725
726 void zebra_admin_create (ZebraHandle zh, const char *database)
727 {
728     ZebraService zs = zh->service;
729     if (zebra_register_lock(zh))
730     {
731         zh->errCode = 1019;
732         return;
733     }
734     /* announce database */
735     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
736     {
737         zh->errCode = 224;
738         zh->errString = "Database already exist";
739     }
740     zebra_register_unlock(zh);
741 }
742
743 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
744                        const char *input_str, int input_len,
745                        char *output_str, int output_len)
746 {
747     WRBUF wrbuf;
748     if (!zh->service->zebra_maps)
749         return -1;
750     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
751                           input_str, input_len);
752     if (!wrbuf)
753         return -2;
754     if (wrbuf_len(wrbuf) >= output_len)
755         return -3;
756     if (wrbuf_len(wrbuf))
757         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
758     output_str[wrbuf_len(wrbuf)] = '\0';
759     return wrbuf_len(wrbuf);
760 }
761
762 static void extract_init (struct recExtractCtrl *p, RecWord *w)
763 {
764     w->zebra_maps = p->zebra_maps;
765     w->seqnos = p->seqno;
766     w->attrSet = VAL_BIB1;
767     w->attrUse = 1016;
768     w->reg_type = 'w';
769     w->extractCtrl = p;
770 }
771
772 static void extract_add_index_string (RecWord *p, const char *string,
773                                       int length)
774 {
775     char *dst;
776     unsigned char attrSet;
777     unsigned short attrUse;
778     int lead = 0;
779     int diff = 0;
780     int *pseqno = &p->seqnos[p->reg_type];
781     ZebraHandle zh = p->extractCtrl->handle;
782     struct recKeys *keys = &zh->keys;
783
784     if (keys->buf_used+1024 > keys->buf_max)
785     {
786         char *b;
787
788         b = (char *) xmalloc (keys->buf_max += 128000);
789         if (keys->buf_used > 0)
790             memcpy (b, keys->buf, keys->buf_used);
791         xfree (keys->buf);
792         keys->buf = b;
793     }
794     dst = keys->buf + keys->buf_used;
795
796     attrSet = p->attrSet;
797     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
798         lead |= 1;
799     else
800         keys->prevAttrSet = attrSet;
801     attrUse = p->attrUse;
802     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
803         lead |= 2;
804     else
805         keys->prevAttrUse = attrUse;
806 #if 1
807     diff = 1 + *pseqno - keys->prevSeqNo;
808     if (diff >= 1 && diff <= 15)
809         lead |= (diff << 2);
810     else
811         diff = 0;
812 #endif
813     keys->prevSeqNo = *pseqno;
814     
815     *dst++ = lead;
816
817     if (!(lead & 1))
818     {
819         memcpy (dst, &attrSet, sizeof(attrSet));
820         dst += sizeof(attrSet);
821     }
822     if (!(lead & 2))
823     {
824         memcpy (dst, &attrUse, sizeof(attrUse));
825         dst += sizeof(attrUse);
826     }
827     *dst++ = p->reg_type;
828     memcpy (dst, string, length);
829     dst += length;
830     *dst++ = '\0';
831
832     if (!diff)
833     {
834         memcpy (dst, pseqno, sizeof(*pseqno));
835         dst += sizeof(*pseqno);
836     }
837     keys->buf_used = dst - keys->buf;
838     if (*pseqno)
839         (*pseqno)++;
840 }
841
842 static void extract_add_sort_string (RecWord *p, const char *string,
843                                      int length)
844 {
845     struct sortKey *sk;
846     ZebraHandle zh = p->extractCtrl->handle;
847     struct sortKey *sortKeys = zh->sortKeys;
848
849     for (sk = sortKeys; sk; sk = sk->next)
850         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
851             return;
852
853     sk = (struct sortKey *) xmalloc (sizeof(*sk));
854     sk->next = sortKeys;
855     sortKeys = sk;
856
857     sk->string = (char *) xmalloc (length);
858     sk->length = length;
859     memcpy (sk->string, string, length);
860
861     sk->attrSet = p->attrSet;
862     sk->attrUse = p->attrUse;
863 }
864
865 static void extract_add_string (RecWord *p, const char *string, int length)
866 {
867     assert (length > 0);
868     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
869         extract_add_sort_string (p, string, length);
870     else
871         extract_add_index_string (p, string, length);
872 }
873
874 static void extract_add_incomplete_field (RecWord *p)
875 {
876     const char *b = p->string;
877     int remain = p->length;
878     const char **map = 0;
879
880     if (remain > 0)
881         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
882
883     while (map)
884     {
885         char buf[IT_MAX_WORD+1];
886         int i, remain;
887
888         /* Skip spaces */
889         while (map && *map && **map == *CHR_SPACE)
890         {
891             remain = p->length - (b - p->string);
892             if (remain > 0)
893                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
894             else
895                 map = 0;
896         }
897         if (!map)
898             break;
899         i = 0;
900         while (map && *map && **map != *CHR_SPACE)
901         {
902             const char *cp = *map;
903
904             while (i < IT_MAX_WORD && *cp)
905                 buf[i++] = *(cp++);
906             remain = p->length - (b - p->string);
907             if (remain > 0)
908                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
909             else
910                 map = 0;
911         }
912         if (!i)
913             return;
914         extract_add_string (p, buf, i);
915     }
916     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
917 }
918
919 static void extract_add_complete_field (RecWord *p)
920 {
921     const char *b = p->string;
922     char buf[IT_MAX_WORD+1];
923     const char **map = 0;
924     int i = 0, remain = p->length;
925
926     if (remain > 0)
927         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
928
929     while (remain > 0 && i < IT_MAX_WORD)
930     {
931         while (map && *map && **map == *CHR_SPACE)
932         {
933             remain = p->length - (b - p->string);
934             if (remain > 0)
935                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
936             else
937                 map = 0;
938         }
939         if (!map)
940             break;
941
942         if (i && i < IT_MAX_WORD)
943             buf[i++] = *CHR_SPACE;
944         while (map && *map && **map != *CHR_SPACE)
945         {
946             const char *cp = *map;
947
948             if (i >= IT_MAX_WORD)
949                 break;
950             while (i < IT_MAX_WORD && *cp)
951                 buf[i++] = *(cp++);
952             remain = p->length  - (b - p->string);
953             if (remain > 0)
954                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
955                                         remain);
956             else
957                 map = 0;
958         }
959     }
960     if (!i)
961         return;
962     extract_add_string (p, buf, i);
963 }
964
965 static void extract_token_add (RecWord *p)
966 {
967     WRBUF wrbuf;
968     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
969                                p->string, p->length)))
970     {
971         p->string = wrbuf_buf(wrbuf);
972         p->length = wrbuf_len(wrbuf);
973     }
974     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
975         extract_add_complete_field (p);
976     else
977         extract_add_incomplete_field(p);
978 }
979
980 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
981 {
982     ZebraHandle zh = (ZebraHandle) (p->handle);
983     zebraExplain_addSchema (zh->service->zei, oid);
984 }
985
986 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
987                                    int cmd, struct sortKey **skp)
988 {
989     struct sortKey *sk = *skp;
990     SortIdx sortIdx = zh->service->sortIdx;
991
992     sortIdx_sysno (sortIdx, sysno);
993     while (sk)
994     {
995         struct sortKey *sk_next = sk->next;
996         sortIdx_type (sortIdx, sk->attrUse);
997         sortIdx_add (sortIdx, sk->string, sk->length);
998         xfree (sk->string);
999         xfree (sk);
1000         sk = sk_next;
1001     }
1002     *skp = 0;
1003 }
1004
1005 struct encode_info {
1006     int  sysno;
1007     int  seqno;
1008     int  cmd;
1009     char buf[768];
1010 };
1011
1012 void encode_key_init (struct encode_info *i)
1013 {
1014     i->sysno = 0;
1015     i->seqno = 0;
1016     i->cmd = -1;
1017 }
1018
1019 char *encode_key_int (int d, char *bp)
1020 {
1021     if (d <= 63)
1022         *bp++ = d;
1023     else if (d <= 16383)
1024     {
1025         *bp++ = 64 + (d>>8);
1026         *bp++ = d  & 255;
1027     }
1028     else if (d <= 4194303)
1029     {
1030         *bp++ = 128 + (d>>16);
1031         *bp++ = (d>>8) & 255;
1032         *bp++ = d & 255;
1033     }
1034     else
1035     {
1036         *bp++ = 192 + (d>>24);
1037         *bp++ = (d>>16) & 255;
1038         *bp++ = (d>>8) & 255;
1039         *bp++ = d & 255;
1040     }
1041     return bp;
1042 }
1043
1044 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1045 {
1046     struct it_key key;
1047     char *bp = i->buf;
1048
1049     while ((*bp++ = *k++))
1050         ;
1051     memcpy (&key, k+1, sizeof(struct it_key));
1052     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1053     if (i->sysno != key.sysno)
1054     {
1055         i->sysno = key.sysno;
1056         i->seqno = 0;
1057     }
1058     else if (!i->seqno && !key.seqno && i->cmd == *k)
1059         return;
1060     bp = encode_key_int (key.seqno - i->seqno, bp);
1061     i->seqno = key.seqno;
1062     i->cmd = *k;
1063     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1064     {
1065         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1066         exit (1);
1067     }
1068 }
1069
1070 static void extract_flushWriteKeys (ZebraHandle zh)
1071 {
1072     FILE *outf;
1073     char out_fname[200];
1074     char *prevcp, *cp;
1075     struct encode_info encode_info;
1076     int ptr_i = zh->ptr_i;
1077 #if SORT_EXTRA
1078     int i;
1079 #endif
1080     if (!zh->key_buf || ptr_i <= 0)
1081         return;
1082
1083     (zh->key_file_no)++;
1084     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1085 #if !SORT_EXTRA
1086     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1087             key_qsort_compare);
1088     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1089
1090     if (!(outf = fopen (out_fname, "wb")))
1091     {
1092         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1093         exit (1);
1094     }
1095     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1096     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1097     
1098     encode_key_init (&encode_info);
1099     encode_key_write (cp, &encode_info, outf);
1100     
1101     while (--ptr_i > 0)
1102     {
1103         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1104         if (strcmp (cp, prevcp))
1105         {
1106             encode_key_init (&encode_info);
1107             encode_key_write (cp, &encode_info, outf);
1108             prevcp = cp;
1109         }
1110         else
1111             encode_key_write (cp + strlen(cp), &encode_info, outf);
1112     }
1113 #else
1114     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1115     extract_get_fname_tmp (out_fname, key_file_no);
1116
1117     if (!(outf = fopen (out_fname, "wb")))
1118     {
1119         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1120         exit (1);
1121     }
1122     logf (LOG_LOG, "writing section %d", key_file_no);
1123     i = ptr_i;
1124     prevcp =  key_buf[ptr_top-i];
1125     while (1)
1126         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1127         {
1128             key_y_len = strlen(prevcp)+1;
1129 #if 0
1130             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1131                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1132 #endif
1133             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1134                                    sizeof(char*), key_y_compare);
1135             cp = key_buf[ptr_top-ptr_i];
1136             --key_y_len;
1137             encode_key_init (&encode_info);
1138             encode_key_write (cp, &encode_info, outf);
1139             while (--ptr_i > i)
1140             {
1141                 cp = key_buf[ptr_top-ptr_i];
1142                 encode_key_write (cp+key_y_len, &encode_info, outf);
1143             }
1144             if (!i)
1145                 break;
1146             prevcp = key_buf[ptr_top-ptr_i];
1147         }
1148 #endif
1149     if (fclose (outf))
1150     {
1151         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1152         exit (1);
1153     }
1154     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1155     zh->ptr_i = 0;
1156     zh->key_buf_used = 0;
1157 }
1158
1159 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1160                                      int cmd, struct recKeys *reckeys)
1161 {
1162     unsigned char attrSet = (unsigned char) -1;
1163     unsigned short attrUse = (unsigned short) -1;
1164     int seqno = 0;
1165     int off = 0;
1166     ZebraExplainInfo zei = zh->service->zei;
1167
1168     if (!zh->key_buf)
1169     {
1170         int mem = 8*1024*1024;
1171         zh->key_buf = (char**) xmalloc (mem);
1172         zh->ptr_top = mem/sizeof(char*);
1173         zh->ptr_i = 0;
1174         zh->key_buf_used = 0;
1175         zh->key_file_no = 0;
1176     }
1177     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1178     while (off < reckeys->buf_used)
1179     {
1180         const char *src = reckeys->buf + off;
1181         struct it_key key;
1182         int lead, ch;
1183     
1184         lead = *src++;
1185
1186         if (!(lead & 1))
1187         {
1188             memcpy (&attrSet, src, sizeof(attrSet));
1189             src += sizeof(attrSet);
1190         }
1191         if (!(lead & 2))
1192         {
1193             memcpy (&attrUse, src, sizeof(attrUse));
1194             src += sizeof(attrUse);
1195         }
1196         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1197             extract_flushWriteKeys (zh);
1198         ++(zh->ptr_i);
1199         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1200             (char*)zh->key_buf + zh->key_buf_used;
1201
1202         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1203         if (ch < 0)
1204             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1205         assert (ch > 0);
1206         zh->key_buf_used +=
1207             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1208
1209         while (*src)
1210             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1211         src++;
1212         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1213         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1214
1215         if (lead & 60)
1216             seqno += ((lead>>2) & 15)-1;
1217         else
1218         {
1219             memcpy (&seqno, src, sizeof(seqno));
1220             src += sizeof(seqno);
1221         }
1222         key.seqno = seqno;
1223         key.sysno = sysno;
1224         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1225         (zh->key_buf_used) += sizeof(key);
1226         off = src - reckeys->buf;
1227     }
1228     assert (off == reckeys->buf_used);
1229 }
1230
1231 static void extract_index (ZebraHandle zh)
1232 {
1233     extract_flushWriteKeys (zh);
1234     zebra_index_merge (zh);
1235 }
1236
1237 static int explain_extract (void *handle, Record rec, data1_node *n)
1238 {
1239     ZebraHandle zh = (ZebraHandle) handle;
1240     struct recExtractCtrl extractCtrl;
1241     int i;
1242
1243     if (zebraExplain_curDatabase (zh->service->zei,
1244                                   rec->info[recInfo_databaseName]))
1245     {
1246         abort();
1247         if (zebraExplain_newDatabase (zh->service->zei,
1248                                       rec->info[recInfo_databaseName], 0))
1249             abort ();
1250     }
1251
1252     zh->keys.buf_used = 0;
1253     zh->keys.prevAttrUse = -1;
1254     zh->keys.prevAttrSet = -1;
1255     zh->keys.prevSeqNo = 0;
1256     zh->sortKeys = 0;
1257     
1258     extractCtrl.init = extract_init;
1259     extractCtrl.tokenAdd = extract_token_add;
1260     extractCtrl.schemaAdd = extract_schema_add;
1261     extractCtrl.dh = zh->service->dh;
1262     for (i = 0; i<256; i++)
1263         extractCtrl.seqno[i] = 0;
1264     extractCtrl.zebra_maps = zh->service->zebra_maps;
1265     extractCtrl.flagShowRecords = 0;
1266     extractCtrl.handle = handle;
1267     
1268     grs_extract_tree(&extractCtrl, n);
1269
1270     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1271
1272     if (rec->size[recInfo_delKeys])
1273     {
1274         struct recKeys delkeys;
1275         struct sortKey *sortKeys = 0;
1276
1277         delkeys.buf_used = rec->size[recInfo_delKeys];
1278         delkeys.buf = rec->info[recInfo_delKeys];
1279         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1280         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1281     }
1282     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1283     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1284
1285     xfree (rec->info[recInfo_delKeys]);
1286     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1287     rec->info[recInfo_delKeys] = zh->keys.buf;
1288     zh->keys.buf = NULL;
1289     zh->keys.buf_max = 0;
1290     return 0;
1291 }
1292
1293 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1294                                const char *buf, size_t buf_size,
1295                                const char *databaseName, int delete_flag,
1296                                int test_mode, int *sysno,
1297                                int store_keys, int store_data,
1298                                const char *match_criteria)
1299 {
1300     RecordAttr *recordAttr;
1301     struct recExtractCtrl extractCtrl;
1302     int i, r;
1303     RecType recType;
1304     char subType[1024];
1305     void *clientData;
1306     const char *fname = "<no file>";
1307     Record rec;
1308     long recordOffset = 0;
1309     struct zebra_fetch_control fc;
1310
1311     fc.fd = -1;
1312     fc.record_int_buf = buf;
1313     fc.record_int_len = buf_size;
1314     fc.record_int_pos = 0;
1315     fc.offset_end = 0;
1316     fc.record_offset = 0;
1317
1318     extractCtrl.offset = 0;
1319     extractCtrl.readf = zebra_record_int_read;
1320     extractCtrl.seekf = zebra_record_int_seek;
1321     extractCtrl.tellf = zebra_record_int_tell;
1322     extractCtrl.endf = zebra_record_int_end;
1323     extractCtrl.fh = &fc;
1324
1325     /* announce database */
1326     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1327     {
1328         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1329             return 0;
1330     }
1331     if (!(recType =
1332           recType_byName (zh->service->recTypes, recordType, subType,
1333                           &clientData)))
1334     {
1335         logf (LOG_WARN, "No such record type: %s", recordType);
1336         return 0;
1337     }
1338
1339     zh->keys.buf_used = 0;
1340     zh->keys.prevAttrUse = -1;
1341     zh->keys.prevAttrSet = -1;
1342     zh->keys.prevSeqNo = 0;
1343     zh->sortKeys = 0;
1344
1345     extractCtrl.subType = subType;
1346     extractCtrl.init = extract_init;
1347     extractCtrl.tokenAdd = extract_token_add;
1348     extractCtrl.schemaAdd = extract_schema_add;
1349     extractCtrl.dh = zh->service->dh;
1350     extractCtrl.handle = zh;
1351     extractCtrl.zebra_maps = zh->service->zebra_maps;
1352     extractCtrl.flagShowRecords = 0;
1353     for (i = 0; i<256; i++)
1354     {
1355         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1356             extractCtrl.seqno[i] = 1;
1357         else
1358             extractCtrl.seqno[i] = 0;
1359     }
1360
1361     r = (*recType->extract)(clientData, &extractCtrl);
1362
1363     if (r == RECCTRL_EXTRACT_EOF)
1364         return 0;
1365     else if (r == RECCTRL_EXTRACT_ERROR)
1366     {
1367         /* error occured during extraction ... */
1368 #if 1
1369         yaz_log (LOG_WARN, "extract error");
1370 #else
1371         if (rGroup->flagRw &&
1372             records_processed < rGroup->fileVerboseLimit)
1373         {
1374             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1375                   fname, (long) recordOffset);
1376         }
1377 #endif
1378         return 0;
1379     }
1380     if (zh->keys.buf_used == 0)
1381     {
1382         /* the extraction process returned no information - the record
1383            is probably empty - unless flagShowRecords is in use */
1384         if (test_mode)
1385             return 1;
1386         logf (LOG_WARN, "No keys generated for record");
1387         logf (LOG_WARN, " The file is probably empty");
1388         return 1;
1389     }
1390     /* match criteria */
1391
1392     if (! *sysno)
1393     {
1394         /* new record */
1395         if (delete_flag)
1396         {
1397             logf (LOG_LOG, "delete %s %s %ld", recordType,
1398                   fname, (long) recordOffset);
1399             logf (LOG_WARN, "cannot delete record above (seems new)");
1400             return 1;
1401         }
1402         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1403               (long) recordOffset);
1404         rec = rec_new (zh->service->records);
1405
1406         *sysno = rec->sysno;
1407
1408         recordAttr = rec_init_attr (zh->service->zei, rec);
1409
1410 #if 0
1411         if (matchStr)
1412         {
1413             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1414         }
1415 #endif
1416         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1417         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1418     }
1419     else
1420     {
1421         /* record already exists */
1422         struct recKeys delkeys;
1423
1424         rec = rec_get (zh->service->records, *sysno);
1425         assert (rec);
1426         
1427         recordAttr = rec_init_attr (zh->service->zei, rec);
1428
1429         if (recordAttr->runNumber ==
1430             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1431         {
1432             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1433                   fname, (long) recordOffset);
1434             rec_rm (&rec);
1435             return 1;
1436         }
1437         delkeys.buf_used = rec->size[recInfo_delKeys];
1438         delkeys.buf = rec->info[recInfo_delKeys];
1439         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1440         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1441         if (delete_flag)
1442         {
1443             /* record going to be deleted */
1444             if (!delkeys.buf_used)
1445             {
1446                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1447                       fname, (long) recordOffset);
1448                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1449             }
1450             else
1451             {
1452                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1453                       fname, (long) recordOffset);
1454 #if 0
1455                 if (matchStr)
1456                     dict_delete (matchDict, matchStr);
1457 #endif
1458                 rec_del (zh->service->records, &rec);
1459             }
1460             rec_rm (&rec);
1461             return 1;
1462         }
1463         else
1464         {
1465             /* record going to be updated */
1466             if (!delkeys.buf_used)
1467             {
1468                 logf (LOG_LOG, "update %s %s %ld", recordType,
1469                       fname, (long) recordOffset);
1470                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1471             }
1472             else
1473             {
1474                 logf (LOG_LOG, "update %s %s %ld", recordType,
1475                       fname, (long) recordOffset);
1476                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1477             }
1478         }
1479     }
1480     /* update file type */
1481     xfree (rec->info[recInfo_fileType]);
1482     rec->info[recInfo_fileType] =
1483         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1484
1485     /* update filename */
1486     xfree (rec->info[recInfo_filename]);
1487     rec->info[recInfo_filename] =
1488         rec_strdup (fname, &rec->size[recInfo_filename]);
1489
1490     /* update delete keys */
1491     xfree (rec->info[recInfo_delKeys]);
1492     if (zh->keys.buf_used > 0 && store_keys == 1)
1493     {
1494         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1495         rec->info[recInfo_delKeys] = zh->keys.buf;
1496         zh->keys.buf = NULL;
1497         zh->keys.buf_max = 0;
1498     }
1499     else
1500     {
1501         rec->info[recInfo_delKeys] = NULL;
1502         rec->size[recInfo_delKeys] = 0;
1503     }
1504
1505     /* save file size of original record */
1506     zebraExplain_recordBytesIncrement (zh->service->zei,
1507                                        - recordAttr->recordSize);
1508 #if 0
1509     recordAttr->recordSize = fi->file_moffset - recordOffset;
1510     if (!recordAttr->recordSize)
1511         recordAttr->recordSize = fi->file_max - recordOffset;
1512 #else
1513     recordAttr->recordSize = buf_size;
1514 #endif
1515     zebraExplain_recordBytesIncrement (zh->service->zei,
1516                                        recordAttr->recordSize);
1517
1518     /* set run-number for this record */
1519     recordAttr->runNumber =
1520         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1521
1522     /* update store data */
1523     xfree (rec->info[recInfo_storeData]);
1524     if (store_data == 1)
1525     {
1526         rec->size[recInfo_storeData] = recordAttr->recordSize;
1527         rec->info[recInfo_storeData] = (char *)
1528             xmalloc (recordAttr->recordSize);
1529 #if 1
1530         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1531 #else
1532         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1533         {
1534             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1535                   (long) recordOffset, fname);
1536             exit (1);
1537         }
1538         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1539             < recordAttr->recordSize)
1540         {
1541             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1542                   recordAttr->recordSize, fname);
1543             exit (1);
1544         }
1545 #endif
1546     }
1547     else
1548     {
1549         rec->info[recInfo_storeData] = NULL;
1550         rec->size[recInfo_storeData] = 0;
1551     }
1552     /* update database name */
1553     xfree (rec->info[recInfo_databaseName]);
1554     rec->info[recInfo_databaseName] =
1555         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1556
1557     /* update offset */
1558     recordAttr->recordOffset = recordOffset;
1559     
1560     /* commit this record */
1561     rec_put (zh->service->records, &rec);
1562
1563     return 0;
1564 }