Added some logging on Authentication and searches.
[idzebra-moved-to-github.git] / index / zebraapi.c
1 /*
2  * Copyright (C) 1995-2000, Index Data
3  * All rights reserved.
4  *
5  * $Log: zebraapi.c,v $
6  * Revision 1.34  2000-06-09 13:56:38  ian
7  * Added some logging on Authentication and searches.
8  *
9  * Revision 1.33  2000/05/18 12:01:36  adam
10  * System call times(2) used again. More 64-bit fixes.
11  *
12  * Revision 1.32  2000/04/19 14:35:59  adam
13  * WIN32 update (this version is known not to work on Windows).
14  *
15  * Revision 1.31  2000/04/05 10:07:02  adam
16  * Minor zebra compile fix.
17  *
18  * Revision 1.30  2000/04/05 09:49:35  adam
19  * On Unix, zebra/z'mbol uses automake.
20  *
21  * Revision 1.29  2000/03/20 19:08:36  adam
22  * Added remote record import using Z39.50 extended services and Segment
23  * Requests.
24  *
25  * Revision 1.28  2000/03/15 15:00:30  adam
26  * First work on threaded version.
27  *
28  * Revision 1.27  2000/02/24 12:31:17  adam
29  * Added zebra_string_norm.
30  *
31  * Revision 1.26  1999/11/30 13:48:03  adam
32  * Improved installation. Updated for inclusion of YAZ header files.
33  *
34  * Revision 1.25  1999/11/04 15:00:45  adam
35  * Implemented delete result set(s).
36  *
37  * Revision 1.24  1999/10/14 14:33:50  adam
38  * Added truncation 5=106.
39  *
40  * Revision 1.23  1999/09/07 11:36:32  adam
41  * Minor changes.
42  *
43  * Revision 1.22  1999/08/02 10:13:47  adam
44  * Fixed bug regarding zebra_hits.
45  *
46  * Revision 1.21  1999/07/14 10:59:26  adam
47  * Changed functions isc_getmethod, isams_getmethod.
48  * Improved fatal error handling (such as missing EXPLAIN schema).
49  *
50  * Revision 1.20  1999/07/06 12:28:04  adam
51  * Updated record index structure. Format includes version ID. Compression
52  * algorithm ID is stored for each record block.
53  *
54  * Revision 1.19  1999/05/26 07:49:13  adam
55  * C++ compilation.
56  *
57  * Revision 1.18  1999/05/15 14:36:38  adam
58  * Updated dictionary. Implemented "compression" of dictionary.
59  *
60  * Revision 1.17  1999/05/12 13:08:06  adam
61  * First version of ISAMS.
62  *
63  * Revision 1.16  1999/02/19 10:38:30  adam
64  * Implemented chdir-setting.
65  *
66  * Revision 1.15  1999/02/17 12:18:12  adam
67  * Fixed zebra_close so that a NULL pointer is ignored.
68  *
69  * Revision 1.14  1999/02/02 14:51:11  adam
70  * Updated WIN32 code specific sections. Changed header.
71  *
72  * Revision 1.13  1998/12/16 12:23:30  adam
73  * Added facility for database name mapping using resource mapdb.
74  *
75  * Revision 1.12  1998/11/16 10:18:10  adam
76  * Better error reporting for result sets.
77  *
78  * Revision 1.11  1998/10/16 08:14:34  adam
79  * Updated record control system.
80  *
81  * Revision 1.10  1998/09/22 10:03:42  adam
82  * Changed result sets to be persistent in the sense that they can
83  * be re-searched if needed.
84  * Fixed memory leak in rsm_or.
85  *
86  * Revision 1.9  1998/09/02 13:53:17  adam
87  * Extra parameter decode added to search routines to implement
88  * persistent queries.
89  *
90  * Revision 1.8  1998/08/24 17:29:23  adam
91  * Minor changes.
92  *
93  * Revision 1.7  1998/06/24 12:16:13  adam
94  * Support for relations on text operands. Open range support in
95  * DFA module (i.e. [-j], [g-]).
96  *
97  * Revision 1.6  1998/06/22 11:36:47  adam
98  * Added authentication check facility to zebra.
99  *
100  * Revision 1.5  1998/06/13 00:14:08  adam
101  * Minor changes.
102  *
103  * Revision 1.4  1998/06/12 12:22:12  adam
104  * Work on Zebra API.
105  *
106  * Revision 1.3  1998/05/27 16:57:44  adam
107  * Zebra returns surrogate diagnostic for single records when
108  * appropriate.
109  *
110  * Revision 1.2  1998/05/20 10:12:19  adam
111  * Implemented automatic EXPLAIN database maintenance.
112  * Modified Zebra to work with ASN.1 compiled version of YAZ.
113  *
114  * Revision 1.1  1998/03/05 08:45:13  adam
115  * New result set model and modular ranking system. Moved towards
116  * descent server API. System information stored as "SGML" records.
117  *
118  */
119
120 #include <assert.h>
121 #include <stdio.h>
122 #ifdef WIN32
123 #include <io.h>
124 #include <process.h>
125 #include <direct.h>
126 #else
127 #include <unistd.h>
128 #endif
129
130 #include <yaz/diagbib1.h>
131 #include "zserver.h"
132 #include <charmap.h>
133
134 static void zebra_chdir (ZebraService zh)
135 {
136     const char *dir = res_get (zh->res, "chdir");
137     if (!dir)
138         return;
139     logf (LOG_DEBUG, "chdir %s", dir);
140 #ifdef WIN32
141     _chdir(dir);
142 #else
143     chdir (dir);
144 #endif
145 }
146
147 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
148                                const char *buf, size_t buf_size,
149                                const char *databaseName, int delete_flag,
150                                int test_mode, int *sysno,
151                                int store_keys, int store_data,
152                                const char *match_criteria);
153
154 static int explain_extract (void *handle, Record rec, data1_node *n);
155 static void extract_index (ZebraHandle zh);
156
157 static void zebra_register_unlock (ZebraHandle zh);
158
159 static int zebra_register_lock (ZebraHandle zh)
160 {
161     zh->errCode = 0;
162     zh->errString = 0;
163     if (!zh->service->active)
164     {
165         zh->errCode = 1019;
166         return 1;
167     }
168 #if HAVE_SYS_TIMES_H
169     times (&zh->tms1);
170 #endif
171     return 0;
172 }
173
174 static void zebra_register_unlock (ZebraHandle zh)
175 {
176 #if HAVE_SYS_TIMES_H
177     times (&zh->tms2);
178     logf (LOG_LOG, "user/system: %ld/%ld",
179                     (long) (zh->tms2.tms_utime - zh->tms1.tms_utime),
180                     (long) (zh->tms2.tms_stime - zh->tms1.tms_stime));
181
182 #endif
183 }
184
185 ZebraHandle zebra_open (ZebraService zs)
186 {
187     ZebraHandle zh;
188
189     assert (zs);
190     if (zs->stop_flag)
191         return 0;
192
193     zh = (ZebraHandle) xmalloc (sizeof(*zh));
194
195     zh->service = zs;
196     zh->sets = 0;
197     zh->destroyed = 0;
198     zh->errCode = 0;
199     zh->errString = 0;
200
201     zh->key_buf = 0;
202     zh->admin_databaseName = 0;
203     
204     zebra_mutex_cond_lock (&zs->session_lock);
205
206     zh->next = zs->sessions;
207     zs->sessions = zh;
208
209     zebra_mutex_cond_unlock (&zs->session_lock);
210
211     logf(LOG_APP,"CONNECT:");
212
213     return zh;
214 }
215
216 static int zebra_register_activate (ZebraService zh);
217 static int zebra_register_deactivate (ZebraService zh);
218
219 ZebraService zebra_start (const char *configName)
220 {
221     ZebraService zh = xmalloc (sizeof(*zh));
222
223     yaz_log (LOG_LOG, "zebra_start %s", configName);
224
225     zh->configName = xstrdup(configName);
226     zh->sessions = 0;
227     zh->stop_flag = 0;
228     zh->active = 0;
229     zebra_mutex_cond_init (&zh->session_lock);
230     zebra_register_activate (zh);
231     return zh;
232 }
233
234 static int zebra_register_activate (ZebraService zh)
235 {
236     if (zh->active)
237         return 0;
238     yaz_log (LOG_LOG, "zebra_register_activate");
239     if (!(zh->res = res_open (zh->configName)))
240     {
241         logf (LOG_WARN, "Failed to read resources `%s'", zh->configName);
242         return -1;
243     }
244     zebra_chdir (zh);
245     zh->dh = data1_create ();
246     if (!zh->dh)
247         return -1;
248     zh->bfs = bfs_create (res_get (zh->res, "register"));
249     if (!zh->bfs)
250     {
251         data1_destroy(zh->dh);
252         return -1;
253     }
254     bf_lockDir (zh->bfs, res_get (zh->res, "lockDir"));
255     data1_set_tabpath (zh->dh, res_get(zh->res, "profilePath"));
256     zh->registerState = -1;  /* trigger open of registers! */
257     zh->registerChange = 0;
258     zh->recTypes = recTypes_init (zh->dh);
259     recTypes_default_handlers (zh->recTypes);
260
261     zh->records = NULL;
262     zh->zebra_maps = zebra_maps_open (zh->res);
263     zh->rank_classes = NULL;
264
265     zh->records = 0;
266     zh->dict = 0;
267     zh->sortIdx = 0;
268     zh->isams = 0;
269 #if ZMBOL
270     zh->isam = 0;
271     zh->isamc = 0;
272     zh->isamd = 0;
273 #endif
274     zh->zei = 0;
275     
276     zebraRankInstall (zh, rank1_class);
277
278     if (!res_get (zh->res, "passwd"))
279         zh->passwd_db = NULL;
280     else
281     {
282         zh->passwd_db = passwd_db_open ();
283         if (!zh->passwd_db)
284             logf (LOG_WARN|LOG_ERRNO, "passwd_db_open failed");
285         else
286             passwd_db_file (zh->passwd_db, res_get (zh->res, "passwd"));
287     }
288
289     if (!(zh->records = rec_open (zh->bfs, 1, 0)))
290     {
291         logf (LOG_WARN, "rec_open");
292         return -1;
293     }
294     if (!(zh->dict = dict_open (zh->bfs, FNAME_DICT, 80, 1, 0)))
295     {
296         logf (LOG_WARN, "dict_open");
297         return -1;
298     }
299     if (!(zh->sortIdx = sortIdx_open (zh->bfs, 0)))
300     {
301         logf (LOG_WARN, "sortIdx_open");
302         return -1;
303     }
304     if (res_get_match (zh->res, "isam", "s", ISAM_DEFAULT))
305     {
306         struct ISAMS_M_s isams_m;
307         if (!(zh->isams = isams_open (zh->bfs, FNAME_ISAMS, 1,
308                                       key_isams_m(zh->res, &isams_m))))
309         {
310             logf (LOG_WARN, "isams_open");
311             return -1;
312         }
313     }
314 #if ZMBOL
315     else if (res_get_match (zh->res, "isam", "i", ISAM_DEFAULT))
316     {
317         if (!(zh->isam = is_open (zh->bfs, FNAME_ISAM, key_compare, 1,
318                                   sizeof (struct it_key), zh->res)))
319         {
320             logf (LOG_WARN, "is_open");
321             return -1;
322         }
323     }
324     else if (res_get_match (zh->res, "isam", "c", ISAM_DEFAULT))
325     {
326         struct ISAMC_M_s isamc_m;
327         if (!(zh->isamc = isc_open (zh->bfs, FNAME_ISAMC,
328                                     1, key_isamc_m(zh->res, &isamc_m))))
329         {
330             logf (LOG_WARN, "isc_open");
331             return -1;
332         }
333     }
334     else if (res_get_match (zh->res, "isam", "d", ISAM_DEFAULT))
335     {
336         struct ISAMD_M_s isamd_m;
337         
338         if (!(zh->isamd = isamd_open (zh->bfs, FNAME_ISAMD,
339                                       1, key_isamd_m(zh->res, &isamd_m))))
340         {
341             logf (LOG_WARN, "isamd_open");
342             return -1;
343         }
344     }
345 #endif
346     zh->zei = zebraExplain_open (zh->records, zh->dh,
347                                  zh->res, 1, 0 /* rGroup */,
348                                  explain_extract);
349     if (!zh->zei)
350     {
351         logf (LOG_WARN, "Cannot obtain EXPLAIN information");
352         return -1;
353     }
354     zh->active = 1;
355     yaz_log (LOG_LOG, "zebra_register_activate ok");
356     return 0;
357 }
358
359 void zebra_admin_shutdown (ZebraHandle zh)
360 {
361     zebraExplain_flush (zh->service->zei, 1, zh);
362     extract_index (zh);
363
364     zebra_mutex_cond_lock (&zh->service->session_lock);
365     zh->service->stop_flag = 1;
366     if (!zh->service->sessions)
367         zebra_register_deactivate(zh->service);
368     zebra_mutex_cond_unlock (&zh->service->session_lock);
369 }
370
371 void zebra_admin_start (ZebraHandle zh)
372 {
373     ZebraService zs = zh->service;
374     zh->errCode = 0;
375     zebra_mutex_cond_lock (&zs->session_lock);
376     if (!zs->stop_flag)
377         zebra_register_activate(zs);
378     zebra_mutex_cond_unlock (&zs->session_lock);
379 }
380
381 static int zebra_register_deactivate (ZebraService zh)
382 {
383     zh->stop_flag = 0;
384     if (!zh->active)
385         return 0;
386     yaz_log(LOG_LOG, "zebra_register_deactivate");
387     zebra_chdir (zh);
388     if (zh->records)
389     {
390         zebraExplain_close (zh->zei, 1);
391         dict_close (zh->dict);
392         sortIdx_close (zh->sortIdx);
393         if (zh->isams)
394             isams_close (zh->isams);
395 #if ZMBOL
396         if (zh->isam)
397             is_close (zh->isam);
398         if (zh->isamc)
399             isc_close (zh->isamc);
400         if (zh->isamd)
401             isamd_close (zh->isamd);
402 #endif
403         rec_close (&zh->records);
404     }
405     recTypes_destroy (zh->recTypes);
406     zebra_maps_close (zh->zebra_maps);
407     zebraRankDestroy (zh);
408     bfs_destroy (zh->bfs);
409     data1_destroy (zh->dh);
410
411     if (zh->passwd_db)
412         passwd_db_close (zh->passwd_db);
413     res_close (zh->res);
414     zh->active = 0;
415     return 0;
416 }
417
418 void zebra_stop(ZebraService zh)
419 {
420     if (!zh)
421         return ;
422     yaz_log (LOG_LOG, "zebra_stop");
423
424     assert (!zh->sessions);
425
426     zebra_mutex_cond_destroy (&zh->session_lock);
427
428     zebra_register_deactivate(zh);
429     xfree (zh->configName);
430     xfree (zh);
431 }
432
433 void zebra_close (ZebraHandle zh)
434 {
435     ZebraService zs = zh->service;
436     struct zebra_session **sp;
437     if (!zh)
438         return ;
439     resultSetDestroy (zh, -1, 0, 0);
440
441     if (zh->key_buf)
442     {
443         xfree (zh->key_buf);
444         zh->key_buf = 0;
445     }
446     xfree (zh->admin_databaseName);
447     zebra_mutex_cond_lock (&zs->session_lock);
448     sp = &zs->sessions;
449     while (1)
450     {
451         assert (*sp);
452         if (*sp == zh)
453         {
454             *sp = (*sp)->next;
455             break;
456         }
457         sp = &(*sp)->next;
458     }
459     if (!zs->sessions && zs->stop_flag)
460         zebra_register_deactivate(zs);
461     zebra_mutex_cond_unlock (&zs->session_lock);
462     xfree (zh);
463 }
464
465 struct map_baseinfo {
466     ZebraHandle zh;
467     NMEM mem;
468     int num_bases;
469     char **basenames;
470     int new_num_bases;
471     char **new_basenames;
472     int new_num_max;
473 };
474         
475 void map_basenames_func (void *vp, const char *name, const char *value)
476 {
477     struct map_baseinfo *p = (struct map_baseinfo *) vp;
478     int i, no;
479     char fromdb[128], todb[8][128];
480     
481     no =
482         sscanf (value, "%127s %127s %127s %127s %127s %127s %127s %127s %127s",
483                 fromdb, todb[0], todb[1], todb[2], todb[3], todb[4],
484                 todb[5], todb[6], todb[7]);
485     if (no < 2)
486         return ;
487     no--;
488     for (i = 0; i<p->num_bases; i++)
489         if (p->basenames[i] && !strcmp (p->basenames[i], fromdb))
490         {
491             p->basenames[i] = 0;
492             for (i = 0; i < no; i++)
493             {
494                 if (p->new_num_bases == p->new_num_max)
495                     return;
496                 p->new_basenames[(p->new_num_bases)++] = 
497                     nmem_strdup (p->mem, todb[i]);
498             }
499             return;
500         }
501 }
502
503 void map_basenames (ZebraHandle zh, ODR stream,
504                     int *num_bases, char ***basenames)
505 {
506     struct map_baseinfo info;
507     struct map_baseinfo *p = &info;
508     int i;
509
510     info.zh = zh;
511     info.num_bases = *num_bases;
512     info.basenames = *basenames;
513     info.new_num_max = 128;
514     info.new_num_bases = 0;
515     info.new_basenames = (char **)
516         odr_malloc (stream, sizeof(*info.new_basenames) * info.new_num_max);
517     info.mem = stream->mem;
518
519     res_trav (zh->service->res, "mapdb", &info, map_basenames_func);
520     
521     for (i = 0; i<p->num_bases; i++)
522         if (p->basenames[i] && p->new_num_bases < p->new_num_max)
523         {
524             p->new_basenames[(p->new_num_bases)++] = 
525                 nmem_strdup (p->mem, p->basenames[i]);
526         }
527     *num_bases = info.new_num_bases;
528     *basenames = info.new_basenames;
529     for (i = 0; i<*num_bases; i++)
530         logf (LOG_LOG, "base %s", (*basenames)[i]);
531 }
532
533 void zebra_search_rpn (ZebraHandle zh, ODR stream, ODR decode,
534                        Z_RPNQuery *query, int num_bases, char **basenames, 
535                        const char *setname)
536 {
537     zh->hits = 0;
538     if (zebra_register_lock (zh))
539         return;
540     map_basenames (zh, stream, &num_bases, &basenames);
541     resultSetAddRPN (zh, stream, decode, query, num_bases, basenames, setname);
542
543     zebra_register_unlock (zh);
544
545     logf(LOG_APP,"SEARCH:%d:",zh->hits);
546 }
547
548 void zebra_records_retrieve (ZebraHandle zh, ODR stream,
549                              const char *setname, Z_RecordComposition *comp,
550                              oid_value input_format, int num_recs,
551                              ZebraRetrievalRecord *recs)
552 {
553     ZebraPosSet poset;
554     int i, *pos_array;
555
556     if (zebra_register_lock (zh))
557         return;
558     pos_array = (int *) xmalloc (num_recs * sizeof(*pos_array));
559     for (i = 0; i<num_recs; i++)
560         pos_array[i] = recs[i].position;
561     poset = zebraPosSetCreate (zh, setname, num_recs, pos_array);
562     if (!poset)
563     {
564         logf (LOG_DEBUG, "zebraPosSetCreate error");
565         zh->errCode = 30;
566         zh->errString = nmem_strdup (stream->mem, setname);
567     }
568     else
569     {
570         for (i = 0; i<num_recs; i++)
571         {
572             if (!poset[i].sysno)
573             {
574                 char num_str[20];
575
576                 sprintf (num_str, "%d", pos_array[i]);  
577                 zh->errCode = 13;
578                 zh->errString = nmem_strdup (stream->mem, num_str);
579                 break;
580             }
581             else
582             {
583                 recs[i].errCode =
584                     zebra_record_fetch (zh, poset[i].sysno, poset[i].score,
585                                         stream, input_format, comp,
586                                         &recs[i].format, &recs[i].buf,
587                                         &recs[i].len,
588                                         &recs[i].base);
589                 recs[i].errString = NULL;
590             }
591         }
592         zebraPosSetDestroy (zh, poset, num_recs);
593     }
594     zebra_register_unlock (zh);
595     xfree (pos_array);
596 }
597
598 void zebra_scan (ZebraHandle zh, ODR stream, Z_AttributesPlusTerm *zapt,
599                  oid_value attributeset,
600                  int num_bases, char **basenames,
601                  int *position, int *num_entries, ZebraScanEntry **entries,
602                  int *is_partial)
603 {
604     if (zebra_register_lock (zh))
605     {
606         *entries = 0;
607         *num_entries = 0;
608         return;
609     }
610     map_basenames (zh, stream, &num_bases, &basenames);
611     rpn_scan (zh, stream, zapt, attributeset,
612               num_bases, basenames, position,
613               num_entries, entries, is_partial);
614     zebra_register_unlock (zh);
615 }
616
617 void zebra_sort (ZebraHandle zh, ODR stream,
618                  int num_input_setnames, const char **input_setnames,
619                  const char *output_setname, Z_SortKeySpecList *sort_sequence,
620                  int *sort_status)
621 {
622     if (zebra_register_lock (zh))
623         return;
624     resultSetSort (zh, stream->mem, num_input_setnames, input_setnames,
625                    output_setname, sort_sequence, sort_status);
626     zebra_register_unlock (zh);
627 }
628
629 int zebra_deleleResultSet(ZebraHandle zh, int function,
630                           int num_setnames, char **setnames,
631                           int *statuses)
632 {
633     int i, status;
634     if (zebra_register_lock (zh))
635         return Z_DeleteStatus_systemProblemAtTarget;
636     switch (function)
637     {
638     case Z_DeleteRequest_list:
639         resultSetDestroy (zh, num_setnames, setnames, statuses);
640         break;
641     case Z_DeleteRequest_all:
642         resultSetDestroy (zh, -1, 0, statuses);
643         break;
644     }
645     zebra_register_unlock (zh);
646     status = Z_DeleteStatus_success;
647     for (i = 0; i<num_setnames; i++)
648         if (statuses[i] == Z_DeleteStatus_resultSetDidNotExist)
649             status = statuses[i];
650     return status;
651 }
652
653 int zebra_errCode (ZebraHandle zh)
654 {
655     return zh->errCode;
656 }
657
658 const char *zebra_errString (ZebraHandle zh)
659 {
660     return diagbib1_str (zh->errCode);
661 }
662
663 char *zebra_errAdd (ZebraHandle zh)
664 {
665     return zh->errString;
666 }
667
668 int zebra_hits (ZebraHandle zh)
669 {
670     return zh->hits;
671 }
672
673 int zebra_auth (ZebraService zh, const char *user, const char *pass)
674 {
675     if (!zh->passwd_db || !passwd_db_auth (zh->passwd_db, user, pass))
676     {
677         logf(LOG_APP,"AUTHOK:%s", user?user:"ANONYMOUS");
678         return 0;
679     }
680
681     logf(LOG_APP,"AUTHFAIL:%s", user?user:"ANONYMOUS");
682     return 1;
683 }
684
685 void zebra_admin_import_begin (ZebraHandle zh, const char *database)
686 {
687     if (zebra_register_lock (zh))
688         return;
689     xfree (zh->admin_databaseName);
690     zh->admin_databaseName = xstrdup(database);
691     zebra_register_unlock(zh);
692 }
693
694 void zebra_admin_import_end (ZebraHandle zh)
695 {
696     zebraExplain_flush (zh->service->zei, 1, zh);
697     extract_index (zh);
698 }
699
700 void zebra_admin_import_segment (ZebraHandle zh, Z_Segment *segment)
701 {
702     int sysno;
703     int i;
704     if (zebra_register_lock (zh))
705         return;
706     for (i = 0; i<segment->num_segmentRecords; i++)
707     {
708         Z_NamePlusRecord *npr = segment->segmentRecords[i];
709         const char *databaseName = npr->databaseName;
710
711         if (!databaseName)
712             databaseName = zh->admin_databaseName;
713         printf ("--------------%d--------------------\n", i);
714         if (npr->which == Z_NamePlusRecord_intermediateFragment)
715         {
716             Z_FragmentSyntax *fragment = npr->u.intermediateFragment;
717             if (fragment->which == Z_FragmentSyntax_notExternallyTagged)
718             {
719                 Odr_oct *oct = fragment->u.notExternallyTagged;
720                 printf ("%.*s", (oct->len > 100 ? 100 : oct->len) ,
721                         oct->buf);
722                 
723                 sysno = 0;
724                 extract_rec_in_mem (zh, "grs.sgml",
725                                     oct->buf, oct->len,
726                                     databaseName,
727                                     0 /* delete_flag */,
728                                     0 /* test_mode */,
729                                     &sysno /* sysno */,
730                                     1 /* store_keys */,
731                                     1 /* store_data */,
732                                     0 /* match criteria */);
733             }
734         }
735     }
736     zebra_register_unlock(zh);
737 }
738
739 void zebra_admin_create (ZebraHandle zh, const char *database)
740 {
741     ZebraService zs = zh->service;
742     if (zebra_register_lock(zh))
743     {
744         zh->errCode = 1019;
745         return;
746     }
747     /* announce database */
748     if (zebraExplain_newDatabase (zs->zei, database, 0 /* explainDatabase */))
749     {
750         zh->errCode = 224;
751         zh->errString = "Database already exist";
752     }
753     zebra_register_unlock(zh);
754 }
755
756 int zebra_string_norm (ZebraHandle zh, unsigned reg_id,
757                        const char *input_str, int input_len,
758                        char *output_str, int output_len)
759 {
760     WRBUF wrbuf;
761     if (!zh->service->zebra_maps)
762         return -1;
763     wrbuf = zebra_replace(zh->service->zebra_maps, reg_id, "",
764                           input_str, input_len);
765     if (!wrbuf)
766         return -2;
767     if (wrbuf_len(wrbuf) >= output_len)
768         return -3;
769     if (wrbuf_len(wrbuf))
770         memcpy (output_str, wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
771     output_str[wrbuf_len(wrbuf)] = '\0';
772     return wrbuf_len(wrbuf);
773 }
774
775 static void extract_init (struct recExtractCtrl *p, RecWord *w)
776 {
777     w->zebra_maps = p->zebra_maps;
778     w->seqnos = p->seqno;
779     w->attrSet = VAL_BIB1;
780     w->attrUse = 1016;
781     w->reg_type = 'w';
782     w->extractCtrl = p;
783 }
784
785 static void extract_add_index_string (RecWord *p, const char *string,
786                                       int length)
787 {
788     char *dst;
789     unsigned char attrSet;
790     unsigned short attrUse;
791     int lead = 0;
792     int diff = 0;
793     int *pseqno = &p->seqnos[p->reg_type];
794     ZebraHandle zh = p->extractCtrl->handle;
795     struct recKeys *keys = &zh->keys;
796
797     if (keys->buf_used+1024 > keys->buf_max)
798     {
799         char *b;
800
801         b = (char *) xmalloc (keys->buf_max += 128000);
802         if (keys->buf_used > 0)
803             memcpy (b, keys->buf, keys->buf_used);
804         xfree (keys->buf);
805         keys->buf = b;
806     }
807     dst = keys->buf + keys->buf_used;
808
809     attrSet = p->attrSet;
810     if (keys->buf_used > 0 && keys->prevAttrSet == attrSet)
811         lead |= 1;
812     else
813         keys->prevAttrSet = attrSet;
814     attrUse = p->attrUse;
815     if (keys->buf_used > 0 && keys->prevAttrUse == attrUse)
816         lead |= 2;
817     else
818         keys->prevAttrUse = attrUse;
819 #if 1
820     diff = 1 + *pseqno - keys->prevSeqNo;
821     if (diff >= 1 && diff <= 15)
822         lead |= (diff << 2);
823     else
824         diff = 0;
825 #endif
826     keys->prevSeqNo = *pseqno;
827     
828     *dst++ = lead;
829
830     if (!(lead & 1))
831     {
832         memcpy (dst, &attrSet, sizeof(attrSet));
833         dst += sizeof(attrSet);
834     }
835     if (!(lead & 2))
836     {
837         memcpy (dst, &attrUse, sizeof(attrUse));
838         dst += sizeof(attrUse);
839     }
840     *dst++ = p->reg_type;
841     memcpy (dst, string, length);
842     dst += length;
843     *dst++ = '\0';
844
845     if (!diff)
846     {
847         memcpy (dst, pseqno, sizeof(*pseqno));
848         dst += sizeof(*pseqno);
849     }
850     keys->buf_used = dst - keys->buf;
851     if (*pseqno)
852         (*pseqno)++;
853 }
854
855 static void extract_add_sort_string (RecWord *p, const char *string,
856                                      int length)
857 {
858     struct sortKey *sk;
859     ZebraHandle zh = p->extractCtrl->handle;
860     struct sortKey *sortKeys = zh->sortKeys;
861
862     for (sk = sortKeys; sk; sk = sk->next)
863         if (sk->attrSet == p->attrSet && sk->attrUse == p->attrUse)
864             return;
865
866     sk = (struct sortKey *) xmalloc (sizeof(*sk));
867     sk->next = sortKeys;
868     sortKeys = sk;
869
870     sk->string = (char *) xmalloc (length);
871     sk->length = length;
872     memcpy (sk->string, string, length);
873
874     sk->attrSet = p->attrSet;
875     sk->attrUse = p->attrUse;
876 }
877
878 static void extract_add_string (RecWord *p, const char *string, int length)
879 {
880     assert (length > 0);
881     if (zebra_maps_is_sort (p->zebra_maps, p->reg_type))
882         extract_add_sort_string (p, string, length);
883     else
884         extract_add_index_string (p, string, length);
885 }
886
887 static void extract_add_incomplete_field (RecWord *p)
888 {
889     const char *b = p->string;
890     int remain = p->length;
891     const char **map = 0;
892
893     if (remain > 0)
894         map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
895
896     while (map)
897     {
898         char buf[IT_MAX_WORD+1];
899         int i, remain;
900
901         /* Skip spaces */
902         while (map && *map && **map == *CHR_SPACE)
903         {
904             remain = p->length - (b - p->string);
905             if (remain > 0)
906                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
907             else
908                 map = 0;
909         }
910         if (!map)
911             break;
912         i = 0;
913         while (map && *map && **map != *CHR_SPACE)
914         {
915             const char *cp = *map;
916
917             while (i < IT_MAX_WORD && *cp)
918                 buf[i++] = *(cp++);
919             remain = p->length - (b - p->string);
920             if (remain > 0)
921                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
922             else
923                 map = 0;
924         }
925         if (!i)
926             return;
927         extract_add_string (p, buf, i);
928     }
929     (p->seqnos[p->reg_type])++; /* to separate this from next one  */
930 }
931
932 static void extract_add_complete_field (RecWord *p)
933 {
934     const char *b = p->string;
935     char buf[IT_MAX_WORD+1];
936     const char **map = 0;
937     int i = 0, remain = p->length;
938
939     if (remain > 0)
940         map = zebra_maps_input (p->zebra_maps, p->reg_type, &b, remain);
941
942     while (remain > 0 && i < IT_MAX_WORD)
943     {
944         while (map && *map && **map == *CHR_SPACE)
945         {
946             remain = p->length - (b - p->string);
947             if (remain > 0)
948                 map = zebra_maps_input(p->zebra_maps, p->reg_type, &b, remain);
949             else
950                 map = 0;
951         }
952         if (!map)
953             break;
954
955         if (i && i < IT_MAX_WORD)
956             buf[i++] = *CHR_SPACE;
957         while (map && *map && **map != *CHR_SPACE)
958         {
959             const char *cp = *map;
960
961             if (i >= IT_MAX_WORD)
962                 break;
963             while (i < IT_MAX_WORD && *cp)
964                 buf[i++] = *(cp++);
965             remain = p->length  - (b - p->string);
966             if (remain > 0)
967                 map = zebra_maps_input (p->zebra_maps, p->reg_type, &b,
968                                         remain);
969             else
970                 map = 0;
971         }
972     }
973     if (!i)
974         return;
975     extract_add_string (p, buf, i);
976 }
977
978 static void extract_token_add (RecWord *p)
979 {
980     WRBUF wrbuf;
981     if ((wrbuf = zebra_replace(p->zebra_maps, p->reg_type, 0,
982                                p->string, p->length)))
983     {
984         p->string = wrbuf_buf(wrbuf);
985         p->length = wrbuf_len(wrbuf);
986     }
987     if (zebra_maps_is_complete (p->zebra_maps, p->reg_type))
988         extract_add_complete_field (p);
989     else
990         extract_add_incomplete_field(p);
991 }
992
993 static void extract_schema_add (struct recExtractCtrl *p, Odr_oid *oid)
994 {
995     ZebraHandle zh = (ZebraHandle) (p->handle);
996     zebraExplain_addSchema (zh->service->zei, oid);
997 }
998
999 static void extract_flushSortKeys (ZebraHandle zh, SYSNO sysno,
1000                                    int cmd, struct sortKey **skp)
1001 {
1002     struct sortKey *sk = *skp;
1003     SortIdx sortIdx = zh->service->sortIdx;
1004
1005     sortIdx_sysno (sortIdx, sysno);
1006     while (sk)
1007     {
1008         struct sortKey *sk_next = sk->next;
1009         sortIdx_type (sortIdx, sk->attrUse);
1010         sortIdx_add (sortIdx, sk->string, sk->length);
1011         xfree (sk->string);
1012         xfree (sk);
1013         sk = sk_next;
1014     }
1015     *skp = 0;
1016 }
1017
1018 struct encode_info {
1019     int  sysno;
1020     int  seqno;
1021     int  cmd;
1022     char buf[768];
1023 };
1024
1025 void encode_key_init (struct encode_info *i)
1026 {
1027     i->sysno = 0;
1028     i->seqno = 0;
1029     i->cmd = -1;
1030 }
1031
1032 char *encode_key_int (int d, char *bp)
1033 {
1034     if (d <= 63)
1035         *bp++ = d;
1036     else if (d <= 16383)
1037     {
1038         *bp++ = 64 + (d>>8);
1039         *bp++ = d  & 255;
1040     }
1041     else if (d <= 4194303)
1042     {
1043         *bp++ = 128 + (d>>16);
1044         *bp++ = (d>>8) & 255;
1045         *bp++ = d & 255;
1046     }
1047     else
1048     {
1049         *bp++ = 192 + (d>>24);
1050         *bp++ = (d>>16) & 255;
1051         *bp++ = (d>>8) & 255;
1052         *bp++ = d & 255;
1053     }
1054     return bp;
1055 }
1056
1057 void encode_key_write (char *k, struct encode_info *i, FILE *outf)
1058 {
1059     struct it_key key;
1060     char *bp = i->buf;
1061
1062     while ((*bp++ = *k++))
1063         ;
1064     memcpy (&key, k+1, sizeof(struct it_key));
1065     bp = encode_key_int ( (key.sysno - i->sysno) * 2 + *k, bp);
1066     if (i->sysno != key.sysno)
1067     {
1068         i->sysno = key.sysno;
1069         i->seqno = 0;
1070     }
1071     else if (!i->seqno && !key.seqno && i->cmd == *k)
1072         return;
1073     bp = encode_key_int (key.seqno - i->seqno, bp);
1074     i->seqno = key.seqno;
1075     i->cmd = *k;
1076     if (fwrite (i->buf, bp - i->buf, 1, outf) != 1)
1077     {
1078         logf (LOG_FATAL|LOG_ERRNO, "fwrite");
1079         exit (1);
1080     }
1081 }
1082
1083 static void extract_flushWriteKeys (ZebraHandle zh)
1084 {
1085     FILE *outf;
1086     char out_fname[200];
1087     char *prevcp, *cp;
1088     struct encode_info encode_info;
1089     int ptr_i = zh->ptr_i;
1090 #if SORT_EXTRA
1091     int i;
1092 #endif
1093     if (!zh->key_buf || ptr_i <= 0)
1094         return;
1095
1096     (zh->key_file_no)++;
1097     logf (LOG_LOG, "sorting section %d", (zh->key_file_no));
1098 #if !SORT_EXTRA
1099     qsort (zh->key_buf + zh->ptr_top - ptr_i, ptr_i, sizeof(char*),
1100             key_qsort_compare);
1101     extract_get_fname_tmp (zh, out_fname, zh->key_file_no);
1102
1103     if (!(outf = fopen (out_fname, "wb")))
1104     {
1105         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1106         exit (1);
1107     }
1108     logf (LOG_LOG, "writing section %d", zh->key_file_no);
1109     prevcp = cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1110     
1111     encode_key_init (&encode_info);
1112     encode_key_write (cp, &encode_info, outf);
1113     
1114     while (--ptr_i > 0)
1115     {
1116         cp = (zh->key_buf)[zh->ptr_top - ptr_i];
1117         if (strcmp (cp, prevcp))
1118         {
1119             encode_key_init (&encode_info);
1120             encode_key_write (cp, &encode_info, outf);
1121             prevcp = cp;
1122         }
1123         else
1124             encode_key_write (cp + strlen(cp), &encode_info, outf);
1125     }
1126 #else
1127     qsort (key_buf + ptr_top-ptr_i, ptr_i, sizeof(char*), key_x_compare);
1128     extract_get_fname_tmp (out_fname, key_file_no);
1129
1130     if (!(outf = fopen (out_fname, "wb")))
1131     {
1132         logf (LOG_FATAL|LOG_ERRNO, "fopen %s", out_fname);
1133         exit (1);
1134     }
1135     logf (LOG_LOG, "writing section %d", key_file_no);
1136     i = ptr_i;
1137     prevcp =  key_buf[ptr_top-i];
1138     while (1)
1139         if (!--i || strcmp (prevcp, key_buf[ptr_top-i]))
1140         {
1141             key_y_len = strlen(prevcp)+1;
1142 #if 0
1143             logf (LOG_LOG, "key_y_len: %2d %02x %02x %s",
1144                       key_y_len, prevcp[0], prevcp[1], 2+prevcp);
1145 #endif
1146             qsort (key_buf + ptr_top-ptr_i, ptr_i - i,
1147                                    sizeof(char*), key_y_compare);
1148             cp = key_buf[ptr_top-ptr_i];
1149             --key_y_len;
1150             encode_key_init (&encode_info);
1151             encode_key_write (cp, &encode_info, outf);
1152             while (--ptr_i > i)
1153             {
1154                 cp = key_buf[ptr_top-ptr_i];
1155                 encode_key_write (cp+key_y_len, &encode_info, outf);
1156             }
1157             if (!i)
1158                 break;
1159             prevcp = key_buf[ptr_top-ptr_i];
1160         }
1161 #endif
1162     if (fclose (outf))
1163     {
1164         logf (LOG_FATAL|LOG_ERRNO, "fclose %s", out_fname);
1165         exit (1);
1166     }
1167     logf (LOG_LOG, "finished section %d", zh->key_file_no);
1168     zh->ptr_i = 0;
1169     zh->key_buf_used = 0;
1170 }
1171
1172 static void extract_flushRecordKeys (ZebraHandle zh, SYSNO sysno,
1173                                      int cmd, struct recKeys *reckeys)
1174 {
1175     unsigned char attrSet = (unsigned char) -1;
1176     unsigned short attrUse = (unsigned short) -1;
1177     int seqno = 0;
1178     int off = 0;
1179     ZebraExplainInfo zei = zh->service->zei;
1180
1181     if (!zh->key_buf)
1182     {
1183         int mem = 8*1024*1024;
1184         zh->key_buf = (char**) xmalloc (mem);
1185         zh->ptr_top = mem/sizeof(char*);
1186         zh->ptr_i = 0;
1187         zh->key_buf_used = 0;
1188         zh->key_file_no = 0;
1189     }
1190     zebraExplain_recordCountIncrement (zei, cmd ? 1 : -1);
1191     while (off < reckeys->buf_used)
1192     {
1193         const char *src = reckeys->buf + off;
1194         struct it_key key;
1195         int lead, ch;
1196     
1197         lead = *src++;
1198
1199         if (!(lead & 1))
1200         {
1201             memcpy (&attrSet, src, sizeof(attrSet));
1202             src += sizeof(attrSet);
1203         }
1204         if (!(lead & 2))
1205         {
1206             memcpy (&attrUse, src, sizeof(attrUse));
1207             src += sizeof(attrUse);
1208         }
1209         if (zh->key_buf_used + 1024 > (zh->ptr_top-zh->ptr_i)*sizeof(char*))
1210             extract_flushWriteKeys (zh);
1211         ++(zh->ptr_i);
1212         (zh->key_buf)[zh->ptr_top - zh->ptr_i] =
1213             (char*)zh->key_buf + zh->key_buf_used;
1214
1215         ch = zebraExplain_lookupSU (zei, attrSet, attrUse);
1216         if (ch < 0)
1217             ch = zebraExplain_addSU (zei, attrSet, attrUse);
1218         assert (ch > 0);
1219         zh->key_buf_used +=
1220             key_SU_code (ch,((char*)zh->key_buf) + zh->key_buf_used);
1221
1222         while (*src)
1223             ((char*)zh->key_buf) [(zh->key_buf_used)++] = *src++;
1224         src++;
1225         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = '\0';
1226         ((char*)(zh->key_buf))[(zh->key_buf_used)++] = cmd;
1227
1228         if (lead & 60)
1229             seqno += ((lead>>2) & 15)-1;
1230         else
1231         {
1232             memcpy (&seqno, src, sizeof(seqno));
1233             src += sizeof(seqno);
1234         }
1235         key.seqno = seqno;
1236         key.sysno = sysno;
1237         memcpy ((char*)zh->key_buf + zh->key_buf_used, &key, sizeof(key));
1238         (zh->key_buf_used) += sizeof(key);
1239         off = src - reckeys->buf;
1240     }
1241     assert (off == reckeys->buf_used);
1242 }
1243
1244 static void extract_index (ZebraHandle zh)
1245 {
1246     extract_flushWriteKeys (zh);
1247     zebra_index_merge (zh);
1248 }
1249
1250 static int explain_extract (void *handle, Record rec, data1_node *n)
1251 {
1252     ZebraHandle zh = (ZebraHandle) handle;
1253     struct recExtractCtrl extractCtrl;
1254     int i;
1255
1256     if (zebraExplain_curDatabase (zh->service->zei,
1257                                   rec->info[recInfo_databaseName]))
1258     {
1259         abort();
1260         if (zebraExplain_newDatabase (zh->service->zei,
1261                                       rec->info[recInfo_databaseName], 0))
1262             abort ();
1263     }
1264
1265     zh->keys.buf_used = 0;
1266     zh->keys.prevAttrUse = -1;
1267     zh->keys.prevAttrSet = -1;
1268     zh->keys.prevSeqNo = 0;
1269     zh->sortKeys = 0;
1270     
1271     extractCtrl.init = extract_init;
1272     extractCtrl.tokenAdd = extract_token_add;
1273     extractCtrl.schemaAdd = extract_schema_add;
1274     extractCtrl.dh = zh->service->dh;
1275     for (i = 0; i<256; i++)
1276         extractCtrl.seqno[i] = 0;
1277     extractCtrl.zebra_maps = zh->service->zebra_maps;
1278     extractCtrl.flagShowRecords = 0;
1279     extractCtrl.handle = handle;
1280     
1281     grs_extract_tree(&extractCtrl, n);
1282
1283     logf (LOG_LOG, "flush explain record, sysno=%d", rec->sysno);
1284
1285     if (rec->size[recInfo_delKeys])
1286     {
1287         struct recKeys delkeys;
1288         struct sortKey *sortKeys = 0;
1289
1290         delkeys.buf_used = rec->size[recInfo_delKeys];
1291         delkeys.buf = rec->info[recInfo_delKeys];
1292         extract_flushSortKeys (zh, rec->sysno, 0, &sortKeys);
1293         extract_flushRecordKeys (zh, rec->sysno, 0, &delkeys);
1294     }
1295     extract_flushRecordKeys (zh, rec->sysno, 1, &zh->keys);
1296     extract_flushSortKeys (zh, rec->sysno, 1, &zh->sortKeys);
1297
1298     xfree (rec->info[recInfo_delKeys]);
1299     rec->size[recInfo_delKeys] = zh->keys.buf_used;
1300     rec->info[recInfo_delKeys] = zh->keys.buf;
1301     zh->keys.buf = NULL;
1302     zh->keys.buf_max = 0;
1303     return 0;
1304 }
1305
1306 static int extract_rec_in_mem (ZebraHandle zh, const char *recordType,
1307                                const char *buf, size_t buf_size,
1308                                const char *databaseName, int delete_flag,
1309                                int test_mode, int *sysno,
1310                                int store_keys, int store_data,
1311                                const char *match_criteria)
1312 {
1313     RecordAttr *recordAttr;
1314     struct recExtractCtrl extractCtrl;
1315     int i, r;
1316     RecType recType;
1317     char subType[1024];
1318     void *clientData;
1319     const char *fname = "<no file>";
1320     Record rec;
1321     long recordOffset = 0;
1322     struct zebra_fetch_control fc;
1323
1324     fc.fd = -1;
1325     fc.record_int_buf = buf;
1326     fc.record_int_len = buf_size;
1327     fc.record_int_pos = 0;
1328     fc.offset_end = 0;
1329     fc.record_offset = 0;
1330
1331     extractCtrl.offset = 0;
1332     extractCtrl.readf = zebra_record_int_read;
1333     extractCtrl.seekf = zebra_record_int_seek;
1334     extractCtrl.tellf = zebra_record_int_tell;
1335     extractCtrl.endf = zebra_record_int_end;
1336     extractCtrl.fh = &fc;
1337
1338     /* announce database */
1339     if (zebraExplain_curDatabase (zh->service->zei, databaseName))
1340     {
1341         if (zebraExplain_newDatabase (zh->service->zei, databaseName, 0))
1342             return 0;
1343     }
1344     if (!(recType =
1345           recType_byName (zh->service->recTypes, recordType, subType,
1346                           &clientData)))
1347     {
1348         logf (LOG_WARN, "No such record type: %s", recordType);
1349         return 0;
1350     }
1351
1352     zh->keys.buf_used = 0;
1353     zh->keys.prevAttrUse = -1;
1354     zh->keys.prevAttrSet = -1;
1355     zh->keys.prevSeqNo = 0;
1356     zh->sortKeys = 0;
1357
1358     extractCtrl.subType = subType;
1359     extractCtrl.init = extract_init;
1360     extractCtrl.tokenAdd = extract_token_add;
1361     extractCtrl.schemaAdd = extract_schema_add;
1362     extractCtrl.dh = zh->service->dh;
1363     extractCtrl.handle = zh;
1364     extractCtrl.zebra_maps = zh->service->zebra_maps;
1365     extractCtrl.flagShowRecords = 0;
1366     for (i = 0; i<256; i++)
1367     {
1368         if (zebra_maps_is_positioned(zh->service->zebra_maps, i))
1369             extractCtrl.seqno[i] = 1;
1370         else
1371             extractCtrl.seqno[i] = 0;
1372     }
1373
1374     r = (*recType->extract)(clientData, &extractCtrl);
1375
1376     if (r == RECCTRL_EXTRACT_EOF)
1377         return 0;
1378     else if (r == RECCTRL_EXTRACT_ERROR)
1379     {
1380         /* error occured during extraction ... */
1381 #if 1
1382         yaz_log (LOG_WARN, "extract error");
1383 #else
1384         if (rGroup->flagRw &&
1385             records_processed < rGroup->fileVerboseLimit)
1386         {
1387             logf (LOG_WARN, "fail %s %s %ld", rGroup->recordType,
1388                   fname, (long) recordOffset);
1389         }
1390 #endif
1391         return 0;
1392     }
1393     if (zh->keys.buf_used == 0)
1394     {
1395         /* the extraction process returned no information - the record
1396            is probably empty - unless flagShowRecords is in use */
1397         if (test_mode)
1398             return 1;
1399         logf (LOG_WARN, "No keys generated for record");
1400         logf (LOG_WARN, " The file is probably empty");
1401         return 1;
1402     }
1403     /* match criteria */
1404
1405     if (! *sysno)
1406     {
1407         /* new record */
1408         if (delete_flag)
1409         {
1410             logf (LOG_LOG, "delete %s %s %ld", recordType,
1411                   fname, (long) recordOffset);
1412             logf (LOG_WARN, "cannot delete record above (seems new)");
1413             return 1;
1414         }
1415         logf (LOG_LOG, "add %s %s %ld", recordType, fname,
1416               (long) recordOffset);
1417         rec = rec_new (zh->service->records);
1418
1419         *sysno = rec->sysno;
1420
1421         recordAttr = rec_init_attr (zh->service->zei, rec);
1422
1423 #if 0
1424         if (matchStr)
1425         {
1426             dict_insert (matchDict, matchStr, sizeof(*sysno), sysno);
1427         }
1428 #endif
1429         extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1430         extract_flushSortKeys (zh, *sysno, 1, &zh->sortKeys);
1431     }
1432     else
1433     {
1434         /* record already exists */
1435         struct recKeys delkeys;
1436
1437         rec = rec_get (zh->service->records, *sysno);
1438         assert (rec);
1439         
1440         recordAttr = rec_init_attr (zh->service->zei, rec);
1441
1442         if (recordAttr->runNumber ==
1443             zebraExplain_runNumberIncrement (zh->service->zei, 0))
1444         {
1445             logf (LOG_LOG, "skipped %s %s %ld", recordType,
1446                   fname, (long) recordOffset);
1447             rec_rm (&rec);
1448             return 1;
1449         }
1450         delkeys.buf_used = rec->size[recInfo_delKeys];
1451         delkeys.buf = rec->info[recInfo_delKeys];
1452         extract_flushSortKeys (zh, *sysno, 0, &zh->sortKeys);
1453         extract_flushRecordKeys (zh, *sysno, 0, &delkeys);
1454         if (delete_flag)
1455         {
1456             /* record going to be deleted */
1457             if (!delkeys.buf_used)
1458             {
1459                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1460                       fname, (long) recordOffset);
1461                 logf (LOG_WARN, "cannot delete file above, storeKeys false");
1462             }
1463             else
1464             {
1465                 logf (LOG_LOG, "delete %s %s %ld", recordType,
1466                       fname, (long) recordOffset);
1467 #if 0
1468                 if (matchStr)
1469                     dict_delete (matchDict, matchStr);
1470 #endif
1471                 rec_del (zh->service->records, &rec);
1472             }
1473             rec_rm (&rec);
1474             return 1;
1475         }
1476         else
1477         {
1478             /* record going to be updated */
1479             if (!delkeys.buf_used)
1480             {
1481                 logf (LOG_LOG, "update %s %s %ld", recordType,
1482                       fname, (long) recordOffset);
1483                 logf (LOG_WARN, "cannot update file above, storeKeys false");
1484             }
1485             else
1486             {
1487                 logf (LOG_LOG, "update %s %s %ld", recordType,
1488                       fname, (long) recordOffset);
1489                 extract_flushRecordKeys (zh, *sysno, 1, &zh->keys);
1490             }
1491         }
1492     }
1493     /* update file type */
1494     xfree (rec->info[recInfo_fileType]);
1495     rec->info[recInfo_fileType] =
1496         rec_strdup (recordType, &rec->size[recInfo_fileType]);
1497
1498     /* update filename */
1499     xfree (rec->info[recInfo_filename]);
1500     rec->info[recInfo_filename] =
1501         rec_strdup (fname, &rec->size[recInfo_filename]);
1502
1503     /* update delete keys */
1504     xfree (rec->info[recInfo_delKeys]);
1505     if (zh->keys.buf_used > 0 && store_keys == 1)
1506     {
1507         rec->size[recInfo_delKeys] = zh->keys.buf_used;
1508         rec->info[recInfo_delKeys] = zh->keys.buf;
1509         zh->keys.buf = NULL;
1510         zh->keys.buf_max = 0;
1511     }
1512     else
1513     {
1514         rec->info[recInfo_delKeys] = NULL;
1515         rec->size[recInfo_delKeys] = 0;
1516     }
1517
1518     /* save file size of original record */
1519     zebraExplain_recordBytesIncrement (zh->service->zei,
1520                                        - recordAttr->recordSize);
1521 #if 0
1522     recordAttr->recordSize = fi->file_moffset - recordOffset;
1523     if (!recordAttr->recordSize)
1524         recordAttr->recordSize = fi->file_max - recordOffset;
1525 #else
1526     recordAttr->recordSize = buf_size;
1527 #endif
1528     zebraExplain_recordBytesIncrement (zh->service->zei,
1529                                        recordAttr->recordSize);
1530
1531     /* set run-number for this record */
1532     recordAttr->runNumber =
1533         zebraExplain_runNumberIncrement (zh->service->zei, 0);
1534
1535     /* update store data */
1536     xfree (rec->info[recInfo_storeData]);
1537     if (store_data == 1)
1538     {
1539         rec->size[recInfo_storeData] = recordAttr->recordSize;
1540         rec->info[recInfo_storeData] = (char *)
1541             xmalloc (recordAttr->recordSize);
1542 #if 1
1543         memcpy (rec->info[recInfo_storeData], buf, recordAttr->recordSize);
1544 #else
1545         if (lseek (fi->fd, recordOffset, SEEK_SET) < 0)
1546         {
1547             logf (LOG_ERRNO|LOG_FATAL, "seek to %ld in %s",
1548                   (long) recordOffset, fname);
1549             exit (1);
1550         }
1551         if (read (fi->fd, rec->info[recInfo_storeData], recordAttr->recordSize)
1552             < recordAttr->recordSize)
1553         {
1554             logf (LOG_ERRNO|LOG_FATAL, "read %d bytes of %s",
1555                   recordAttr->recordSize, fname);
1556             exit (1);
1557         }
1558 #endif
1559     }
1560     else
1561     {
1562         rec->info[recInfo_storeData] = NULL;
1563         rec->size[recInfo_storeData] = 0;
1564     }
1565     /* update database name */
1566     xfree (rec->info[recInfo_databaseName]);
1567     rec->info[recInfo_databaseName] =
1568         rec_strdup (databaseName, &rec->size[recInfo_databaseName]); 
1569
1570     /* update offset */
1571     recordAttr->recordOffset = recordOffset;
1572     
1573     /* commit this record */
1574     rec_put (zh->service->records, &rec);
1575
1576     return 0;
1577 }