Introduce function data1_absyn_getmarctab, data1_absyn_getelements.
[idzebra-moved-to-github.git] / data1 / d1_absyn.c
1 /* $Id: d1_absyn.c,v 1.9.2.11 2006-10-26 23:46:48 adam Exp $
2    Copyright (C) 1995,1996,1997,1998,1999,2000,2001,2002
3    Index Data Aps
4
5 This file is part of the Zebra server.
6
7 Zebra is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with this program; if not, write to the Free Software
19 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
20
21 */
22
23 #include <stdio.h>
24 #include <assert.h>
25 #include <stdlib.h>
26 #include <string.h>
27
28 #include <yaz/oid.h>
29 #include <yaz/log.h>
30 #include <data1.h>
31 #include <zebra_xpath.h>
32
33 #define D1_MAX_NESTING  128
34
35 struct data1_systag {
36     char *name;
37     char *value;
38     struct data1_systag *next;
39 };
40
41 struct data1_absyn_cache_info 
42 {
43     char *name;
44     data1_absyn *absyn;
45     data1_absyn_cache next;
46 };
47
48 struct data1_attset_cache_info 
49 {
50     char *name;
51     data1_attset *attset;
52     data1_attset_cache next;
53 };
54
55 data1_absyn *data1_absyn_search (data1_handle dh, const char *name)
56 {
57     data1_absyn_cache p = *data1_absyn_cache_get (dh);
58
59     while (p)
60     {
61         if (!strcmp (name, p->name))
62             return p->absyn;
63         p = p->next;
64     }
65     return NULL;
66 }
67 /* *ostrich*
68    We need to destroy DFAs, in xp_element (xelm) definitions 
69    pop, 2002-12-13
70 */
71
72 void data1_absyn_destroy (data1_handle dh)
73 {
74     data1_absyn_cache p = *data1_absyn_cache_get (dh);
75     
76     while (p)
77     {
78         data1_absyn *abs = p->absyn;
79         if (abs)
80         {
81             data1_xpelement *xpe = abs->xp_elements;
82             while (xpe) {
83                 logf (LOG_DEBUG,"Destroy xp element %s",xpe->xpath_expr);
84                 if (xpe->dfa) {  dfa_delete (&xpe->dfa); }
85                 xpe = xpe->next;
86             } 
87         }
88         p = p->next;
89     }
90 }
91
92
93 void data1_absyn_trav (data1_handle dh, void *handle,
94                        void (*fh)(data1_handle dh, void *h, data1_absyn *a))
95 {
96     data1_absyn_cache p = *data1_absyn_cache_get (dh);
97
98     while (p)
99     {
100         (*fh)(dh, handle, p->absyn);
101         p = p->next;
102     }
103 }
104
105 data1_absyn *data1_absyn_add (data1_handle dh, const char *name)
106 {
107     char fname[512];
108     NMEM mem = data1_nmem_get (dh);
109
110     data1_absyn_cache p = (data1_absyn_cache)nmem_malloc (mem, sizeof(*p));
111     data1_absyn_cache *pp = data1_absyn_cache_get (dh);
112
113     sprintf(fname, "%s.abs", name);
114     p->absyn = data1_read_absyn (dh, fname, 0);
115     p->name = nmem_strdup (mem, name);
116     p->next = *pp;
117     *pp = p;
118     return p->absyn;
119 }
120
121 data1_absyn *data1_get_absyn (data1_handle dh, const char *name)
122 {
123     data1_absyn *absyn;
124
125     if (!(absyn = data1_absyn_search (dh, name)))
126         absyn = data1_absyn_add (dh, name);
127     return absyn;
128 }
129
130 data1_attset *data1_attset_search_name (data1_handle dh, const char *name)
131 {
132     data1_attset_cache p = *data1_attset_cache_get (dh);
133
134     while (p)
135     {
136         if (!strcmp (name, p->name))
137             return p->attset;
138         p = p->next;
139     }
140     return NULL;
141 }
142
143 data1_attset *data1_attset_search_id (data1_handle dh, int id)
144 {
145     data1_attset_cache p = *data1_attset_cache_get (dh);
146
147     while (p)
148     {
149         if (id == p->attset->reference)
150             return p->attset;
151         p = p->next;
152     }
153     return NULL;
154 }
155
156 data1_attset *data1_attset_add (data1_handle dh, const char *name)
157 {
158     char fname[512], aname[512];
159     NMEM mem = data1_nmem_get (dh);
160     data1_attset *attset;
161
162     strcpy (aname, name);
163     sprintf(fname, "%s.att", name);
164     attset = data1_read_attset (dh, fname);
165     if (!attset)
166     {
167         char *cp;
168         attset = data1_read_attset (dh, name);
169         if (attset && (cp = strrchr (aname, '.')))
170             *cp = '\0';
171     }
172     if (!attset)
173         yaz_log (LOG_WARN|LOG_ERRNO, "Couldn't load attribute set %s", name);
174     else
175     {
176         data1_attset_cache p = (data1_attset_cache)
177             nmem_malloc (mem, sizeof(*p));
178         data1_attset_cache *pp = data1_attset_cache_get (dh);
179         
180         attset->name = p->name = nmem_strdup (mem, aname);
181         p->attset = attset;
182         p->next = *pp;
183         *pp = p;
184     }
185     return attset;
186 }
187
188 data1_attset *data1_get_attset (data1_handle dh, const char *name)
189 {
190     data1_attset *attset;
191
192     if (!(attset = data1_attset_search_name (dh, name)))
193         attset = data1_attset_add (dh, name);
194     return attset;
195 }
196
197 data1_esetname *data1_getesetbyname(data1_handle dh, data1_absyn *a,
198                                     const char *name)
199 {
200     data1_esetname *r;
201
202     for (r = a->esetnames; r; r = r->next)
203         if (!data1_matchstr(r->name, name))
204             return r;
205     return 0;
206 }
207
208 data1_element *data1_getelementbytagname (data1_handle dh, data1_absyn *abs,
209                                           data1_element *parent,
210                                           const char *tagname)
211 {
212     data1_element *r;
213
214     /* It's now possible to have a data1 tree with no abstract syntax */
215     if ( !abs )
216         return 0;
217
218     if (!parent)
219         r = abs->main_elements;
220     else
221         r = parent->children;
222
223     for (; r; r = r->next)
224     {
225         data1_name *n;
226
227         for (n = r->tag->names; n; n = n->next)
228             if (!data1_matchstr(tagname, n->name))
229                 return r;
230     }
231     return 0;
232 }
233
234 data1_element *data1_getelementbyname (data1_handle dh, data1_absyn *absyn,
235                                        const char *name)
236 {
237     data1_element *r;
238
239     /* It's now possible to have a data1 tree with no abstract syntax */
240     if ( !absyn )
241         return 0;
242     for (r = absyn->main_elements; r; r = r->next)
243         if (!data1_matchstr(r->name, name))
244             return r;
245     return 0;
246 }
247
248
249 void fix_element_ref (data1_handle dh, data1_absyn *absyn, data1_element *e)
250 {
251     /* It's now possible to have a data1 tree with no abstract syntax */
252     if ( !absyn )
253         return;
254
255     for (; e; e = e->next)
256     {
257         if (!e->sub_name)
258         {
259             if (e->children)
260                 fix_element_ref (dh, absyn, e->children);
261         }
262         else
263         {
264             data1_sub_elements *sub_e = absyn->sub_elements;
265             while (sub_e && strcmp (e->sub_name, sub_e->name))
266                 sub_e = sub_e->next;
267             if (sub_e)
268                 e->children = sub_e->elements;
269             else
270                 yaz_log (LOG_WARN, "Unresolved reference to sub-elements %s",
271                       e->sub_name);
272         }
273     }
274 }
275 /* *ostrich*
276
277    New function, a bit dummy now... I've seen it in zrpn.c... We should build
278    more clever regexps...
279
280
281       //a    ->    ^a/.*$
282       //a/b  ->    ^b/a/.*$
283       /a     ->    ^a/$
284       /a/b   ->    ^b/a/$
285
286       /      ->    none
287
288    pop, 2002-12-13
289
290    Now [] predicates are supported
291
292    pop, 2003-01-17
293
294  */
295
296 static const char * mk_xpath_regexp (data1_handle dh, const char *expr) 
297 {
298     const char *p = expr;
299     int abs = 1;
300     int e = 0;
301     char *stack[32];
302     char *res_p, *res = 0;
303     size_t res_size = 1;
304     
305     if (*p != '/')
306         return ("");
307     p++;
308     if (*p == '/') 
309     { 
310         abs =0;
311         p++;
312     }
313     while (*p)
314     {
315         int is_predicate = 0;
316         char *s;
317         int i, j;
318         for (i = 0; *p && !strchr("/",*p); i++, p++)
319             ;
320         res_size += (i+3); /* we'll add / between later .. */
321         stack[e] = (char *) nmem_malloc(data1_nmem_get(dh), i+1);
322         s = stack[e];
323         for (j = 0; j < i; j++)
324         {
325             const char *pp = p-i+j;
326             if (*pp == '[')
327                 is_predicate=1;
328             else if (*pp == ']')
329                 is_predicate=0;
330             else 
331             {
332                 if (!is_predicate) {
333                     if (*pp == '*') 
334                         *s++ = '.';
335                     *s++ = *pp;
336                 }
337             }
338         }
339         *s = 0;
340         e++;
341         if (*p)
342             p++;
343     }
344     res_p = res = nmem_malloc(data1_nmem_get(dh), res_size + 10);
345
346     *res_p = '\0';
347     if (stack[e-1][0] == '@')  /* path/@attr spec (leaf is attribute) */
348         strcpy(res_p, "/");
349     else
350         strcpy(res_p, "[^@]*/");  /* path .. (index all cdata below it) */
351     res_p = res_p + strlen(res_p);
352     while (--e >= 0) {
353         sprintf(res_p, "%s/", stack[e]);
354         res_p += strlen(stack[e]) + 1;
355     }
356     if (!abs)
357     {
358         sprintf(res_p, ".*"); 
359         res_p += 2;
360     }
361     sprintf (res_p, "$");
362     res_p++;
363     yaz_log(LOG_DEBUG, "Got regexp: %s", res);
364     return res;
365 }
366
367 /* *ostrich*
368
369    added arg xpelement... when called from xelm context, it's 1, saying
370    that ! means xpath, not element name as attribute name...
371
372    pop, 2002-12-13
373  */
374 static int parse_termlists (data1_handle dh, data1_termlist ***tpp,
375                             char *cp, const char *file, int lineno,
376                             const char *element_name, data1_absyn *res,
377                             int xpelement)
378 {
379     data1_termlist **tp = *tpp;
380     while(1)
381     {
382         char attname[512], structure[512];
383         char *source;
384         int r, i;
385         int level = 0;
386         structure[0] = '\0';
387         for (i = 0; cp[i] && i<sizeof(attname)-1; i++)
388             if (strchr(":,", cp[i]))
389                 break;
390             else
391                 attname[i] = cp[i];
392         if (i == 0)
393         {
394             if (*cp)
395                 yaz_log(LOG_WARN,
396                         "%s:%d: Syntax error in termlistspec '%s'",
397                         file, lineno, cp);
398             break;
399         }
400         attname[i] = '\0';
401         r = 1;
402         cp += i;
403         if (*cp == ':')
404             cp++;
405
406         for (i = 0; cp[i] && i<sizeof(structure)-1; i++)
407             if (level == 0 && strchr(",", cp[i]))
408                 break;
409             else
410             {
411                 structure[i] = cp[i];
412                 if (cp[i] == '(')
413                     level++;
414                 else if (cp[i] == ')')
415                     level--;
416             }
417         structure[i] = '\0';
418         if (i)
419             r = 2;
420         cp += i;
421         if (*cp)
422             cp++;  /* skip , */
423
424         *tp = (data1_termlist *)
425             nmem_malloc(data1_nmem_get(dh), sizeof(**tp));
426         (*tp)->next = 0;
427         
428         if (!xpelement) {
429             if (*attname == '!')
430                 strcpy(attname, element_name);
431         }
432         if (!((*tp)->att = data1_getattbyname(dh, res->attset,
433                                               attname))) {
434             if ((!xpelement) || (*attname != '!')) {
435                 yaz_log(LOG_WARN,
436                         "%s:%d: Couldn't find att '%s' in attset",
437                         file, lineno, attname);
438                 return -1;
439             } else {
440                 (*tp)->att = 0;
441             }
442         }
443         
444         if (r == 2 && (source = strchr(structure, ':')))
445             *source++ = '\0';   /* cut off structure .. */
446         else
447             source = "data";    /* ok: default is leaf data */
448         (*tp)->source = (char *)
449             nmem_strdup (data1_nmem_get (dh), source);
450         
451         if (r < 2) /* is the structure qualified? */
452             (*tp)->structure = "w";
453         else 
454             (*tp)->structure = (char *)
455                 nmem_strdup (data1_nmem_get (dh), structure);
456         tp = &(*tp)->next;
457     }
458
459     *tpp = tp;
460     return 0;
461 }
462
463 /* quinn
464  * Converts a 'melm' field[$subfield] pattern to a simple xpath
465  */
466 static int melm2xpath(char *melm, char *buf)
467 {
468     char *dollar;
469     char *field = melm;
470     char *subfield;
471     char *fieldtype;
472     if ((dollar = strchr(melm, '$'))) {
473         *dollar = '\0';
474         subfield = ++dollar;
475     } else
476         subfield = "";
477     if (field[0] == '0' && field[1] == '0')
478         fieldtype = "controlfield";
479     else
480         fieldtype = "datafield";
481     sprintf(buf, "/*/%s[@tag=\"%s\"]", fieldtype, field);
482     if (*subfield) 
483         sprintf(buf + strlen(buf), "/subfield[@code=\"%s\"]", subfield);
484     else if (field[0] != '0' || field[1] != '0')
485         strcat(buf, "/subfield");
486     yaz_log(LOG_DEBUG, "Created xpath: '%s'", buf);
487     return 0;
488 }
489
490 const char *data1_systag_lookup(data1_absyn *absyn, const char *tag,
491                                 const char *default_value)
492 {
493     struct data1_systag *p = absyn->systags;
494     for (; p; p = p->next)
495         if (!strcmp(p->name, tag))
496             return p->value;
497     return default_value;
498 }
499
500 #define l_isspace(c) ((c) == '\t' || (c) == ' ' || (c) == '\n' || (c) == '\r')
501
502 int read_absyn_line(FILE *f, int *lineno, char *line, int len,
503                     char *argv[], int num)
504 {
505     char *p;
506     int argc;
507     int quoted = 0;
508     
509     while ((p = fgets(line, len, f)))
510     {
511         (*lineno)++;
512         while (*p && l_isspace(*p))
513             p++;
514         if (*p && *p != '#')
515             break;
516     }
517     if (!p)
518         return 0;
519     
520     for (argc = 0; *p ; argc++)
521     {
522         if (*p == '#')  /* trailing comment */
523             break;
524         argv[argc] = p;
525         while (*p && !(l_isspace(*p) && !quoted)) {
526           if (*p =='"') quoted = 1 - quoted;
527           if (*p =='[') quoted = 1;
528           if (*p ==']') quoted = 0;
529           p++;
530         }
531         if (*p)
532         {
533             *(p++) = '\0';
534             while (*p && l_isspace(*p))
535                 p++;
536         }
537     }
538     return argc;
539 }
540
541 data1_marctab *data1_absyn_getmarctab(data1_handle dh, data1_node *root)
542 {
543     if (root->u.root.absyn)
544         return root->u.root.absyn->marc;
545     return 0;
546 }
547
548 data1_element *data1_absyn_getelements(data1_handle dh,
549                                        data1_node *root)
550 {
551     if (root->u.root.absyn)
552         return root->u.root.absyn->main_elements;
553     return 0;
554 }
555
556 data1_absyn *data1_read_absyn (data1_handle dh, const char *file,
557                                int file_must_exist)
558 {
559     data1_sub_elements *cur_elements = NULL;
560     data1_xpelement **cur_xpelement = NULL;
561
562     data1_absyn *res = 0;
563     FILE *f;
564     data1_element **ppl[D1_MAX_NESTING];
565     data1_esetname **esetpp;
566     data1_maptab **maptabp;
567     data1_marctab **marcp;
568     data1_termlist *all = 0;
569     data1_attset_child **attset_childp;
570     data1_tagset **tagset_childp;
571     struct data1_systag **systagsp;
572     int level = 0;
573     int lineno = 0;
574     int argc;
575     char *argv[50], line[512];
576
577     if (!(f = data1_path_fopen(dh, file, "r")))
578     {
579         yaz_log(LOG_WARN|LOG_ERRNO, "Couldn't open %s", file);
580         if (file_must_exist)
581             return 0;
582     }
583     
584     res = (data1_absyn *) nmem_malloc(data1_nmem_get(dh), sizeof(*res));
585     res->name = 0;
586     res->reference = VAL_NONE;
587     res->tagset = 0;
588     res->encoding = 0;
589     res->enable_xpath_indexing = (f ? 0 : 1);
590     res->systags = 0;
591     systagsp = &res->systags;
592     tagset_childp = &res->tagset;
593
594     res->attset = data1_empty_attset (dh);
595     attset_childp =  &res->attset->children;
596
597     res->varset = 0;
598     res->esetnames = 0;
599     esetpp = &res->esetnames;
600     res->maptabs = 0;
601     maptabp = &res->maptabs;
602     res->marc = 0;
603     marcp = &res->marc;
604     res->sub_elements = NULL;
605     res->main_elements = NULL;
606     res->xp_elements = NULL;
607     cur_xpelement = &res->xp_elements;
608     
609     while (f && (argc = read_absyn_line(f, &lineno, line, 512, argv, 50)))
610     {
611         char *cmd = *argv;
612         if (!strcmp(cmd, "elm") || !strcmp(cmd, "element"))
613         {
614             data1_element *new_element;
615             int i;
616             char *p, *sub_p, *path, *name, *termlists;
617             int type, value;
618             data1_termlist **tp;
619
620             if (argc < 4)
621             {
622                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to elm", file, lineno);
623                 continue;
624             }
625             path = argv[1];
626             name = argv[2];
627             termlists = argv[3];
628
629             if (!cur_elements)
630             {
631                 cur_elements = (data1_sub_elements *)
632                     nmem_malloc(data1_nmem_get(dh), sizeof(*cur_elements));
633                 cur_elements->next = res->sub_elements;
634                 cur_elements->elements = NULL;
635                 cur_elements->name = "main";
636                 res->sub_elements = cur_elements;
637                 
638                 level = 0;
639                 ppl[level] = &cur_elements->elements;
640             }
641             p = path;
642             for (i = 1;; i++)
643             {
644                 char *e;
645
646                 if ((e = strchr(p, '/')))
647                     p = e+1;
648                 else
649                     break;
650             }
651             if (i > level+1)
652             {
653                 yaz_log(LOG_WARN, "%s:%d: Bad level increase", file, lineno);
654                 fclose(f);
655                 return 0;
656             }
657             level = i;
658             new_element = *ppl[level-1] = (data1_element *)
659                 nmem_malloc(data1_nmem_get(dh), sizeof(*new_element));
660             new_element->next = new_element->children = 0;
661             new_element->tag = 0;
662             new_element->termlists = 0;
663             new_element->sub_name = 0;
664             
665             tp = &new_element->termlists;
666             ppl[level-1] = &new_element->next;
667             ppl[level] = &new_element->children;
668             
669             /* consider subtree (if any) ... */
670             if ((sub_p = strchr (p, ':')) && sub_p[1])
671             {
672                 *sub_p++ = '\0';
673                 new_element->sub_name =
674                     nmem_strdup (data1_nmem_get(dh), sub_p);            
675             }
676             /* well-defined tag */
677             if (sscanf(p, "(%d,%d)", &type, &value) == 2)
678             {
679                 if (!res->tagset)
680                 {
681                     yaz_log(LOG_WARN, "%s:%d: No tagset loaded", file, lineno);
682                     fclose(f);
683                     return 0;
684                 }
685                 if (!(new_element->tag = data1_gettagbynum (dh, res->tagset,
686                                                             type, value)))
687                 {
688                     yaz_log(LOG_WARN, "%s:%d: Couldn't find tag %s in tagset",
689                          file, lineno, p);
690                     fclose(f);
691                     return 0;
692                 }
693             }
694             /* private tag */
695             else if (*p)
696             {
697                 data1_tag *nt =
698                     new_element->tag = (data1_tag *)
699                     nmem_malloc(data1_nmem_get (dh),
700                                 sizeof(*new_element->tag));
701                 nt->which = DATA1T_string;
702                 nt->value.string = nmem_strdup(data1_nmem_get (dh), p);
703                 nt->names = (data1_name *)
704                     nmem_malloc(data1_nmem_get(dh), 
705                                 sizeof(*new_element->tag->names));
706                 nt->names->name = nt->value.string;
707                 nt->names->next = 0;
708                 nt->kind = DATA1K_string;
709                 nt->next = 0;
710                 nt->tagset = 0;
711             }
712             else
713             {
714                 yaz_log(LOG_WARN, "%s:%d: Bad element", file, lineno);
715                 fclose(f);
716                 return 0;
717             }
718             /* parse termList definitions */
719             p = termlists;
720             if (*p != '-')
721             {
722                 assert (res->attset);
723                 
724                 if (parse_termlists (dh, &tp, p, file, lineno, name, res, 0))
725                 {
726                     fclose (f);
727                     return 0;
728                 }
729                 *tp = all; /* append any ALL entries to the list */
730             }
731             new_element->name = nmem_strdup(data1_nmem_get (dh), name);
732         }
733         /* *ostrich*
734            New code to support xelm directive
735            for each xelm a dfa is built. xelms are stored in res->xp_elements
736            
737            maybe we should use a simple sscanf instead of dfa?
738            
739            pop, 2002-12-13
740
741            Now [] predicates are supported. regexps and xpath structure is
742            a bit redundant, however it's comfortable later...
743
744            pop, 2003-01-17
745         */
746
747         else if (!strcmp(cmd, "xelm") || !strcmp(cmd, "melm")) {
748
749             int i;
750             char *p, *xpath_expr, *termlists;
751             const char *regexp = 0;
752             struct DFA *dfa = 0;
753             data1_termlist **tp;
754             char melm_xpath[128];
755             data1_xpelement *xp_ele = 0;
756             data1_xpelement *last_match = 0;
757
758             
759             if (argc < 3)
760             {
761                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to xelm", file, lineno);
762                 continue;
763             }
764             
765             if (!strcmp(cmd, "melm")) {
766                 if (melm2xpath(argv[1], melm_xpath) < 0)
767                     continue;
768                 xpath_expr = melm_xpath;
769             } else {
770                 xpath_expr = argv[1];
771             }
772             termlists = argv[2];
773             regexp = mk_xpath_regexp(dh, xpath_expr);
774 #if OPTIMIZE_MELM
775             /* get last of existing regulars with same regexp */
776             for (xp_ele = res->xp_elements; xp_ele; xp_ele = xp_ele->next)
777                 if (!strcmp(xp_ele->regexp, regexp))
778                     last_match = xp_ele;
779 #endif
780             if (!last_match)
781             {
782                 const char *regexp_ptr = regexp;
783                 dfa = dfa_init();
784
785                 i = dfa_parse (dfa, &regexp_ptr);
786                 if (i || *regexp_ptr) {
787                     yaz_log(YLOG_WARN, "%s:%d: Bad xpath to xelm", file, lineno);
788                     dfa_delete (&dfa);
789                     continue;
790                 }
791             }           
792             *cur_xpelement = (data1_xpelement *)
793                 nmem_malloc(data1_nmem_get(dh), sizeof(**cur_xpelement));
794             (*cur_xpelement)->next = 0;
795             (*cur_xpelement)->match_next = 0;
796             if (last_match)
797                 last_match->match_next = *cur_xpelement;
798 #if OPTIMIZE_MELM
799             (*cur_xpelement)->regexp = regexp;
800 #endif
801             (*cur_xpelement)->next = NULL;
802             (*cur_xpelement)->xpath_expr = nmem_strdup(data1_nmem_get (dh), 
803                                                     xpath_expr); 
804             if (dfa)
805                 dfa_mkstate (dfa);
806             (*cur_xpelement)->dfa = dfa;
807 #ifdef ENHANCED_XELM 
808             (*cur_xpelement)->xpath_len =
809                 zebra_parse_xpath_str(xpath_expr, 
810                                       (*cur_xpelement)->xpath, XPATH_STEP_COUNT,
811                                       data1_nmem_get(dh));
812             
813 #endif
814             (*cur_xpelement)->termlists = 0;
815             tp = &(*cur_xpelement)->termlists;
816             
817             /* parse termList definitions */
818             p = termlists;
819             if (*p != '-')
820             {
821                 assert (res->attset);
822                 
823                 if (parse_termlists (dh, &tp, p, file, lineno,
824                                      xpath_expr, res, 1))
825                 {
826                     fclose (f);
827                     return 0;
828                 }
829                 *tp = all; /* append any ALL entries to the list */
830             }
831             cur_xpelement = &(*cur_xpelement)->next;
832         }
833         else if (!strcmp(cmd, "section"))
834         {
835             char *name;
836             
837             if (argc < 2)
838             {
839                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to section",
840                         file, lineno);
841                 continue;
842             }
843             name = argv[1];
844             
845             cur_elements = (data1_sub_elements *)
846                 nmem_malloc(data1_nmem_get(dh), sizeof(*cur_elements));
847             cur_elements->next = res->sub_elements;
848             cur_elements->elements = NULL;
849             cur_elements->name = nmem_strdup (data1_nmem_get(dh), name);
850             res->sub_elements = cur_elements;
851             
852             level = 0;
853             ppl[level] = &cur_elements->elements;
854         }
855         else if (!strcmp(cmd, "xpath"))
856         {
857             if (argc != 2)
858             {
859                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to 'xpath' directive",
860                      file, lineno);
861                 continue;
862             }
863             if (!strcmp(argv[1], "enable"))
864                 res->enable_xpath_indexing = 1;
865             else if (!strcmp (argv[1], "disable"))
866                 res->enable_xpath_indexing = 0;
867             else
868             {
869                 yaz_log(LOG_WARN, "%s:%d: Expecting disable/enable "
870                         "after 'xpath' directive", file, lineno);
871             }
872         }
873         else if (!strcmp(cmd, "all"))
874         {
875             data1_termlist **tp = &all;
876             if (all)
877             {
878                 yaz_log(LOG_WARN, "%s:%d: Too many 'all' directives - ignored",
879                      file, lineno);
880                 continue;
881             }
882             if (argc != 2)
883             {
884                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to 'all' directive",
885                      file, lineno);
886                 continue;
887             }
888             if (parse_termlists (dh, &tp, argv[1], file, lineno, 0, res, 0))
889             {
890                 fclose (f);
891                 return 0;
892             }
893         }
894         else if (!strcmp(cmd, "name"))
895         {
896             if (argc != 2)
897             {
898                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to name directive",
899                      file, lineno);
900                 continue;
901             }
902             res->name = nmem_strdup(data1_nmem_get(dh), argv[1]);
903         }
904         else if (!strcmp(cmd, "reference"))
905         {
906             char *name;
907             
908             if (argc != 2)
909             {
910                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to reference",
911                      file, lineno);
912                 continue;
913             }
914             name = argv[1];
915             if ((res->reference = oid_getvalbyname(name)) == VAL_NONE)
916             {
917                 yaz_log(LOG_WARN, "%s:%d: Unknown tagset ref '%s'", 
918                      file, lineno, name);
919                 continue;
920             }
921         }
922         else if (!strcmp(cmd, "attset"))
923         {
924             char *name;
925             data1_attset *attset;
926             
927             if (argc != 2)
928             {
929                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to attset",
930                      file, lineno);
931                 continue;
932             }
933             name = argv[1];
934             if (!(attset = data1_get_attset (dh, name)))
935             {
936                 yaz_log(LOG_WARN, "%s:%d: Couldn't find attset  %s",
937                      file, lineno, name);
938                 continue;
939             }
940             *attset_childp = (data1_attset_child *)
941                 nmem_malloc (data1_nmem_get(dh), sizeof(**attset_childp));
942             (*attset_childp)->child = attset;
943             (*attset_childp)->next = 0;
944             attset_childp = &(*attset_childp)->next;
945         }
946         else if (!strcmp(cmd, "tagset"))
947         {
948             char *name;
949             int type = 0;
950             if (argc < 2)
951             {
952                 yaz_log(LOG_WARN, "%s:%d: Bad # of args to tagset",
953                      file, lineno);
954                 continue;
955             }
956             name = argv[1];
957             if (argc == 3)
958                 type = atoi(argv[2]);
959             *tagset_childp = data1_read_tagset (dh, name, type);
960             if (!(*tagset_childp))
961             {
962                 yaz_log(LOG_WARN, "%s:%d: Couldn't load tagset %s",
963                      file, lineno, name);
964                 continue;
965             }
966             tagset_childp = &(*tagset_childp)->next;
967         }
968         else if (!strcmp(cmd, "varset"))
969         {
970             char *name;
971
972             if (argc != 2)
973             {
974                 yaz_log(LOG_WARN, "%s:%d: Bad # of args in varset",
975                      file, lineno);
976                 continue;
977             }
978             name = argv[1];
979             if (!(res->varset = data1_read_varset (dh, name)))
980             {
981                 yaz_log(LOG_WARN, "%s:%d: Couldn't load Varset %s",
982                      file, lineno, name);
983                 continue;
984             }
985         }
986         else if (!strcmp(cmd, "esetname"))
987         {
988             char *name, *fname;
989
990             if (argc != 3)
991             {
992                 yaz_log(LOG_WARN, "%s:%d: Bad # of args in esetname",
993                      file, lineno);
994                 continue;
995             }
996             name = argv[1];
997             fname = argv[2];
998             
999             *esetpp = (data1_esetname *)
1000                 nmem_malloc(data1_nmem_get(dh), sizeof(**esetpp));
1001             (*esetpp)->name = nmem_strdup(data1_nmem_get(dh), name);
1002             (*esetpp)->next = 0;
1003             if (*fname == '@')
1004                 (*esetpp)->spec = 0;
1005             else if (!((*esetpp)->spec = data1_read_espec1 (dh, fname)))
1006             {
1007                 yaz_log(LOG_WARN, "%s:%d: Espec-1 read failed for %s",
1008                      file, lineno, fname);
1009                 continue;
1010             }
1011             esetpp = &(*esetpp)->next;
1012         }
1013         else if (!strcmp(cmd, "maptab"))
1014         {
1015             char *name;
1016             
1017             if (argc != 2)
1018             {
1019                 yaz_log(LOG_WARN, "%s:%d: Bad # of args for maptab",
1020                      file, lineno);
1021                 continue;
1022             }
1023             name = argv[1];
1024             if (!(*maptabp = data1_read_maptab (dh, name)))
1025             {
1026                 yaz_log(LOG_WARN, "%s:%d: Couldn't load maptab %s",
1027                      file, lineno, name);
1028                 continue;
1029             }
1030             maptabp = &(*maptabp)->next;
1031         }
1032         else if (!strcmp(cmd, "marc"))
1033         {
1034             char *name;
1035             
1036             if (argc != 2)
1037             {
1038                 yaz_log(LOG_WARN, "%s:%d: Bad # or args for marc",
1039                      file, lineno);
1040                 continue;
1041             }
1042             name = argv[1];
1043             if (!(*marcp = data1_read_marctab (dh, name)))
1044             {
1045                 yaz_log(LOG_WARN, "%s:%d: Couldn't read marctab %s",
1046                      file, lineno, name);
1047                 continue;
1048             }
1049             marcp = &(*marcp)->next;
1050         }
1051         else if (!strcmp(cmd, "encoding"))
1052         {
1053             if (argc != 2)
1054             {
1055                 yaz_log(LOG_WARN, "%s:%d: Bad # or args for encoding",
1056                      file, lineno);
1057                 continue;
1058             }
1059             res->encoding = nmem_strdup (data1_nmem_get(dh), argv[1]);
1060         }
1061         else if (!strcmp(cmd, "systag"))
1062         {
1063             if (argc != 3)
1064             {
1065                 yaz_log(LOG_WARN, "%s:%d: Bad # or args for systag",
1066                      file, lineno);
1067                 continue;
1068             }
1069             *systagsp = nmem_malloc (data1_nmem_get(dh), sizeof(**systagsp));
1070
1071             (*systagsp)->name = nmem_strdup(data1_nmem_get(dh), argv[1]);
1072             (*systagsp)->value = nmem_strdup(data1_nmem_get(dh), argv[2]);
1073             systagsp = &(*systagsp)->next;
1074         }
1075         else
1076         {
1077             yaz_log(LOG_WARN, "%s:%d: Unknown directive '%s'", file, 
1078                     lineno, cmd);
1079             continue;
1080         }
1081     }
1082     if (f)
1083         fclose(f);
1084     
1085     for (cur_elements = res->sub_elements; cur_elements;
1086          cur_elements = cur_elements->next)
1087     {
1088         if (!strcmp (cur_elements->name, "main"))
1089             res->main_elements = cur_elements->elements;
1090         fix_element_ref (dh, res, cur_elements->elements);
1091     }
1092     *systagsp = 0;
1093     yaz_log (LOG_DEBUG, "%s: data1_read_absyn end", file);
1094     return res;
1095 }