Added optional, physical ANY
[yaz-moved-to-github.git] / retrieval / d1_absyn.c
1 /*
2  * Copyright (c) 1995, Index Data.
3  * See the file LICENSE for details.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: d1_absyn.c,v $
7  * Revision 1.8  1997-01-02 10:47:59  quinn
8  * Added optional, physical ANY
9  *
10  * Revision 1.7  1996/06/10 08:56:01  quinn
11  * Work on Summary.
12  *
13  * Revision 1.6  1996/05/31  13:52:21  quinn
14  * Fixed uninitialized variable for local tags in abstract syntax.
15  *
16  * Revision 1.5  1996/05/09  07:27:43  quinn
17  * Multiple local attributes values supported.
18  *
19  * Revision 1.4  1996/05/01  12:45:28  quinn
20  * Support use of local tag names in abs file.
21  *
22  * Revision 1.3  1995/11/01  16:34:55  quinn
23  * Making data1 look for tables in data1_tabpath
24  *
25  * Revision 1.2  1995/11/01  13:54:44  quinn
26  * Minor adjustments
27  *
28  * Revision 1.1  1995/11/01  11:56:06  quinn
29  * Added Retrieval (data management) functions en masse.
30  *
31  *
32  */
33
34 #include <ctype.h>
35 #include <stdio.h>
36 #include <assert.h>
37 #include <stdlib.h>
38 #include <string.h>
39
40 #include <xmalloc.h>
41 #include <oid.h>
42 #include <log.h>
43 #include <tpath.h>
44
45 #include <data1.h>
46
47 #define D1_MAX_NESTING  128
48 #define DATA1_MAX_SYNTAXES 30 /* max no of syntaxes to handle in one session */
49
50 static struct /* cache of abstract syntaxes */
51 {
52     char *name;
53     data1_absyn *absyn;
54 } syntaxes[DATA1_MAX_SYNTAXES] = {{0,0}};
55
56 data1_absyn *data1_get_absyn(char *name)
57 {
58     char fname[512];
59     int i;
60
61     for (i = 0; syntaxes[i].name; i++)
62         if (!strcmp(name, syntaxes[i].name))
63             return syntaxes[i].absyn;
64
65     if (i >= DATA1_MAX_SYNTAXES - 1)
66     {
67         logf(LOG_WARN, "Too many abstract syntaxes loaded");
68         return 0;
69     }
70     sprintf(fname, "%s.abs", name);
71     if (!(syntaxes[i].absyn = data1_read_absyn(fname)))
72         return 0;
73     if (!(syntaxes[i].name = xmalloc(strlen(name)+1)))
74         abort();
75     strcpy(syntaxes[i].name, name);
76     syntaxes[i+1].name = 0;
77     return syntaxes[i].absyn;
78 }
79
80 data1_esetname *data1_getesetbyname(data1_absyn *a, char *name)
81 {
82     data1_esetname *r;
83
84     for (r = a->esetnames; r; r = r->next)
85         if (!data1_matchstr(r->name, name))
86             return r;
87     return 0;
88 }
89
90 data1_element *data1_getelementbytagname(data1_absyn *abs,
91     data1_element *parent, char *tagname)
92 {
93     data1_element *r;
94
95     if (!parent)
96         r = abs->elements;
97     else
98         r = parent->children;
99     for (; r; r = r->next)
100     {
101         data1_name *n;
102
103         for (n = r->tag->names; n; n = n->next)
104             if (!data1_matchstr(tagname, n->name))
105                 return r;
106     }
107     return 0;
108 }
109
110 data1_element *data1_getelementbyname(data1_absyn *absyn, char *name)
111 {
112     data1_element *r;
113
114     for (r = absyn->elements; r; r = r->next)
115         if (!data1_matchstr(r->name, name))
116             return r;
117     return 0;
118 }
119
120 data1_absyn *data1_read_absyn(char *file)
121 {
122     char line[512], *r, cmd[512], args[512];
123     data1_absyn *res = 0;
124     FILE *f;
125     data1_element **ppl[D1_MAX_NESTING], *cur[D1_MAX_NESTING];
126     data1_esetname **esetpp;
127     data1_maptab **maptabp;
128     data1_marctab **marcp;
129     data1_termlist *all = 0;
130     int level = 0;
131
132     if (!(f = yaz_path_fopen(data1_tabpath, file, "r")))
133     {
134         logf(LOG_WARN|LOG_ERRNO, "%s", file);
135         return 0;
136     }
137
138     if (!(res = xmalloc(sizeof(*res))))
139         abort();
140     res->name = 0;
141     res->reference = VAL_NONE;
142     res->tagset = 0;
143     res->attset = 0;
144     res->varset = 0;
145     res->esetnames = 0;
146     res->maptabs = 0;
147     maptabp = &res->maptabs;
148     res->marc = 0;
149     marcp = &res->marc;
150     res->elements = 0;
151     ppl[0] = &res->elements;
152     cur[0] = 0;
153     esetpp = &res->esetnames;
154
155     for (;;)
156     {
157         while ((r = fgets(line, 512, f)))
158         {
159             while (*r && isspace(*r))
160                 r++;
161             if (*r && *r != '#')
162                 break;
163         }
164         if (!r)
165         {
166             fclose(f);
167             return res;
168         }
169         if (sscanf(r, "%s %[^\n]", cmd, args) < 2)
170             *args = '\0';
171         if (!strcmp(cmd, "elm"))
172         {
173             data1_element *new;
174             int i;
175             char path[512], name[512], termlists[512], *p;
176             int type, value;
177             data1_termlist **tp;
178
179             if (sscanf(args, "%511s %511s %511s", path, name, termlists) < 3)
180             {
181                 logf(LOG_WARN, "Bad # of args to elm in %s: '%s'", 
182                     file, args);
183                 fclose(f);
184                 return 0;
185             }
186             p = path;
187             for (i = 0;; i++)
188             {
189                 char *e;
190
191                 if ((e = strchr(p, '/')))
192                     p = e+1;
193                 else
194                     break;
195             }
196             if (i > level + 1)
197             {
198                 logf(LOG_WARN, "Bad level inc in %s in '%s'", file, args);
199                 fclose(f);
200                 return 0;
201             }
202             level = i;
203             if (!(new = cur[level] = *ppl[level] = xmalloc(sizeof(*new))))
204                 abort;
205             new->next = new->children = 0;
206             new->tag = 0;
207             new->termlists = 0;
208             new->parent = level ? cur[level - 1] : 0;
209             tp = &new->termlists;
210             ppl[level] = &new->next;
211             ppl[level+1] = &new->children;
212
213             /* well-defined tag */
214             if (sscanf(p, "(%d,%d)", &type, &value) == 2)
215             {
216                 if (!res->tagset)
217                 {
218                     logf(LOG_WARN, "No tagset loaded in %s", file);
219                     fclose(f);
220                     return 0;
221                 }
222                 if (!(new->tag = data1_gettagbynum(res->tagset, type, value)))
223                 {
224                     logf(LOG_WARN, "Couldn't find tag %s in tagset in %s",
225                         p, file);
226                     fclose(f);
227                     return 0;
228                 }
229             }
230             /* private tag */
231             else if (*p)
232             {
233                 data1_tag *nt = new->tag = xmalloc(sizeof(*new->tag));
234                 nt->which = DATA1T_string;
235                 nt->value.string = xstrdup(p);
236                 nt->names = xmalloc(sizeof(*new->tag->names));
237                 nt->names->name = nt->value.string;
238                 nt->names->next = 0;
239                 nt->kind = DATA1K_string;
240                 nt->next = 0;
241                 nt->tagset = 0;
242             }
243             else
244             {
245                 logf(LOG_WARN, "Bad element is %s", file);
246                 fclose(f);
247                 return 0;
248             }
249
250             /* parse termList definitions */
251             p = termlists;
252             if (*p == '-')
253                 new->termlists = 0;
254             else
255             {
256                 if (!res->attset)
257                 {
258                     logf(LOG_WARN, "No attset loaded in %s", file);
259                     fclose(f);
260                     return 0;
261                 }
262                 do
263                 {
264                     char attname[512], structure[512];
265                     int r;
266
267                     if (!(r = sscanf(p, "%511[^:,]:%511[^,]", attname,
268                         structure)))
269                     {
270                         logf(LOG_WARN, "Syntax error in termlistspec in %s",
271                             file);
272                         fclose(f);
273                         return 0;
274                     }
275                     if (*attname == '!')
276                         strcpy(attname, name);
277                     *tp = xmalloc(sizeof(**tp));
278                     if (!((*tp)->att = data1_getattbyname(res->attset,
279                         attname)))
280                     {
281                         logf(LOG_WARN, "Couldn't find att '%s' in attset",
282                             attname);
283                         fclose(f);
284                         return 0;
285                     }
286                     if (r < 2) /* is the structure qualified? */
287                         (*tp)->structure = DATA1S_word;
288                     else if (!data1_matchstr(structure, "w"))
289                         (*tp)->structure = DATA1S_word;
290                     else if (!data1_matchstr(structure, "p"))
291                         (*tp)->structure = DATA1S_phrase;
292
293                     (*tp)->next = 0;
294                     tp = &(*tp)->next;
295                 }
296                 while ((p = strchr(p, ',')) && *(++p));
297             }
298             *tp = all; /* append any ALL entries to the list */
299
300             new->name = xstrdup(name);
301         }
302         else if (!strcmp(cmd, "all"))
303         {
304             char *p;
305             data1_termlist **tp = &all;
306
307             if (all)
308             {
309                 logf(LOG_WARN, "Too many ALL declarations in %s - ignored",
310                     file);
311                 continue;
312             }
313
314             p = args;
315             if (!res->attset)
316             {
317                 logf(LOG_WARN, "No attset loaded in %s", file);
318                 fclose(f);
319                 return 0;
320             }
321             do
322             {
323                 char attname[512], structure[512];
324                 int r;
325
326                 if (!(r = sscanf(p, "%511[^:,]:%511[^,]", attname,
327                     structure)))
328                 {
329                     logf(LOG_WARN, "Syntax error in termlistspec in %s",
330                         file);
331                     fclose(f);
332                     return 0;
333                 }
334                 *tp = xmalloc(sizeof(**tp));
335                 if (!((*tp)->att = data1_getattbyname(res->attset,
336                     attname)))
337                 {
338                     logf(LOG_WARN, "Couldn't find att '%s' in attset",
339                         attname);
340                     fclose(f);
341                     return 0;
342                 }
343                 if (r < 2) /* is the structure qualified? */
344                     (*tp)->structure = DATA1S_word;
345                 else if (!data1_matchstr(structure, "w"))
346                     (*tp)->structure = DATA1S_word;
347                 else if (!data1_matchstr(structure, "p"))
348                     (*tp)->structure = DATA1S_phrase;
349
350                 (*tp)->next = 0;
351                 tp = &(*tp)->next;
352             }
353             while ((p = strchr(p, ',')) && *(++p));
354         }
355         else if (!strcmp(cmd, "name"))
356         {
357             char name[512];
358
359             if (!sscanf(args, "%s", name))
360             {
361                 logf(LOG_WARN, "%s malformed name directive in %s", file);
362                 fclose(f);
363                 return 0;
364             }
365             if (!(res->name = xmalloc(strlen(args)+1)))
366                 abort();
367             strcpy(res->name, name);
368         }
369         else if (!strcmp(cmd, "reference"))
370         {
371             char name[512];
372
373             if (!sscanf(args, "%s", name))
374             {
375                 logf(LOG_WARN, "%s malformed reference directive in %s", file);
376                 fclose(f);
377                 return 0;
378             }
379             if ((res->reference = oid_getvalbyname(name)) == VAL_NONE)
380             {
381                 logf(LOG_WARN, "Unknown tagset ref '%s' in %s", name, file);
382                 fclose(f);
383                 return 0;
384             }
385         }
386         else if (!strcmp(cmd, "attset"))
387         {
388             char name[512];
389
390             if (!sscanf(args, "%s", name))
391             {
392                 logf(LOG_WARN, "%s malformed attset directive in %s", file);
393                 fclose(f);
394                 return 0;
395             }
396             if (!(res->attset = data1_read_attset(name)))
397             {
398                 logf(LOG_WARN, "Attset failed in %s", file);
399                 fclose(f);
400                 return 0;
401             }
402         }
403         else if (!strcmp(cmd, "tagset"))
404         {
405             char name[512];
406
407             if (!sscanf(args, "%s", name))
408             {
409                 logf(LOG_WARN, "%s malformed tagset directive in %s", file);
410                 fclose(f);
411                 return 0;
412             }
413             if (!(res->tagset = data1_read_tagset(name)))
414             {
415                 logf(LOG_WARN, "Tagset failed in %s", file);
416                 fclose(f);
417                 return 0;
418             }
419         }
420         else if (!strcmp(cmd, "varset"))
421         {
422             char name[512];
423
424             if (!sscanf(args, "%s", name))
425             {
426                 logf(LOG_WARN, "%s malformed varset directive in %s", file);
427                 fclose(f);
428                 return 0;
429             }
430             if (!(res->varset = data1_read_varset(name)))
431             {
432                 logf(LOG_WARN, "Varset failed in %s", file);
433                 fclose(f);
434                 return 0;
435             }
436         }
437         else if (!strcmp(cmd, "esetname"))
438         {
439             char name[512], fname[512];
440
441             if (sscanf(args, "%s %s", name, fname) != 2)
442             {
443                 logf(LOG_WARN, "%s: Two arg's required for esetname directive");
444                 fclose(f);
445                 return 0;
446             }
447             *esetpp = xmalloc(sizeof(**esetpp));
448             (*esetpp)->name = xmalloc(strlen(name)+1);
449             strcpy((*esetpp)->name, name);
450             if (*fname == '@')
451                 (*esetpp)->spec = 0;
452             else if (!((*esetpp)->spec = data1_read_espec1(fname, 0)))
453             {
454                 logf(LOG_WARN, "%s: Espec-1 read failed", file);
455                 fclose(f);
456                 return 0;
457             }
458             (*esetpp)->next = 0;
459             esetpp = &(*esetpp)->next;
460         }
461         else if (!strcmp(cmd, "maptab"))
462         {
463             char name[512];
464
465             if (sscanf(args, "%s", name) != 1)
466             {
467                 logf(LOG_WARN, "%s: One argument required for maptab directive",
468                     file);
469                 continue;
470             }
471             if (!(*maptabp = data1_read_maptab(name)))
472             {
473                 logf(LOG_WARN, "%s: Failed to read maptab.");
474                 continue;
475             }
476             maptabp = &(*maptabp)->next;
477         }
478         else if (!strcmp(cmd, "marc"))
479         {
480             char name[512];
481
482             if (sscanf(args, "%s", name) != 1)
483             {
484                 logf(LOG_WARN, "%s: One argument required for marc directive",
485                     file);
486                 continue;
487             }
488             if (!(*marcp = data1_read_marctab(name)))
489             {
490                 logf(LOG_WARN, "%s: Failed to read marctab.");
491                 continue;
492             }
493             marcp = &(*marcp)->next;
494         }
495         else
496         {
497             logf(LOG_WARN, "Unknown directive '%s' in %s", cmd, file);
498             fclose(f);
499             return 0;
500         }
501     }
502 }