Fixed uninitialized variable for local tags in abstract syntax.
[yaz-moved-to-github.git] / retrieval / d1_absyn.c
1 /*
2  * Copyright (c) 1995, Index Data.
3  * See the file LICENSE for details.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: d1_absyn.c,v $
7  * Revision 1.6  1996-05-31 13:52:21  quinn
8  * Fixed uninitialized variable for local tags in abstract syntax.
9  *
10  * Revision 1.5  1996/05/09  07:27:43  quinn
11  * Multiple local attributes values supported.
12  *
13  * Revision 1.4  1996/05/01  12:45:28  quinn
14  * Support use of local tag names in abs file.
15  *
16  * Revision 1.3  1995/11/01  16:34:55  quinn
17  * Making data1 look for tables in data1_tabpath
18  *
19  * Revision 1.2  1995/11/01  13:54:44  quinn
20  * Minor adjustments
21  *
22  * Revision 1.1  1995/11/01  11:56:06  quinn
23  * Added Retrieval (data management) functions en masse.
24  *
25  *
26  */
27
28 #include <ctype.h>
29 #include <stdio.h>
30 #include <assert.h>
31 #include <stdlib.h>
32 #include <string.h>
33
34 #include <xmalloc.h>
35 #include <oid.h>
36 #include <log.h>
37 #include <tpath.h>
38
39 #include <data1.h>
40
41 #define D1_MAX_NESTING  128
42 #define DATA1_MAX_SYNTAXES 30 /* max no of syntaxes to handle in one session */
43
44 static struct /* cache of abstract syntaxes */
45 {
46     char *name;
47     data1_absyn *absyn;
48 } syntaxes[DATA1_MAX_SYNTAXES] = {{0,0}};
49
50 data1_absyn *data1_get_absyn(char *name)
51 {
52     char fname[512];
53     int i;
54
55     for (i = 0; syntaxes[i].name; i++)
56         if (!strcmp(name, syntaxes[i].name))
57             return syntaxes[i].absyn;
58
59     if (i >= DATA1_MAX_SYNTAXES - 1)
60     {
61         logf(LOG_WARN, "Too many abstract syntaxes loaded");
62         return 0;
63     }
64     sprintf(fname, "%s.abs", name);
65     if (!(syntaxes[i].absyn = data1_read_absyn(fname)))
66         return 0;
67     if (!(syntaxes[i].name = xmalloc(strlen(name)+1)))
68         abort();
69     strcpy(syntaxes[i].name, name);
70     syntaxes[i+1].name = 0;
71     return syntaxes[i].absyn;
72 }
73
74 data1_esetname *data1_getesetbyname(data1_absyn *a, char *name)
75 {
76     data1_esetname *r;
77
78     for (r = a->esetnames; r; r = r->next)
79         if (!data1_matchstr(r->name, name))
80             return r;
81     return 0;
82 }
83
84 data1_element *data1_getelementbytagname(data1_absyn *abs,
85     data1_element *parent, char *tagname)
86 {
87     data1_element *r;
88
89     if (!parent)
90         r = abs->elements;
91     else
92         r = parent->children;
93     for (; r; r = r->next)
94     {
95         data1_name *n;
96
97         for (n = r->tag->names; n; n = n->next)
98             if (!data1_matchstr(tagname, n->name))
99                 return r;
100     }
101     return 0;
102 }
103
104 data1_element *data1_getelementbyname(data1_absyn *absyn, char *name)
105 {
106     data1_element *r;
107
108     for (r = absyn->elements; r; r = r->next)
109         if (!data1_matchstr(r->name, name))
110             return r;
111     return 0;
112 }
113
114 data1_absyn *data1_read_absyn(char *file)
115 {
116     char line[512], *r, cmd[512], args[512];
117     data1_absyn *res = 0;
118     FILE *f;
119     data1_element **ppl[D1_MAX_NESTING];
120     data1_esetname **esetpp;
121     data1_maptab **maptabp;
122     data1_marctab **marcp;
123     int level = 0;
124
125     if (!(f = yaz_path_fopen(data1_tabpath, file, "r")))
126     {
127         logf(LOG_WARN|LOG_ERRNO, "%s", file);
128         return 0;
129     }
130
131     if (!(res = xmalloc(sizeof(*res))))
132         abort();
133     res->name = 0;
134     res->reference = VAL_NONE;
135     res->tagset = 0;
136     res->attset = 0;
137     res->varset = 0;
138     res->esetnames = 0;
139     res->maptabs = 0;
140     maptabp = &res->maptabs;
141     res->marc = 0;
142     marcp = &res->marc;
143     res->elements = 0;
144     ppl[0] = &res->elements;
145     esetpp = &res->esetnames;
146
147     for (;;)
148     {
149         while ((r = fgets(line, 512, f)))
150         {
151             while (*r && isspace(*r))
152                 r++;
153             if (*r && *r != '#')
154                 break;
155         }
156         if (!r)
157         {
158             fclose(f);
159             return res;
160         }
161         if (sscanf(r, "%s %[^\n]", cmd, args) < 2)
162             *args = '\0';
163         if (!strcmp(cmd, "elm"))
164         {
165             data1_element *new;
166             int i;
167             char path[512], name[512], termlists[512], *p;
168             int type, value;
169             data1_termlist **tp;
170
171             if (sscanf(args, "%s %s %s", path, name, termlists) < 3)
172             {
173                 logf(LOG_WARN, "Bad # of args to elm in %s: '%s'", 
174                     file, args);
175                 fclose(f);
176                 return 0;
177             }
178             p = path;
179             for (i = 0;; i++)
180             {
181                 char *e;
182
183                 if ((e = strchr(p, '/')))
184                     p = e+1;
185                 else
186                     break;
187             }
188             if (i > level + 1)
189             {
190                 logf(LOG_WARN, "Bad level inc in %s in '%'", file, args);
191                 fclose(f);
192                 return 0;
193             }
194             level = i;
195             if (!(new = *ppl[level] = xmalloc(sizeof(*new))))
196                 abort;
197             new->next = new->children = 0;
198             new->tag = 0;
199             new->termlists = 0;
200             tp = &new->termlists;
201             ppl[level] = &new->next;
202             ppl[level+1] = &new->children;
203
204             /* well-defined tag */
205             if (sscanf(p, "(%d,%d)", &type, &value) == 2)
206             {
207                 if (!res->tagset)
208                 {
209                     logf(LOG_WARN, "No tagset loaded in %s", file);
210                     fclose(f);
211                     return 0;
212                 }
213                 if (!(new->tag = data1_gettagbynum(res->tagset, type, value)))
214                 {
215                     logf(LOG_WARN, "Couldn't find tag %s in tagset in %s",
216                         p, file);
217                     fclose(f);
218                     return 0;
219                 }
220             }
221             /* private tag */
222             else if (*p)
223             {
224                 data1_tag *nt = new->tag = xmalloc(sizeof(*new->tag));
225                 nt->which = DATA1T_string;
226                 nt->value.string = xstrdup(p);
227                 nt->names = xmalloc(sizeof(*new->tag->names));
228                 nt->names->name = nt->value.string;
229                 nt->names->next = 0;
230                 nt->kind = DATA1K_string;
231                 nt->next = 0;
232                 nt->tagset = 0;
233             }
234             else
235             {
236                 logf(LOG_WARN, "Bad element is %s", file);
237                 fclose(f);
238                 return 0;
239             }
240
241             /* parse termList definitions */
242             p = termlists;
243             if (*p == '-')
244                 new->termlists = 0;
245             else
246             {
247                 if (!res->attset)
248                 {
249                     logf(LOG_WARN, "No attset loaded in %s", file);
250                     fclose(f);
251                     return 0;
252                 }
253                 do
254                 {
255                     char attname[512], structure[512];
256                     int r;
257
258                     if (!(r = sscanf(p, "%511[^:,]:%511[^,]", attname,
259                         structure)))
260                     {
261                         logf(LOG_WARN, "Syntax error in termlistspec in %s",
262                             file);
263                         fclose(f);
264                         return 0;
265                     }
266                     if (*attname == '!')
267                         strcpy(attname, name);
268                     *tp = xmalloc(sizeof(**tp));
269                     if (!((*tp)->att = data1_getattbyname(res->attset,
270                         attname)))
271                     {
272                         logf(LOG_WARN, "Couldn't find att '%s' in attset",
273                             attname);
274                         fclose(f);
275                         return 0;
276                     }
277                     if (r < 2) /* is the structure qualified? */
278                         (*tp)->structure = DATA1S_word;
279                     else if (!data1_matchstr(structure, "w"))
280                         (*tp)->structure = DATA1S_word;
281                     else if (!data1_matchstr(structure, "p"))
282                         (*tp)->structure = DATA1S_phrase;
283
284                     (*tp)->next = 0;
285                     tp = &(*tp)->next;
286                 }
287                 while ((p = strchr(p, ',')) && *(++p));
288             }
289
290             new->name = xstrdup(name);
291         }
292         else if (!strcmp(cmd, "name"))
293         {
294             char name[512];
295
296             if (!sscanf(args, "%s", name))
297             {
298                 logf(LOG_WARN, "%s malformed name directive in %s", file);
299                 fclose(f);
300                 return 0;
301             }
302             if (!(res->name = xmalloc(strlen(args)+1)))
303                 abort();
304             strcpy(res->name, name);
305         }
306         else if (!strcmp(cmd, "reference"))
307         {
308             char name[512];
309
310             if (!sscanf(args, "%s", name))
311             {
312                 logf(LOG_WARN, "%s malformed reference directive in %s", file);
313                 fclose(f);
314                 return 0;
315             }
316             if ((res->reference = oid_getvalbyname(name)) == VAL_NONE)
317             {
318                 logf(LOG_WARN, "Unknown tagset ref '%s' in %s", name, file);
319                 fclose(f);
320                 return 0;
321             }
322         }
323         else if (!strcmp(cmd, "attset"))
324         {
325             char name[512];
326
327             if (!sscanf(args, "%s", name))
328             {
329                 logf(LOG_WARN, "%s malformed attset directive in %s", file);
330                 fclose(f);
331                 return 0;
332             }
333             if (!(res->attset = data1_read_attset(name)))
334             {
335                 logf(LOG_WARN, "Attset failed in %s", file);
336                 fclose(f);
337                 return 0;
338             }
339         }
340         else if (!strcmp(cmd, "tagset"))
341         {
342             char name[512];
343
344             if (!sscanf(args, "%s", name))
345             {
346                 logf(LOG_WARN, "%s malformed tagset directive in %s", file);
347                 fclose(f);
348                 return 0;
349             }
350             if (!(res->tagset = data1_read_tagset(name)))
351             {
352                 logf(LOG_WARN, "Tagset failed in %s", file);
353                 fclose(f);
354                 return 0;
355             }
356         }
357         else if (!strcmp(cmd, "varset"))
358         {
359             char name[512];
360
361             if (!sscanf(args, "%s", name))
362             {
363                 logf(LOG_WARN, "%s malformed varset directive in %s", file);
364                 fclose(f);
365                 return 0;
366             }
367             if (!(res->varset = data1_read_varset(name)))
368             {
369                 logf(LOG_WARN, "Varset failed in %s", file);
370                 fclose(f);
371                 return 0;
372             }
373         }
374         else if (!strcmp(cmd, "esetname"))
375         {
376             char name[512], fname[512];
377
378             if (sscanf(args, "%s %s", name, fname) != 2)
379             {
380                 logf(LOG_WARN, "%s: Two arg's required for esetname directive");
381                 fclose(f);
382                 return 0;
383             }
384             *esetpp = xmalloc(sizeof(**esetpp));
385             (*esetpp)->name = xmalloc(strlen(name)+1);
386             strcpy((*esetpp)->name, name);
387             if (*fname == '@')
388                 (*esetpp)->spec = 0;
389             else if (!((*esetpp)->spec = data1_read_espec1(fname, 0)))
390             {
391                 logf(LOG_WARN, "%s: Espec-1 read failed", file);
392                 fclose(f);
393                 return 0;
394             }
395             (*esetpp)->next = 0;
396             esetpp = &(*esetpp)->next;
397         }
398         else if (!strcmp(cmd, "maptab"))
399         {
400             char name[512];
401
402             if (sscanf(args, "%s", name) != 1)
403             {
404                 logf(LOG_WARN, "%s: One argument required for maptab directive",
405                     file);
406                 continue;
407             }
408             if (!(*maptabp = data1_read_maptab(name)))
409             {
410                 logf(LOG_WARN, "%s: Failed to read maptab.");
411                 continue;
412             }
413             maptabp = &(*maptabp)->next;
414         }
415         else if (!strcmp(cmd, "marc"))
416         {
417             char name[512];
418
419             if (sscanf(args, "%s", name) != 1)
420             {
421                 logf(LOG_WARN, "%s: One argument required for marc directive",
422                     file);
423                 continue;
424             }
425             if (!(*marcp = data1_read_marctab(name)))
426             {
427                 logf(LOG_WARN, "%s: Failed to read marctab.");
428                 continue;
429             }
430             marcp = &(*marcp)->next;
431         }
432         else
433         {
434             logf(LOG_WARN, "Unknown directive '%s' in %s", cmd, file);
435             fclose(f);
436             return 0;
437         }
438     }
439 }