Old versions of GILS tables
[yaz-moved-to-github.git] / retrieval / d1_marc.c
1 /*
2  * Copyright (c) 1995, Index Data.
3  * See the file LICENSE for details.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: d1_marc.c,v $
7  * Revision 1.4  1996-03-25 10:18:03  quinn
8  * Removed trailing whitespace from data elements
9  *
10  * Revision 1.3  1995/11/01  16:34:57  quinn
11  * Making data1 look for tables in data1_tabpath
12  *
13  * Revision 1.2  1995/11/01  13:54:48  quinn
14  * Minor adjustments
15  *
16  * Revision 1.1  1995/11/01  11:56:08  quinn
17  * Added Retrieval (data management) functions en masse.
18  *
19  *
20  */
21
22
23 #include <assert.h>
24 #include <stdlib.h>
25 #include <string.h>
26 #include <ctype.h>
27
28 #include <oid.h>
29 #include <log.h>
30 #include <readconf.h>
31 #include <xmalloc.h>
32 #include <data1.h>
33 #include <tpath.h>
34
35 #define ISO2709_RS 035
36 #define ISO2709_FS 036
37 #define ISO2709_IDFS 037
38
39 data1_marctab *data1_read_marctab(char *file)
40 {
41     FILE *f;
42     data1_marctab *res = xmalloc(sizeof(*res));
43     char line[512], *argv[50];
44     int argc;
45     
46     if (!(f = yaz_path_fopen(data1_tabpath, file, "r")))
47     {
48         logf(LOG_WARN|LOG_ERRNO, "%s", file);
49         return 0;
50     }
51
52     res->name = 0;
53     res->reference = VAL_NONE;
54     res->next = 0;
55     res->length_data_entry = 4;
56     res->length_starting = 5;
57     res->length_implementation = 0;
58     strcpy(res->future_use, "4");
59
60     strcpy(res->record_status, "n");
61     strcpy(res->implementation_codes, "    ");
62     res->indicator_length = 2;
63     res->identifier_length = 2;
64     strcpy(res->user_systems, "z  ");
65
66     while ((argc = readconf_line(f, line, 512, argv, 50)))
67         if (!strcmp(argv[0], "name"))
68         {
69             if (argc != 2)
70             {
71                 logf(LOG_WARN, "%s: Bad name directive");
72                 continue;
73             }
74             res->name = xmalloc(strlen(argv[1])+1);
75             strcpy(res->name, argv[1]);
76         }
77         else if (!strcmp(argv[0], "reference"))
78         {
79             if (argc != 2)
80             {
81                 logf(LOG_WARN, "%s: Bad name directive");
82                 continue;
83             }
84             if ((res->reference = oid_getvalbyname(argv[1])) == VAL_NONE)
85             {
86                 logf(LOG_WARN, "%s: Unknown tagset ref '%s' in %s", file,
87                     argv[1]);
88                 continue;
89             }
90         }
91         else if (!strcmp(argv[0], "length-data-entry"))
92         {
93             if (argc != 2)
94             {
95                 logf(LOG_WARN, "%s: Bad data-length-entry");
96                 continue;
97             }
98             res->length_data_entry = atoi(argv[1]);
99         }
100         else if (!strcmp(argv[0], "length-starting"))
101         {
102             if (argc != 2)
103             {
104                 logf(LOG_WARN, "%s: Bad length-starting");
105                 continue;
106             }
107             res->length_starting = atoi(argv[1]);
108         }
109         else if (!strcmp(argv[0], "length-implementation"))
110         {
111             if (argc != 2)
112             {
113                 logf(LOG_WARN, "%s: Bad length-implentation");
114                 continue;
115             }
116             res->length_implementation = atoi(argv[1]);
117         }
118         else if (!strcmp(argv[0], "future-use"))
119         {
120             if (argc != 2)
121             {
122                 logf(LOG_WARN, "%s: Bad future-use");
123                 continue;
124             }
125             strncpy(res->future_use, argv[1], 2);
126         }
127         else
128             logf(LOG_WARN, "%s: Bad directive '%s'", file, argv[0]);
129
130     fclose(f);
131     return res;
132 }
133
134 /*
135  * Locate some data under this node. This routine should handle variants
136  * prettily.
137  */
138 static char *get_data(data1_node *n, int *len)
139 {
140     char *r;
141
142     while (n->which != DATA1N_data && n->child)
143         n = n->child;
144     if (n->which != DATA1N_data || n->u.data.what != DATA1I_text)
145     {
146         r = "[Structured/included data]";
147         *len = strlen(r);
148         return r;
149     }
150
151     *len = n->u.data.len;
152     while (*len && isspace(n->u.data.data[*len - 1]))
153         (*len)--;
154     return n->u.data.data;
155 }
156
157 static void memint (char *p, int val, int len)
158 {
159     static char buf[9];
160
161     if (len == 1)
162         *p = val + '0';
163     else
164     {
165         sprintf (buf, "%08d", val);
166         memcpy (p, buf+8-len, len);
167     }
168 }
169
170 static int nodetomarc(data1_marctab *p, data1_node *n, int selected,
171     char **buf, int *size)
172 {
173     int len = 26;
174     int dlen;
175     int base_address = 25;
176     int entry_p, data_p;
177     char *op;
178     data1_node *field, *subf;
179
180     for (field = n->child; field; field = field->next)
181     {
182         if (field->which != DATA1N_tag)
183         {
184             logf(LOG_WARN, "Malformed field composition for marc output.");
185             return -1;
186         }
187         if (selected && !field->u.tag.node_selected)
188             continue;
189         len += 4 + p->length_data_entry + p->length_starting
190             + p->length_implementation;
191         base_address += 3 + p->length_data_entry + p->length_starting
192             + p->length_implementation;
193         if (strncmp(field->u.tag.tag, "00", 2))
194             len += p->indicator_length;      /* this is fairly bogus */
195         for (subf = field->child; subf; subf = subf->next)
196         {
197             if (subf->which != DATA1N_tag)
198             {
199                 logf(LOG_WARN,
200                     "Malformed subfield composition for marc output.");
201                 return -1;
202             }
203             if (strncmp(field->u.tag.tag, "00", 2))
204                 len += p->identifier_length;
205             get_data(subf, &dlen);
206             len += dlen;
207         }
208     }
209
210     if (!*buf)
211         *buf = xmalloc(*size = len);
212     else if (*size <= len)
213         *buf = xrealloc(*buf, *size = len);
214         
215     op = *buf;
216     memint (op, len, 5);
217     memcpy (op+5, p->record_status, 1);
218     memcpy (op+6, p->implementation_codes, 4);
219     memint (op+10, p->indicator_length, 1);
220     memint (op+11, p->identifier_length, 1);
221     memint (op+12, base_address, 5);
222     memcpy (op+17, p->user_systems, 3);
223     memint (op+20, p->length_data_entry, 1);
224     memint (op+21, p->length_starting, 1);
225     memint (op+22, p->length_implementation, 1);
226     memcpy (op+23, p->future_use, 1);
227     
228     entry_p = 24;
229     data_p = base_address;
230
231     for (field = n->child; field; field = field->next)
232     {
233         int data_0 = data_p;
234         if (selected && !field->u.tag.node_selected)
235             continue;
236         if (strncmp(field->u.tag.tag, "00", 2))   /* bogus */
237         {
238             memcpy (op + data_p, "  ", p->indicator_length);
239             data_p += p->indicator_length;
240         }
241         for (subf = field->child; subf; subf = subf->next)
242         {
243             char *data;
244
245             if (strncmp(field->u.tag.tag, "00", 2))
246             {
247                 op[data_p] = ISO2709_IDFS;
248                 memcpy (op + data_p+1, subf->u.tag.tag, p->identifier_length-1);
249                 data_p += p->identifier_length;
250             }
251             data = get_data(subf, &dlen);
252             memcpy (op + data_p, data, dlen);
253             data_p += dlen;
254         }
255         op[data_p++] = ISO2709_FS;
256
257         memcpy (op + entry_p, field->u.tag.tag, 3);
258         entry_p += 3;
259         memint (op + entry_p, data_p - data_0, p->length_data_entry);
260         entry_p += p->length_data_entry;
261         memint (op + entry_p, data_0 - base_address, p->length_starting);
262         entry_p += p->length_starting;
263         entry_p += p->length_implementation;
264     }
265     op[entry_p++] = ISO2709_FS;
266     assert (entry_p == base_address);
267     op[data_p++] = ISO2709_RS;
268     assert (data_p == len);
269     return len;
270 }
271
272 char *data1_nodetomarc(data1_marctab *p, data1_node *n, int selected, int *len)
273 {
274     static char *buf = 0;
275     static int size = 0;
276
277     *len = nodetomarc(p, n, selected, &buf, &size);
278     return buf;
279 }