Added data1 to marc conversion.
[yaz-moved-to-github.git] / retrieval / d1_marc.c
1 /*
2  * Copyright (c) 1995, Index Data.
3  * See the file LICENSE for details.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: d1_marc.c,v $
7  * Revision 1.5  1997-09-04 13:48:04  adam
8  * Added data1 to marc conversion.
9  *
10  * Revision 1.4  1996/03/25 10:18:03  quinn
11  * Removed trailing whitespace from data elements
12  *
13  * Revision 1.3  1995/11/01  16:34:57  quinn
14  * Making data1 look for tables in data1_tabpath
15  *
16  * Revision 1.2  1995/11/01  13:54:48  quinn
17  * Minor adjustments
18  *
19  * Revision 1.1  1995/11/01  11:56:08  quinn
20  * Added Retrieval (data management) functions en masse.
21  *
22  *
23  */
24
25
26 #include <assert.h>
27 #include <stdlib.h>
28 #include <string.h>
29 #include <ctype.h>
30
31 #include <oid.h>
32 #include <log.h>
33 #include <marcdisp.h>
34 #include <readconf.h>
35 #include <xmalloc.h>
36 #include <data1.h>
37 #include <tpath.h>
38
39 data1_marctab *data1_read_marctab(char *file)
40 {
41     FILE *f;
42     data1_marctab *res = xmalloc(sizeof(*res));
43     char line[512], *argv[50];
44     int argc;
45     
46     if (!(f = yaz_path_fopen(data1_tabpath, file, "r")))
47     {
48         logf(LOG_WARN|LOG_ERRNO, "%s", file);
49         return 0;
50     }
51
52     res->name = 0;
53     res->reference = VAL_NONE;
54     res->next = 0;
55     res->length_data_entry = 4;
56     res->length_starting = 5;
57     res->length_implementation = 0;
58     strcpy(res->future_use, "4");
59
60     strcpy(res->record_status, "n");
61     strcpy(res->implementation_codes, "    ");
62     res->indicator_length = 2;
63     res->identifier_length = 2;
64     strcpy(res->user_systems, "z  ");
65
66     while ((argc = readconf_line(f, line, 512, argv, 50)))
67         if (!strcmp(argv[0], "name"))
68         {
69             if (argc != 2)
70             {
71                 logf(LOG_WARN, "%s: Bad name directive");
72                 continue;
73             }
74             res->name = xmalloc(strlen(argv[1])+1);
75             strcpy(res->name, argv[1]);
76         }
77         else if (!strcmp(argv[0], "reference"))
78         {
79             if (argc != 2)
80             {
81                 logf(LOG_WARN, "%s: Bad name directive");
82                 continue;
83             }
84             if ((res->reference = oid_getvalbyname(argv[1])) == VAL_NONE)
85             {
86                 logf(LOG_WARN, "%s: Unknown tagset ref '%s' in %s", file,
87                     argv[1]);
88                 continue;
89             }
90         }
91         else if (!strcmp(argv[0], "length-data-entry"))
92         {
93             if (argc != 2)
94             {
95                 logf(LOG_WARN, "%s: Bad data-length-entry");
96                 continue;
97             }
98             res->length_data_entry = atoi(argv[1]);
99         }
100         else if (!strcmp(argv[0], "length-starting"))
101         {
102             if (argc != 2)
103             {
104                 logf(LOG_WARN, "%s: Bad length-starting");
105                 continue;
106             }
107             res->length_starting = atoi(argv[1]);
108         }
109         else if (!strcmp(argv[0], "length-implementation"))
110         {
111             if (argc != 2)
112             {
113                 logf(LOG_WARN, "%s: Bad length-implentation");
114                 continue;
115             }
116             res->length_implementation = atoi(argv[1]);
117         }
118         else if (!strcmp(argv[0], "future-use"))
119         {
120             if (argc != 2)
121             {
122                 logf(LOG_WARN, "%s: Bad future-use");
123                 continue;
124             }
125             strncpy(res->future_use, argv[1], 2);
126         }
127         else
128             logf(LOG_WARN, "%s: Bad directive '%s'", file, argv[0]);
129
130     fclose(f);
131     return res;
132 }
133
134 /*
135  * Locate some data under this node. This routine should handle variants
136  * prettily.
137  */
138 static char *get_data(data1_node *n, int *len)
139 {
140     char *r;
141
142     while (n->which != DATA1N_data && n->child)
143         n = n->child;
144     if (n->which != DATA1N_data || n->u.data.what != DATA1I_text)
145     {
146         r = "[Structured/included data]";
147         *len = strlen(r);
148         return r;
149     }
150
151     *len = n->u.data.len;
152     while (*len && isspace(n->u.data.data[*len - 1]))
153         (*len)--;
154     return n->u.data.data;
155 }
156
157 static void memint (char *p, int val, int len)
158 {
159     static char buf[9];
160
161     if (len == 1)
162         *p = val + '0';
163     else
164     {
165         sprintf (buf, "%08d", val);
166         memcpy (p, buf+8-len, len);
167     }
168 }
169
170 static int is_indicator (data1_marctab *p, data1_node *subf)
171 {
172 #if 1
173     if (p->indicator_length != 2 ||
174         (subf->which == DATA1N_tag && strlen(subf->u.tag.tag) == 2))
175         return 1;
176 #else
177     if (subf->which == DATA1N_tag && subf->child->which == DATA1N_tag)
178         return 1;
179 #endif
180     return 0;
181 }
182
183 static int nodetomarc(data1_marctab *p, data1_node *n, int selected,
184     char **buf, int *size)
185 {
186     int len = 26;
187     int dlen;
188     int base_address = 25;
189     int entry_p, data_p;
190     char *op;
191     data1_node *field, *subf;
192
193     for (field = n->child; field; field = field->next)
194     {
195         if (field->which != DATA1N_tag)
196         {
197             logf(LOG_WARN, "Malformed field composition for marc output.");
198             return -1;
199         }
200         if (selected && !field->u.tag.node_selected)
201             continue;
202         len += 4 + p->length_data_entry + p->length_starting
203             + p->length_implementation;
204         base_address += 3 + p->length_data_entry + p->length_starting
205             + p->length_implementation;
206         if (strncmp(field->u.tag.tag, "00", 2))
207             len += p->indicator_length;      /* this is fairly bogus */
208         subf = field->child;
209         
210         /*  we'll allow no indicator if length is not 2 */
211         if (is_indicator (p, subf))
212             subf = subf->child;
213
214         for (; subf; subf = subf->next)
215         {
216             if (subf->which != DATA1N_tag)
217             {
218                 logf(LOG_WARN,
219                     "Malformed subfield composition for marc output.");
220                 return -1;
221             }
222             if (strncmp(field->u.tag.tag, "00", 2))
223                 len += p->identifier_length;
224             get_data(subf, &dlen);
225             len += dlen;
226         }
227     }
228
229     if (!*buf)
230         *buf = xmalloc(*size = len);
231     else if (*size <= len)
232         *buf = xrealloc(*buf, *size = len);
233         
234     op = *buf;
235     memint (op, len, 5);
236     memcpy (op+5, p->record_status, 1);
237     memcpy (op+6, p->implementation_codes, 4);
238     memint (op+10, p->indicator_length, 1);
239     memint (op+11, p->identifier_length, 1);
240     memint (op+12, base_address, 5);
241     memcpy (op+17, p->user_systems, 3);
242     memint (op+20, p->length_data_entry, 1);
243     memint (op+21, p->length_starting, 1);
244     memint (op+22, p->length_implementation, 1);
245     memcpy (op+23, p->future_use, 1);
246     
247     entry_p = 24;
248     data_p = base_address;
249
250     for (field = n->child; field; field = field->next)
251     {
252         int data_0 = data_p;
253         char *indicator_data = "    ";
254         if (selected && !field->u.tag.node_selected)
255             continue;
256
257         subf = field->child;
258
259         if (is_indicator (p, subf))
260         {
261             indicator_data = subf->u.tag.tag;
262             subf = subf->child;
263         }
264         if (strncmp(field->u.tag.tag, "00", 2))   /* bogus */
265         {
266             memcpy (op + data_p, indicator_data, p->indicator_length);
267             data_p += p->indicator_length;
268         }
269         for (; subf; subf = subf->next)
270         {
271             char *data;
272
273             if (strncmp(field->u.tag.tag, "00", 2))
274             {
275                 op[data_p] = ISO2709_IDFS;
276                 memcpy (op + data_p+1, subf->u.tag.tag, p->identifier_length-1);
277                 data_p += p->identifier_length;
278             }
279             data = get_data(subf, &dlen);
280             memcpy (op + data_p, data, dlen);
281             data_p += dlen;
282         }
283         op[data_p++] = ISO2709_FS;
284
285         memcpy (op + entry_p, field->u.tag.tag, 3);
286         entry_p += 3;
287         memint (op + entry_p, data_p - data_0, p->length_data_entry);
288         entry_p += p->length_data_entry;
289         memint (op + entry_p, data_0 - base_address, p->length_starting);
290         entry_p += p->length_starting;
291         entry_p += p->length_implementation;
292     }
293     op[entry_p++] = ISO2709_FS;
294     assert (entry_p == base_address);
295     op[data_p++] = ISO2709_RS;
296     assert (data_p == len);
297     return len;
298 }
299
300 char *data1_nodetomarc(data1_marctab *p, data1_node *n, int selected, int *len)
301 {
302     static char *buf = 0;
303     static int size = 0;
304
305     *len = nodetomarc(p, n, selected, &buf, &size);
306     return buf;
307 }