JSON / MARC encoding
[yaz-moved-to-github.git] / include / yaz / marcdisp.h
1 /* This file is part of the YAZ toolkit.
2  * Copyright (C) 1995-2013 Index Data.
3  * All rights reserved.
4  * Redistribution and use in source and binary forms, with or without
5  * modification, are permitted provided that the following conditions are met:
6  *
7  *     * Redistributions of source code must retain the above copyright
8  *       notice, this list of conditions and the following disclaimer.
9  *     * Redistributions in binary form must reproduce the above copyright
10  *       notice, this list of conditions and the following disclaimer in the
11  *       documentation and/or other materials provided with the distribution.
12  *     * Neither the name of Index Data nor the names of its contributors
13  *       may be used to endorse or promote products derived from this
14  *       software without specific prior written permission.
15  *
16  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND ANY
17  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
18  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
19  * DISCLAIMED. IN NO EVENT SHALL THE REGENTS AND CONTRIBUTORS BE LIABLE FOR ANY
20  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
21  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
22  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
23  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
24  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
25  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
26  */
27
28 /**
29  * \file marcdisp.h
30  * \brief MARC conversion
31  */
32
33 #ifndef MARCDISP_H
34 #define MARCDISP_H
35
36 #include <yaz/yconfig.h>
37 #include <stdio.h>
38 #include <yaz/wrbuf.h>
39
40 #include <yaz/nmem.h>
41 #include <yaz/xmltypes.h>
42 #include <yaz/z-opac.h>
43
44 YAZ_BEGIN_CDECL
45
46 /** \brief a yaz_marc_t handle (private content) */
47 typedef struct yaz_marc_t_ *yaz_marc_t;
48
49 /** \brief construct yaz_marc_t handle */
50 YAZ_EXPORT yaz_marc_t yaz_marc_create(void);
51
52 /** \brief destroy yaz_marc_t handle */
53 YAZ_EXPORT void yaz_marc_destroy(yaz_marc_t mt);
54
55 /** \brief set XML mode YAZ_MARC_LINE, YAZ_MARCXML, YAZ_MARC_ISO2709 ..
56     \param mt MARC handle
57     \param xmlmode mode.
58
59     This function ONLY affects yaz_marc_write_mode, yaz_marc_write_trailer.
60 */
61 YAZ_EXPORT void yaz_marc_xml(yaz_marc_t mt, int xmlmode);
62
63 /** \brief Output format: Line-format */
64 #define YAZ_MARC_LINE      0
65 /** \brief Output format: simplexml (no longer supported) */
66 #define YAZ_MARC_SIMPLEXML 1
67 /** \brief Output format: OAI-MARC (no longer supported) */
68 #define YAZ_MARC_OAIMARC   2
69 /** \brief Output format: MARCXML */
70 #define YAZ_MARC_MARCXML   3
71 /** \brief Output format: ISO2709 */
72 #define YAZ_MARC_ISO2709   4
73 /** \brief Output format: MarcXchange (ISO25577) */
74 #define YAZ_MARC_XCHANGE   5
75 /** \brief Output format: check only (no marc output) */
76 #define YAZ_MARC_CHECK     6
77 /** \brief Output format: Turbo MARC Index Data format (XML based) */
78 #define YAZ_MARC_TURBOMARC 7
79 /** \brief Output format: JSON */
80 #define YAZ_MARC_JSON      8
81
82 /** \brief set iconv handle for character set conversion */
83 YAZ_EXPORT void yaz_marc_iconv(yaz_marc_t mt, yaz_iconv_t cd);
84
85 /** \brief supply iconv handle for character set conversion */
86 YAZ_EXPORT yaz_iconv_t yaz_marc_get_iconv(yaz_marc_t mt);
87
88 /** \brief set debug level
89     \param mt handle
90     \param level level, where 0=lowest, 1 more debug, 2 even more
91 */
92 YAZ_EXPORT void yaz_marc_debug(yaz_marc_t mt, int level);
93
94 /** \brief decodes ISO2709 buffer using straight buffers
95     \param mt marc handle
96     \param buf input buffer
97     \param bsize size of buffer or (-1 if "any size")
98     \param result result to be stored here
99     \param rsize size of result (memory "owned" by yaz_marc_mt handle)
100
101     Decodes MARC in buf of size bsize.
102     On success, result in *result with size *rsize.
103     Returns -1 on error, or size of input record (>0) if OK
104 */
105 YAZ_EXPORT int yaz_marc_decode_buf(yaz_marc_t mt, const char *buf, int bsize,
106                                    const char **result, size_t *rsize);
107
108 /** \brief decodes ISO2709/MARC buffer and stores result in WRBUF
109     \param mt handle
110     \param buf input buffer
111     \param bsize size of buffer (-1 if "any size")
112     \param wrbuf WRBUF for output
113
114     Decodes MARC in buf of size bsize.
115     On success, result in wrbuf
116     Returns -1 on error, or size of input record (>0) if OK
117 */
118 YAZ_EXPORT int yaz_marc_decode_wrbuf(yaz_marc_t mt, const char *buf,
119                                      int bsize, WRBUF wrbuf);
120
121 YAZ_EXPORT void yaz_marc_subfield_str(yaz_marc_t mt, const char *s);
122 YAZ_EXPORT void yaz_marc_endline_str(yaz_marc_t mt, const char *s);
123
124 /** \brief modifies part of the MARC leader */
125 YAZ_EXPORT void yaz_marc_modify_leader(yaz_marc_t mt, size_t off,
126                                        const char *str);
127
128 /** \brief like atoi(3) except that it reads exactly len characters
129     \param buf buffer to read
130     \param len number of bytes to consider (being digits)
131     \returns value
132  */
133 YAZ_EXPORT int atoi_n(const char *buf, int len);
134
135 /** \brief like atoi_n but checks for proper formatting
136     \param buf buffer to read values from
137     \param size size of buffer
138     \param val value of decimal number (if successful)
139     \retval 0 no value found (non-digits found)
140     \retval 1 value found and *val holds value
141 */
142 YAZ_EXPORT
143 int atoi_n_check(const char *buf, int size, int *val);
144
145 /** \brief MARC control char: record separator (29 Dec, 1D Hex) */
146 #define ISO2709_RS 035
147 /** \brief MARC control char: field separator (30 Dec, 1E Hex) */
148 #define ISO2709_FS 036
149 /** \brief MARC control char: identifier-field separator (31 Dec, 1F Hex) */
150 #define ISO2709_IDFS 037
151
152 /** \brief read ISO2709/MARC record from buffer
153     \param mt handle
154     \param buf ISO2709 buffer of size bsize
155     \param bsize size of buffer (-1 for unlimited size)
156
157     Parses ISO2709 record from supplied buffer
158     \retval -1 ERROR
159     \retval >0 OK (length)
160 */
161 YAZ_EXPORT int yaz_marc_read_iso2709(yaz_marc_t mt,
162                                      const char *buf, int bsize);
163
164 /** \brief read MARC lineformat from stream
165     \param mt handle
166     \param getbyte get one byte handler
167     \param ungetbyte unget one byte handler
168     \param client_data opaque data for handers
169     \retval -1 ERROR
170     \retval >0 OK (length)
171
172     Parses MARC line record from stream
173     Returns > 0 for OK (same as length), -1=ERROR
174 */
175 YAZ_EXPORT
176 int yaz_marc_read_line(yaz_marc_t mt,
177                        int (*getbyte)(void *client_data),
178                        void (*ungetbyte)(int b, void *client_data),
179                        void *client_data);
180
181 #if YAZ_HAVE_XML2
182 /** \brief parses MARCXML/MarcXchange/TurboMARC record from xmlNode pointer
183     \param mt handle
184     \param ptr is a pointer to root xml node
185     \retval 0 OK
186     \retval -1 ERROR
187 */
188 YAZ_EXPORT int yaz_marc_read_xml(yaz_marc_t mt, const xmlNode *ptr);
189 #endif
190
191 /** \brief writes record in line format
192     \param mt handle
193     \param wrbuf WRBUF for output
194     \retval 0 OK
195     \retval -1 ERROR
196 */
197 YAZ_EXPORT int yaz_marc_write_line(yaz_marc_t mt, WRBUF wrbuf);
198
199 /** \brief writes record in MARCXML format
200     \param mt handle
201     \param wrbuf WRBUF for output
202     \retval 0 OK
203     \retval -1 ERROR
204
205     Sets leader[9]='a' .
206 */
207 YAZ_EXPORT int yaz_marc_write_marcxml(yaz_marc_t mt, WRBUF wrbuf);
208
209 /** \brief writes record in TurboMARC format
210     \param mt handle
211     \param wrbuf WRBUF for output
212     \retval 0 OK
213     \retval -1 ERROR
214 */
215 YAZ_EXPORT int yaz_marc_write_turbomarc(yaz_marc_t mt, WRBUF wrbuf);
216
217 /** \brief writes record in MarcXchange XML (ISO25577)
218     \param mt handle
219     \param wrbuf WRBUF for output
220     \param format record format (e.g. "MARC21")
221     \param type record type (e.g. Bibliographic)
222     \retval 0 OK
223     \retval -1 ERROR
224 */
225 YAZ_EXPORT int yaz_marc_write_marcxchange(yaz_marc_t mt, WRBUF wrbuf,
226                                           const char *format,
227                                           const char *type);
228
229 /** \brief writes record in ISO2709 format
230     \param mt handle
231     \param wrbuf WRBUF for output
232     \retval 0 OK
233     \retval -1 ERROR
234 */
235 YAZ_EXPORT int yaz_marc_write_iso2709(yaz_marc_t mt, WRBUF wrbuf);
236
237 /** \brief writes record in mode - given by yaz_marc_xml mode
238     \param mt handle
239     \param wrbuf WRBUF for output
240     \retval 0 OK
241     \retval -1 ERROR
242
243     This function calls yaz_marc_write_iso2709, yaz_marc_write_marcxml,
244     etc.. depending on mode given by yaz_marc_xml.
245 */
246 YAZ_EXPORT int yaz_marc_write_mode(yaz_marc_t mt, WRBUF wrbuf);
247
248 #if YAZ_HAVE_XML2
249 /** \brief writes MARC record as libxml2 tree
250     \param mt handle
251     \param root_ptr pointer to record node
252     \param ns namespace of record (such as "http://www.loc.gov/MARC21/slim")
253     \param format MarcXchange format (NULL for none)
254     \param type MarcXchange format (NULL for none)
255     \retval 0 Creation successful and *root_ptr is "record" node
256     \retval -1 ERROR
257 */
258 YAZ_EXPORT
259 int yaz_marc_write_xml(yaz_marc_t mt, xmlNode **root_ptr,
260                        const char *ns,
261                        const char *format,
262                        const char *type);
263 #endif
264
265 /** \brief sets leader spec (for modifying bytes in 24 byte leader)
266     \param mt handle
267     \param leader_spec
268     \retval 0 OK
269     \retval -1 ERROR
270
271     Spec takes form pos=val,pos=val,...
272     where value is either a number (decimal char value) or a
273     string in 'a', e.g. 9='a'
274
275 */
276 YAZ_EXPORT int yaz_marc_leader_spec(yaz_marc_t mt, const char *leader_spec);
277
278
279 /** \brief sets leader, validates it, and returns important values
280     \param mt handle
281     \param leader of the 24 byte leader to be set
282     \param indicator_length indicator length (returned value)
283     \param identifier_length identifier length (returned value)
284     \param base_address base address (returned value)
285     \param length_data_entry length of data entry (returned value)
286     \param length_starting length of starting
287     \param length_implementation length of implementation defined data
288 */
289 YAZ_EXPORT
290 void yaz_marc_set_leader(yaz_marc_t mt, const char *leader,
291                          int *indicator_length,
292                          int *identifier_length,
293                          int *base_address,
294                          int *length_data_entry,
295                          int *length_starting,
296                          int *length_implementation);
297
298
299 /** \brief adds MARC comment string
300     \param mt handle
301     \param comment comment to be added)
302 */
303 YAZ_EXPORT
304 void yaz_marc_add_comment(yaz_marc_t mt, char *comment);
305
306 /** \brief adds MARC annotation - printf interface
307     \param mt handle
308     \param fmt printf format string
309 */
310 YAZ_EXPORT
311 void yaz_marc_cprintf(yaz_marc_t mt, const char *fmt, ...);
312
313 /** \brief adds subfield to MARC structure
314     \param mt handle
315     \param code_data code data buffer
316     \param code_data_len length of code data
317 */
318 YAZ_EXPORT
319 void yaz_marc_add_subfield(yaz_marc_t mt,
320                            const char *code_data, size_t code_data_len);
321
322
323 /** \brief adds controlfield to MARC structure
324     \param mt handle
325     \param tag (e.g. "001"
326     \param data value for this tag
327     \param data_len length of data
328 */
329 YAZ_EXPORT
330 void yaz_marc_add_controlfield(yaz_marc_t mt, const char *tag,
331                                const char *data, size_t data_len);
332
333
334 #if YAZ_HAVE_XML2
335 /** \brief adds controlfield to MARC structure using xml Nodes
336     \param mt handle
337     \param ptr_tag value of tag (TEXT xmlNode)
338     \param ptr_data value of data (TEXT xmlNode)
339 */
340 YAZ_EXPORT
341 void yaz_marc_add_controlfield_xml(yaz_marc_t mt, const xmlNode *ptr_tag,
342                                    const xmlNode *ptr_data);
343
344 /** \brief adds controlfield to MARC structure using xml Nodes for data
345     \param mt handle
346     \param tag string tag
347     \param ptr_data value of data (TEXT xmlNode)
348 */
349 YAZ_EXPORT
350 void yaz_marc_add_controlfield_xml2(yaz_marc_t mt, char *tag,
351                                     const xmlNode *ptr_data);
352 #endif
353
354 /** \brief adds datafield to MARC structure using strings
355     \param mt handle
356     \param tag value of tag as string
357     \param indicator indicator string
358     \param indicator_len length of indicator string
359 */
360 YAZ_EXPORT
361 void yaz_marc_add_datafield(yaz_marc_t mt, const char *tag,
362                             const char *indicator, size_t indicator_len);
363
364 #if YAZ_HAVE_XML2
365 /** \brief adds datafield to MARC structure using xml Nodes
366     \param mt handle
367     \param ptr_tag value of tag (TEXT xmlNode)
368     \param indicator indicator string
369     \param indicator_len length of indicator string
370 */
371 YAZ_EXPORT
372 void yaz_marc_add_datafield_xml(yaz_marc_t mt, const xmlNode *ptr_tag,
373                                 const char *indicator, size_t indicator_len);
374
375 /** \brief adds datafield to MARC structure using xml Nodes
376     \param mt handle
377     \param tag_value string value (pointer copied verbatim, not strdupped)
378     \param indicators indicator string ; pointer copied verbatim; not strdupped
379 */
380 YAZ_EXPORT
381 void yaz_marc_add_datafield_xml2(yaz_marc_t mt, char *tag_value,
382                                  char *indicators);
383
384 #endif
385
386 /** \brief returns memory for MARC handle
387     \param mt handle
388     \retval NMEM handle for MARC system
389 */
390 YAZ_EXPORT
391 NMEM yaz_marc_get_nmem(yaz_marc_t mt);
392
393 /** \brief clears memory and MARC record
394     \param mt handle
395 */
396 YAZ_EXPORT
397 void yaz_marc_reset(yaz_marc_t mt);
398
399 /** \brief gets debug level for MARC system
400     \param mt handle
401 */
402 YAZ_EXPORT
403 int yaz_marc_get_debug(yaz_marc_t mt);
404
405 /** \brief Converts MARC format type to format type(YAZ_MARC_..)
406     \param arg string
407     \retval -1 unknown format (bad arg)
408     \retval >= 0 OK (one of YAZ_MARC - values)
409 */
410 YAZ_EXPORT
411 int yaz_marc_decode_formatstr(const char *arg);
412
413 /** \brief Enables or disables writing of MARC XML records using Libxml2
414     \param mt handle
415     \param enable 0=disable, 1=enable
416 */
417 YAZ_EXPORT
418 void yaz_marc_write_using_libxml2(yaz_marc_t mt, int enable);
419
420 /** \brief Performs "pretty" display of OPAC record to WRBUF using marc_t
421     \param mt handle
422     \param r OPAC record
423     \param wrbuf WRBUF for resulting display string
424
425     This function uses iconv_handle of yaz_marc_t for character set
426     conversion of both OPAC + ISO2709 part.
427     \*/
428 YAZ_EXPORT void yaz_opac_decode_wrbuf(yaz_marc_t mt, Z_OPACRecord *r,
429                                       WRBUF wrbuf);
430
431 /** \brief Performs "pretty" display of OPAC record to WRBUF using marc_t
432     \param mt handle
433     \param r OPAC record
434     \param wrbuf WRBUF for resulting display string
435     \param cd iconv handle for OPAC content (not ISO2709 part)
436
437     This function uses iconv handle of yaz_marc_t for character set
438     conversion of ISO2709 part and supplied handle (cd) for OPAC part.
439     \*/
440 YAZ_EXPORT void yaz_opac_decode_wrbuf2(yaz_marc_t mt, Z_OPACRecord *r,
441                                        WRBUF wrbuf, yaz_iconv_t cd);
442
443 #if YAZ_HAVE_XML2
444 /** \brief Converts XML to OPAC
445     \param mt marc handle
446     \param buf_in XML buffer
447     \param size_in size of XML buffer
448     \param dst Z39.50 OPAC result - allocated by NMEM on marc handle
449     \param cd iconv handle for the OPAC content (not ISO2709 part)
450     \param nmem memory for OPACRecord (if NULL, mt NMEM memory is used)
451     \param syntax OID for embedded MARC (if NULL, USMARC is used)
452     \retval 1 conversion OK
453     \retval 0 conversion NOT OK
454     \*/
455 YAZ_EXPORT int yaz_xml_to_opac(yaz_marc_t mt,
456                                const char *buf_in, size_t size_in,
457                                Z_OPACRecord **dst, yaz_iconv_t cd,
458                                NMEM nmem, const Odr_oid *syntax);
459 #endif
460
461 /** \brief flushes records
462     \param mt handle
463     \param wr WRBUF for output
464     \retval 0 OK
465     \retval -1 ERROR
466 */
467 YAZ_EXPORT int yaz_marc_write_trailer(yaz_marc_t mt, WRBUF wr);
468
469 /** \brief enables record collection output
470     \param mt handle
471 */
472 YAZ_EXPORT void yaz_marc_enable_collection(yaz_marc_t mt);
473
474 YAZ_END_CDECL
475
476 #endif
477 /*
478  * Local variables:
479  * c-basic-offset: 4
480  * c-file-style: "Stroustrup"
481  * indent-tabs-mode: nil
482  * End:
483  * vim: shiftwidth=4 tabstop=8 expandtab
484  */
485