Version 1.3.50.
[idzebra-moved-to-github.git] / include / data1.h
1 /* $Id: data1.h,v 1.9.2.5 2006-10-26 23:46:48 adam Exp $
2    Copyright (C) 1995,1996,1997,1998,1999,2000,2001,2002,2003,2004
3    Index Data Aps
4
5 This file is part of the Zebra server.
6
7 Zebra is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with this program; if not, write to the Free Software
19 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
20
21 */
22
23 #ifndef DATA1_H
24 #define DATA1_H
25
26 #define ENHANCED_XELM 1
27 #define OPTIMIZE_MELM 1
28
29 #include <stdio.h>
30
31 #include <yaz/nmem.h>
32 #include <yaz/oid.h>
33 #include <yaz/proto.h>
34
35 #include <d1_attset.h>
36 #include <d1_map.h>
37 #include <yaz/yaz-util.h>
38 #include <yaz/wrbuf.h>
39 #include <dfa.h>         /* pop */
40 #include <zebra_xpath.h> /* pop */
41
42 #define d1_isspace(c) strchr(" \r\n\t\f", c)
43 #define d1_isdigit(c) ((c) <= '9' && (c) >= '0')
44
45 YAZ_BEGIN_CDECL
46
47 #define data1_matchstr(s1, s2) yaz_matchstr(s1, s2)
48
49 #define DATA1_MAX_SYMBOL 31
50
51 typedef struct data1_name
52 {
53     char *name;
54     struct data1_name *next;
55 } data1_name;
56
57 typedef struct data1_absyn_cache_info *data1_absyn_cache;
58 typedef struct data1_attset_cache_info *data1_attset_cache;
59
60 typedef enum data1_datatype
61 {
62     DATA1K_unknown,
63     DATA1K_structured,
64     DATA1K_string,
65     DATA1K_numeric,
66     DATA1K_bool,
67     DATA1K_oid,
68     DATA1K_generalizedtime,
69     DATA1K_intunit,
70     DATA1K_int,
71     DATA1K_octetstring,
72     DATA1K_null
73 } data1_datatype;
74
75 typedef struct data1_marctab
76 {
77     char *name;
78     oid_value reference;
79
80     char record_status[2];
81     char implementation_codes[5];
82     int  indicator_length;
83     int  identifier_length;
84     char user_systems[4];
85
86     int  length_data_entry;
87     int  length_starting;
88     int  length_implementation;
89     char future_use[2];
90
91     int  force_indicator_length;
92     int  force_identifier_length;
93     char leader[24]; /* Fixme! Need linear access to LEADER of MARC record */  
94     struct data1_marctab *next;
95 } data1_marctab;
96
97 typedef struct data1_esetname
98 {
99     char *name;
100     Z_Espec1 *spec;
101     struct data1_esetname *next;
102 } data1_esetname;
103
104 /*
105  * Variant set definitions.
106  */
107
108 typedef struct data1_vartype
109 {
110     char *name;
111     struct data1_varclass *zclass;
112     int type;
113     data1_datatype datatype;
114     struct data1_vartype *next;
115 } data1_vartype;
116
117 typedef struct data1_varclass
118 {
119     char *name;
120     struct data1_varset *set;
121     int zclass;
122     data1_vartype *types;
123     struct data1_varclass *next;
124 } data1_varclass;
125
126 typedef struct data1_varset
127 {
128     char *name;
129     oid_value reference;
130     data1_varclass *classes;
131 } data1_varset;
132
133 /*
134  * Tagset definitions
135  */
136
137 struct data1_tagset;
138
139 typedef struct data1_tag
140 {
141     data1_name *names;
142 #define DATA1T_numeric 1
143 #define DATA1T_string 2
144     int which;
145     union
146     {
147         int numeric;
148         char *string;
149     } value;
150     data1_datatype kind;
151
152     struct data1_tagset *tagset;
153     struct data1_tag *next;
154 } data1_tag;
155
156 typedef struct data1_tagset data1_tagset;
157
158 struct data1_tagset
159 {
160     int type;                        /* type of tagset in current context */
161     char *name;                      /* symbolic name */
162     oid_value reference;
163     data1_tag *tags;                 /* tags defined by this set */
164     data1_tagset *children;          /* children */
165     data1_tagset *next;              /* sibling */
166 };
167
168 typedef struct data1_termlist
169 {
170     data1_att *att;
171     char *structure;
172     char *source;
173     struct data1_termlist *next;
174 } data1_termlist;
175
176 /*
177  * abstract syntax specification
178  */
179
180 typedef struct data1_element
181 {
182     char *name;
183     data1_tag *tag;
184     data1_termlist *termlists;
185     char *sub_name;
186     struct data1_element *children;
187     struct data1_element *next;
188 } data1_element;
189
190 typedef struct data1_sub_elements {
191     char *name;
192     struct data1_sub_elements *next;
193     data1_element *elements;
194 } data1_sub_elements;
195
196 /* pop */
197 typedef struct data1_xpelement
198 {
199     char *xpath_expr;
200 #ifdef ENHANCED_XELM 
201     struct xpath_location_step xpath[XPATH_STEP_COUNT];
202     int xpath_len;
203 #endif
204     struct DFA *dfa;  
205     data1_termlist *termlists;
206     struct data1_xpelement *next;
207 #if OPTIMIZE_MELM
208     const char *regexp;
209 #endif
210     int match_state;
211     struct data1_xpelement *match_next;
212 } data1_xpelement;
213
214 typedef struct data1_xattr {
215     char *name;
216     char *value;
217     struct data1_xattr *next;
218     unsigned short what;  /* DATA1I_text, .. see data1_node.u.data */
219 } data1_xattr;
220
221 typedef struct data1_absyn
222 {
223     char *name;
224     oid_value reference;
225     data1_tagset *tagset;
226     data1_attset *attset;
227     data1_varset *varset;
228     data1_esetname *esetnames;
229     data1_maptab *maptabs;
230     data1_marctab *marc;
231     data1_sub_elements *sub_elements;
232     data1_element *main_elements;
233     data1_xpelement *xp_elements; /* pop */
234     struct data1_systag *systags;
235     char *encoding;
236     int  enable_xpath_indexing;
237 } data1_absyn;
238
239 /*
240  * record data node (tag/data/variant)
241  */
242
243 typedef struct data1_node
244 {
245     /* the root of a record (containing global data) */
246 #define DATA1N_root 1 
247     /* a tag */
248 #define DATA1N_tag  2       
249     /* some data under a leaf tag or variant */
250 #define DATA1N_data 3
251     /* variant specification (a triple, actually) */
252 #define DATA1N_variant 4
253     /* comment (same as data) */
254 #define DATA1N_comment 5
255     /* preprocessing instruction */
256 #define DATA1N_preprocess 6
257     int which;
258     union
259     {
260         struct
261         {
262             char *type;
263             data1_absyn *absyn;  /* abstract syntax for this type */
264         } root;
265
266         struct 
267         {
268             char *tag;
269             data1_element *element;
270             int no_data_requested;
271             int get_bytes;
272             unsigned node_selected : 1;
273             unsigned make_variantlist : 1;
274             data1_xattr *attributes;
275         } tag;
276
277         struct
278         {
279             char *data;      /* filename or data */
280             int len;
281             /* text inclusion */
282 #define DATA1I_inctxt 1
283             /* binary data inclusion */
284 #define DATA1I_incbin 2
285         /* text data */
286 #define DATA1I_text 3 
287             /* numerical data */
288 #define DATA1I_num 4
289             /* object identifier */
290 #define DATA1I_oid 5
291             /* XML text */
292 #define DATA1I_xmltext 6
293             unsigned what:7;
294             unsigned formatted_text : 1;   /* newlines are significant */
295         } data;
296
297         struct
298         {
299             data1_vartype *type;
300             char *value;
301         } variant;
302
303         struct
304         {
305             char *target;
306             data1_xattr *attributes;
307         } preprocess;
308     } u;
309
310     void (*destroy)(struct data1_node *n);
311 #define DATA1_LOCALDATA 12
312     char lbuf[DATA1_LOCALDATA]; /* small buffer for local data */
313     struct data1_node *next;
314     struct data1_node *child;
315     struct data1_node *last_child;
316     struct data1_node *parent;
317     struct data1_node *root;
318 } data1_node;
319
320 YAZ_EXPORT data1_handle data1_create (void);
321
322 #define DATA1_FLAG_XML  1
323 YAZ_EXPORT data1_handle data1_createx (int flags);
324
325 YAZ_EXPORT void data1_destroy(data1_handle dh);
326 YAZ_EXPORT data1_node *get_parent_tag(data1_handle dh, data1_node *n);
327 YAZ_EXPORT data1_node *data1_read_node(data1_handle dh, const char **buf,
328                                        NMEM m);
329 YAZ_EXPORT data1_node *data1_read_nodex (data1_handle dh, NMEM m,
330                                          int (*get_byte)(void *fh), void *fh,
331                                          WRBUF wrbuf);
332 YAZ_EXPORT data1_node *data1_read_record(data1_handle dh, 
333                                          int (*rf)(void *, char *, size_t),
334                                          void *fh, NMEM m);
335 YAZ_EXPORT data1_absyn *data1_read_absyn(data1_handle dh, const char *file,
336                                          int file_must_exist);
337 YAZ_EXPORT data1_tag *data1_gettagbynum(data1_handle dh,
338                                         data1_tagset *s,
339                                         int type, int value);
340 YAZ_EXPORT data1_tagset *data1_empty_tagset (data1_handle dh);
341 YAZ_EXPORT data1_tagset *data1_read_tagset(data1_handle dh, 
342                                            const char *file,
343                                            int type);
344 YAZ_EXPORT data1_element *data1_getelementbytagname(data1_handle dh, 
345                                                     data1_absyn *abs,
346                                                     data1_element *parent,
347                                                     const char *tagname);
348 YAZ_EXPORT Z_GenericRecord *data1_nodetogr(data1_handle dh, data1_node *n,
349                                            int select, ODR o,
350                                            int *len);
351 YAZ_EXPORT data1_tag *data1_gettagbyname(data1_handle dh, data1_tagset *s,
352                                          const char *name);
353 YAZ_EXPORT void data1_free_tree(data1_handle dh, data1_node *t);
354 YAZ_EXPORT char *data1_nodetobuf(data1_handle dh, data1_node *n,
355                                  int select, int *len);
356 YAZ_EXPORT data1_node *data1_mk_tag_data_wd(data1_handle dh,
357                                             data1_node *at,
358                                             const char *tagname, NMEM m);
359 YAZ_EXPORT data1_node *data1_mk_tag_data(data1_handle dh, data1_node *at,
360                                          const char *tagname, NMEM m);
361 YAZ_EXPORT data1_datatype data1_maptype(data1_handle dh, char *t);
362 YAZ_EXPORT data1_varset *data1_read_varset(data1_handle dh, const char *file);
363 YAZ_EXPORT data1_vartype *data1_getvartypebyct(data1_handle dh,
364                                                data1_varset *set,
365                                                const char *zclass,
366                                                const char *type);
367 YAZ_EXPORT Z_Espec1 *data1_read_espec1(data1_handle dh, const char *file);
368 YAZ_EXPORT int data1_doespec1(data1_handle dh, data1_node *n, Z_Espec1 *e);
369 YAZ_EXPORT data1_esetname *data1_getesetbyname(data1_handle dh, 
370                                                data1_absyn *a,
371                                                const char *name);
372 YAZ_EXPORT data1_element *data1_getelementbyname(data1_handle dh,
373                                                  data1_absyn *absyn,
374                                                  const char *name);
375 YAZ_EXPORT data1_node *data1_mk_node2(data1_handle dh, NMEM m,
376                                       int type, data1_node *parent);
377
378 YAZ_EXPORT data1_node *data1_mk_tag (data1_handle dh, NMEM nmem, 
379                                      const char *tag, const char **attr,
380                                      data1_node *at);
381 YAZ_EXPORT data1_node *data1_mk_tag_n (data1_handle dh, NMEM nmem,
382                                        const char *tag, size_t len,
383                                        const char **attr,
384                                        data1_node *at);
385 YAZ_EXPORT void data1_tag_add_attr (data1_handle dh, NMEM nmem,
386                                     data1_node *res, const char **attr);
387
388 YAZ_EXPORT data1_node *data1_mk_text_n (data1_handle dh, NMEM mem,
389                                         const char *buf, size_t len,
390                                         data1_node *parent);
391 YAZ_EXPORT data1_node *data1_mk_text_nf (data1_handle dh, NMEM mem,
392                                          const char *buf, size_t len,
393                                          data1_node *parent);
394 YAZ_EXPORT data1_node *data1_mk_text (data1_handle dh, NMEM mem,
395                                       const char *buf, data1_node *parent);
396
397 YAZ_EXPORT data1_node *data1_mk_comment_n (data1_handle dh, NMEM mem,
398                                            const char *buf, size_t len,
399                                            data1_node *parent);
400
401 YAZ_EXPORT data1_node *data1_mk_comment (data1_handle dh, NMEM mem,
402                                          const char *buf, data1_node *parent);
403
404 YAZ_EXPORT data1_node *data1_mk_preprocess_n (data1_handle dh, NMEM nmem,
405                                               const char *target, size_t len,
406                                               const char **attr,
407                                               data1_node *at);
408
409 YAZ_EXPORT data1_node *data1_mk_preprocess (data1_handle dh, NMEM nmem,
410                                             const char *target,
411                                             const char **attr,
412                                             data1_node *at);
413
414 YAZ_EXPORT data1_node *data1_insert_preprocess_n (data1_handle dh, NMEM nmem,
415                                                   const char *target,
416                                                   size_t len,
417                                                   const char **attr,
418                                                   data1_node *at);
419
420 YAZ_EXPORT data1_node *data1_insert_preprocess (data1_handle dh, NMEM nmem,
421                                                 const char *target,
422                                                 const char **attr,
423                                                 data1_node *at);
424
425 YAZ_EXPORT data1_node *data1_mk_root (data1_handle dh, NMEM nmem,
426                                       const char *name);
427 YAZ_EXPORT void data1_set_root(data1_handle dh, data1_node *res,
428                                NMEM nmem, const char *name);
429
430 YAZ_EXPORT data1_node *data1_mk_tag_data_int (data1_handle dh, data1_node *at,
431                                               const char *tag, int num,
432                                               NMEM nmem);
433 YAZ_EXPORT data1_node *data1_mk_tag_data_oid (data1_handle dh, data1_node *at,
434                                               const char *tag, Odr_oid *oid,
435                                               NMEM nmem);
436 YAZ_EXPORT data1_node *data1_mk_tag_data_text (data1_handle dh, data1_node *at,
437                                                const char *tag,
438                                                const char *str,
439                                                NMEM nmem);
440 YAZ_EXPORT data1_node *data1_mk_tag_data_text_uni (data1_handle dh,
441                                                    data1_node *at,
442                                                    const char *tag,
443                                                    const char *str,
444                                                    NMEM nmem);
445
446 YAZ_EXPORT data1_absyn *data1_get_absyn (data1_handle dh, const char *name);
447
448 YAZ_EXPORT
449 data1_marctab *data1_absyn_getmarctab(data1_handle dh, data1_node *root);
450
451 YAZ_EXPORT
452 data1_element *data1_absyn_getelements(data1_handle dh,
453                                        data1_node *root);
454
455 YAZ_EXPORT data1_node *data1_search_tag (data1_handle dh, data1_node *n,
456                                          const char *tag);
457 YAZ_EXPORT data1_node *data1_mk_tag_uni (data1_handle dh, NMEM nmem, 
458                                          const char *tag, data1_node *at);
459 YAZ_EXPORT data1_attset *data1_get_attset (data1_handle dh, const char *name);
460 YAZ_EXPORT data1_maptab *data1_read_maptab(data1_handle dh, const char *file);
461 YAZ_EXPORT data1_node *data1_map_record(data1_handle dh, data1_node *n,
462                                         data1_maptab *map, NMEM m);
463 YAZ_EXPORT data1_marctab *data1_read_marctab (data1_handle dh,
464                                               const char *file);
465 YAZ_EXPORT char *data1_nodetomarc(data1_handle dh, data1_marctab *p,
466                                   data1_node *n, int selected, int *len);
467 YAZ_EXPORT char *data1_nodetoidsgml(data1_handle dh, data1_node *n,
468                                     int select, int *len);
469 YAZ_EXPORT Z_ExplainRecord *data1_nodetoexplain(data1_handle dh,
470                                                 data1_node *n, int select,
471                                                 ODR o);
472 YAZ_EXPORT Z_BriefBib *data1_nodetosummary(data1_handle dh, 
473                                            data1_node *n, int select,
474                                            ODR o);
475 YAZ_EXPORT char *data1_nodetosoif(data1_handle dh, data1_node *n, int select,
476                                   int *len);
477 YAZ_EXPORT void data1_set_tabpath(data1_handle dh, const char *path);
478 YAZ_EXPORT void data1_set_tabroot (data1_handle dp, const char *p);
479 YAZ_EXPORT const char *data1_get_tabpath(data1_handle dh);
480 YAZ_EXPORT const char *data1_get_tabroot(data1_handle dh);
481
482 YAZ_EXPORT WRBUF data1_get_wrbuf (data1_handle dp);
483 YAZ_EXPORT char **data1_get_read_buf (data1_handle dp, int **lenp);
484 YAZ_EXPORT char **data1_get_map_buf (data1_handle dp, int **lenp);
485 YAZ_EXPORT data1_absyn_cache *data1_absyn_cache_get (data1_handle dh);
486 YAZ_EXPORT data1_attset_cache *data1_attset_cache_get (data1_handle dh);
487 YAZ_EXPORT NMEM data1_nmem_get (data1_handle dh);
488 YAZ_EXPORT void data1_pr_tree (data1_handle dh, data1_node *n, FILE *out);
489 YAZ_EXPORT char *data1_insert_string (data1_handle dh, data1_node *res,
490                                       NMEM m, const char *str);
491 YAZ_EXPORT char *data1_insert_string_n (data1_handle dh, data1_node *res,
492                                         NMEM m, const char *str, size_t len);
493 YAZ_EXPORT data1_node *data1_read_sgml (data1_handle dh, NMEM m,
494                                         const char *buf);
495 YAZ_EXPORT data1_node *data1_read_xml (data1_handle dh,
496                                        int (*rf)(void *, char *, size_t),
497                                        void *fh, NMEM m);
498 YAZ_EXPORT void data1_absyn_trav (data1_handle dh, void *handle,
499                                   void (*fh)(data1_handle dh,
500                                              void *h, data1_absyn *a));
501
502 YAZ_EXPORT data1_attset *data1_attset_search_id (data1_handle dh, int id);
503
504 YAZ_EXPORT char *data1_getNodeValue(data1_node* node, char* pTagPath);
505 YAZ_EXPORT data1_node *data1_LookupNode(data1_node* node, char* pTagPath);
506 YAZ_EXPORT int data1_CountOccurences(data1_node* node, char* pTagPath);
507
508 YAZ_EXPORT FILE *data1_path_fopen (data1_handle dh, const char *file,
509                                    const char *mode);
510
511 /* obsolete functions ... */
512
513 YAZ_EXPORT data1_node *data1_mk_node (data1_handle dh, NMEM m);
514 YAZ_EXPORT data1_node *data1_insert_taggeddata (data1_handle dh,
515                                                 data1_node *root,
516                                                 data1_node *at,
517                                                 const char *tagname, NMEM m);
518 YAZ_EXPORT data1_node *data1_mk_node_type (data1_handle dh, NMEM m, int type);
519 YAZ_EXPORT data1_node *data1_add_taggeddata (data1_handle dh, data1_node *root,
520                                              data1_node *at,
521                                              const char *tagname,
522                                              NMEM m);
523
524 YAZ_EXPORT data1_node *data1_get_root_tag (data1_handle dh, data1_node *n);
525
526 YAZ_EXPORT int data1_iconv (data1_handle dh, NMEM m, data1_node *n,
527                             const char *tocode, 
528                             const char *fromcode);
529
530 YAZ_EXPORT const char *data1_get_encoding (data1_handle dh, data1_node *n);
531
532 YAZ_EXPORT int data1_is_xmlmode(data1_handle dh);
533
534 YAZ_EXPORT const char *data1_systag_lookup(data1_absyn *absyn, const char *tag,
535                                            const char *default_value);
536
537 YAZ_EXPORT void data1_concat_text(data1_handle dh, NMEM m, data1_node *n);
538
539 YAZ_EXPORT void data1_absyn_destroy(data1_handle dh);
540
541 YAZ_END_CDECL
542
543 #endif