Member and_not in Z_Operator is kept for backwards compatibility.
[yaz-moved-to-github.git] / ccl / cclqfile.c
1 /*
2  * Copyright (c) 1995, the EUROPAGATE consortium (see below).
3  *
4  * The EUROPAGATE consortium members are:
5  *
6  *    University College Dublin
7  *    Danmarks Teknologiske Videnscenter
8  *    An Chomhairle Leabharlanna
9  *    Consejo Superior de Investigaciones Cientificas
10  *
11  * Permission to use, copy, modify, distribute, and sell this software and
12  * its documentation, in whole or in part, for any purpose, is hereby granted,
13  * provided that:
14  *
15  * 1. This copyright and permission notice appear in all copies of the
16  * software and its documentation. Notices of copyright or attribution
17  * which appear at the beginning of any file must remain unchanged.
18  *
19  * 2. The names of EUROPAGATE or the project partners may not be used to
20  * endorse or promote products derived from this software without specific
21  * prior written permission.
22  *
23  * 3. Users of this software (implementors and gateway operators) agree to
24  * inform the EUROPAGATE consortium of their use of the software. This
25  * information will be used to evaluate the EUROPAGATE project and the
26  * software, and to plan further developments. The consortium may use
27  * the information in later publications.
28  * 
29  * 4. Users of this software agree to make their best efforts, when
30  * documenting their use of the software, to acknowledge the EUROPAGATE
31  * consortium, and the role played by the software in their work.
32  *
33  * THIS SOFTWARE IS PROVIDED "AS IS" AND WITHOUT WARRANTY OF ANY KIND,
34  * EXPRESS, IMPLIED, OR OTHERWISE, INCLUDING WITHOUT LIMITATION, ANY
35  * WARRANTY OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.
36  * IN NO EVENT SHALL THE EUROPAGATE CONSORTIUM OR ITS MEMBERS BE LIABLE
37  * FOR ANY SPECIAL, INCIDENTAL, INDIRECT OR CONSEQUENTIAL DAMAGES OF
38  * ANY KIND, OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA
39  * OR PROFITS, WHETHER OR NOT ADVISED OF THE POSSIBILITY OF DAMAGE, AND
40  * ON ANY THEORY OF LIABILITY, ARISING OUT OF OR IN CONNECTION WITH THE
41  * USE OR PERFORMANCE OF THIS SOFTWARE.
42  *
43  */
44 /* CCL qualifiers
45  * Europagate, 1995
46  *
47  * $Log: cclqfile.c,v $
48  * Revision 1.9  2001-03-07 13:24:40  adam
49  * Member and_not in Z_Operator is kept for backwards compatibility.
50  * Added support for definition of CCL operators in field spec file.
51  *
52  * Revision 1.8  2001/02/21 13:46:53  adam
53  * C++ fixes.
54  *
55  * Revision 1.7  2001/01/24 11:55:31  adam
56  * Fixed nasty bug introduced by previous commit (attribute sets not
57  * properly allocated).
58  *
59  * Revision 1.6  2000/11/16 09:58:02  adam
60  * Implemented local AttributeSet setting for CCL field maps.
61  *
62  * Revision 1.5  2000/10/17 19:50:28  adam
63  * Implemented and-list and or-list for CCL module.
64  *
65  * Revision 1.4  2000/01/31 13:15:21  adam
66  * Removed uses of assert(3). Cleanup of ODR. CCL parser update so
67  * that some characters are not surrounded by spaces in resulting term.
68  * ILL-code updates.
69  *
70  * Revision 1.3  1999/11/30 13:47:11  adam
71  * Improved installation. Moved header files to include/yaz.
72  *
73  * Revision 1.2  1997/04/30 08:52:06  quinn
74  * Null
75  *
76  * Revision 1.1  1996/10/11  15:00:25  adam
77  * CCL parser from Europagate Email gateway 1.0.
78  *
79  * Revision 1.3  1995/05/16  09:39:26  adam
80  * LICENSE.
81  *
82  * Revision 1.2  1995/05/11  14:03:56  adam
83  * Changes in the reading of qualifier(s). New function: ccl_qual_fitem.
84  * New variable ccl_case_sensitive, which controls whether reserved
85  * words and field names are case sensitive or not.
86  *
87  * Revision 1.1  1995/04/17  09:31:45  adam
88  * Improved handling of qualifiers. Aliases or reserved words.
89  *
90  */
91
92 #include <stdio.h>
93 #include <stdlib.h>
94 #include <string.h>
95
96 #include <yaz/ccl.h>
97
98 void ccl_qual_field (CCL_bibset bibset, const char *cp, const char *qual_name)
99 {
100     char qual_spec[128];
101     int no_scan;
102     int pair[256];
103     char *attsets[128];
104     int pair_no = 0;
105
106     while (pair_no < 128)
107     {
108         char *qual_value, *qual_type;
109         char *split, *setp;
110         
111         if (sscanf (cp, "%s%n", qual_spec, &no_scan) != 1)
112             break;
113
114         if (!(split = strchr (qual_spec, '=')))
115             break;
116         cp += no_scan;
117         
118         *split++ = '\0';
119
120         setp = strchr (qual_spec, ',');
121         if (setp)
122         {
123             *setp++ = '\0';
124             qual_type = setp;
125         }
126         else
127             qual_type = qual_spec;
128         while (pair_no < 128)
129         {
130             int type, value;
131
132             qual_value = split;
133             if ((split = strchr (qual_value, ',')))
134                 *split++ = '\0';
135             value = atoi (qual_value);
136             switch (qual_type[0])
137             {
138             case 'u':
139             case 'U':
140                 type = CCL_BIB1_USE;
141                 break;
142             case 'r':
143             case 'R':
144                 type = CCL_BIB1_REL;
145                 if (!ccl_stricmp (qual_value, "o"))
146                     value = CCL_BIB1_REL_ORDER;
147                 break;                
148             case 'p':
149             case 'P':
150                 type = CCL_BIB1_POS;
151                 break;
152             case 's':
153             case 'S':
154                 type = CCL_BIB1_STR;
155                 if (!ccl_stricmp (qual_value, "pw"))
156                     value = CCL_BIB1_STR_WP;
157                 if (!ccl_stricmp (qual_value, "al"))
158                     value = CCL_BIB1_STR_AND_LIST;
159                 if (!ccl_stricmp (qual_value, "ol"))
160                     value = CCL_BIB1_STR_OR_LIST;
161                 break;                
162             case 't':
163             case 'T':
164                 type = CCL_BIB1_TRU;
165                 if (!ccl_stricmp (qual_value, "l"))
166                     value = CCL_BIB1_TRU_CAN_LEFT;
167                 else if (!ccl_stricmp (qual_value, "r"))
168                     value = CCL_BIB1_TRU_CAN_RIGHT;
169                 else if (!ccl_stricmp (qual_value, "b"))
170                     value = CCL_BIB1_TRU_CAN_BOTH;
171                 else if (!ccl_stricmp (qual_value, "n"))
172                     value = CCL_BIB1_TRU_CAN_NONE;
173                 break;                
174             case 'c':
175             case 'C':
176                 type = CCL_BIB1_COM;
177                 break;
178             default:
179                 type = atoi (qual_type);
180             }
181             pair[pair_no*2] = type;
182             pair[pair_no*2+1] = value;
183             if (setp)
184             {
185                 attsets[pair_no] = (char*) malloc (strlen(qual_spec)+1);
186                 strcpy (attsets[pair_no], qual_spec);
187             }
188             else
189                 attsets[pair_no] = 0;
190             pair_no++;
191             if (!split)
192                 break;
193         }
194     }
195     ccl_qual_add_set (bibset, qual_name, pair_no, pair, attsets);
196 }
197
198 void ccl_qual_fitem (CCL_bibset bibset, const char *cp, const char *qual_name)
199 {
200     if (*qual_name == '@')
201         ccl_qual_add_special(bibset, qual_name+1, cp);
202     else
203         ccl_qual_field(bibset, cp, qual_name);
204 }
205
206 /*
207  * ccl_qual_file: Read bibset definition from file.
208  * bibset:  Bibset
209  * inf:     FILE pointer.
210  *
211  * Each line format is:
212  *  <name> <t>=<v> <t>=<v> ....
213  *  Where <name> is name of qualifier;
214  *  <t>=<v> is a attribute definition pair where <t> is one of: 
215  *     u(use), r(relation), p(position), t(truncation), c(completeness) 
216  *     or plain integer.
217  *  <v> is an integer or special pseudo-value.
218  */
219 void ccl_qual_file (CCL_bibset bibset, FILE *inf)
220 {
221     char line[256];
222     char *cp, *cp1;
223     char qual_name[128];
224     int  no_scan;
225
226     while (fgets (line, 255, inf))
227     {
228         cp = line;
229         if (*cp == '#')
230             continue;        /* ignore lines starting with # */
231         if (sscanf (cp, "%s%n", qual_name, &no_scan) != 1)
232             continue;        /* also ignore empty lines */
233         cp += no_scan;
234         cp1 = strchr(cp, '#');
235         if (cp1)
236             *cp1 = '\0';
237         ccl_qual_fitem (bibset, cp, qual_name);
238     }
239 }
240
241 int ccl_qual_fname (CCL_bibset bibset, const char *fname)
242 {
243     FILE *inf;
244     inf = fopen (fname, "r");
245     if (!inf)
246         return -1;
247     ccl_qual_file (bibset, inf);
248     return 0;
249 }