Add z_Term_create for creating Z_Term things
[yaz-moved-to-github.git] / src / pquery.c
1 /* This file is part of the YAZ toolkit.
2  * Copyright (C) 1995-2011 Index Data
3  * See the file LICENSE for details.
4  */
5 /**
6  * \file pquery.c
7  * \brief Implements PQF parsing
8  */
9 #if HAVE_CONFIG_H
10 #include <config.h>
11 #endif
12
13 #include <stdio.h>
14 #include <string.h>
15 #include <stdlib.h>
16
17 #include <yaz/proto.h>
18 #include <yaz/oid_db.h>
19 #include <yaz/pquery.h>
20
21 struct yaz_pqf_parser {
22     const char *query_buf;
23     const char *query_ptr;
24     const char *lex_buf;
25     size_t lex_len;
26     int query_look;
27     char *left_sep;
28     char *right_sep;
29     int escape_char;
30     int term_type;
31     int external_type;
32     int error;
33 };
34
35 static Z_RPNStructure *rpn_structure(struct yaz_pqf_parser *li, ODR o,
36                                      int num_attr, int max_attr, 
37                                      Odr_int *attr_list, char **attr_clist,
38                                      Odr_oid **attr_set);
39
40 static Odr_oid *query_oid_getvalbyname(struct yaz_pqf_parser *li, ODR o)
41 {
42     char buf[32];
43
44     if (li->lex_len >= sizeof(buf)-1)
45         return 0;
46     memcpy(buf, li->lex_buf, li->lex_len);
47     buf[li->lex_len] = '\0';
48     return yaz_string_to_oid_odr(yaz_oid_std(), CLASS_ATTSET, buf, o);
49 }
50
51 static int compare_term(struct yaz_pqf_parser *li, const char *src,
52                         size_t off)
53 {
54     size_t len=strlen(src);
55     
56     if (li->lex_len == len+off && !memcmp(li->lex_buf+off, src, len-off))
57         return 1;
58     return 0;
59 }
60
61 static int query_token(struct yaz_pqf_parser *li)
62 {
63     int sep_char = ' ';
64     const char *sep_match;
65     const char **qptr = &li->query_ptr;
66
67     while (**qptr == ' ')
68         (*qptr)++;
69     if (**qptr == '\0')
70         return 0;
71     li->lex_len = 0;
72     if ((sep_match = strchr(li->left_sep, **qptr)))
73     {
74         sep_char = li->right_sep[sep_match - li->left_sep];
75         ++(*qptr);
76     }
77     li->lex_buf = *qptr;
78    
79     if (**qptr == li->escape_char && yaz_isdigit((*qptr)[1]))
80     {
81         ++(li->lex_len);
82         ++(*qptr);
83         return 'l';
84     }
85     while (**qptr && **qptr != sep_char)
86     {
87         if (**qptr == '\\')
88         {
89             ++(li->lex_len);
90             ++(*qptr);
91         }
92         ++(li->lex_len);
93         ++(*qptr);
94     }
95     if (**qptr)
96         ++(*qptr);
97     if (sep_char == ' ' &&
98         li->lex_len >= 1 && li->lex_buf[0] == li->escape_char)
99     {
100         if (compare_term(li, "and", 1))
101             return 'a';
102         if (compare_term(li, "or", 1))
103             return 'o';
104         if (compare_term(li, "not", 1))
105             return 'n';
106         if (compare_term(li, "attr", 1))
107             return 'l';
108         if (compare_term(li, "set", 1))
109             return 's';
110         if (compare_term(li, "attrset", 1))
111             return 'r';
112         if (compare_term(li, "prox", 1))
113             return 'p';
114         if (compare_term(li, "term", 1))
115             return 'y';
116     }
117     return 't';
118 }
119
120 static int lex(struct yaz_pqf_parser *li)
121 {
122     return li->query_look = query_token(li);
123 }
124
125 int escape_string(char *out_buf, const char *in, int len)
126 {
127
128     char *out = out_buf;
129     while (--len >= 0)
130         if (*in == '\\' && len > 0)
131         {
132             --len;
133             switch (*++in)
134             {
135             case 't':
136                 *out++ = '\t';
137                 break;
138             case 'n':
139                 *out++ = '\n';
140                 break;
141             case 'r':
142                 *out++ = '\r';
143                 break;
144             case 'f':
145                 *out++ = '\f';
146                 break;
147             case 'x':
148                 if (len > 1)
149                 {
150                     char s[4];
151                     int n = 0;
152                     s[0] = *++in;
153                     s[1] = *++in;
154                     s[2] = '\0';
155                     len = len - 2;
156                     sscanf(s, "%x", &n);
157                     *out++ = n;
158                 }
159                 break;
160             case '0':
161             case '1':
162             case '2':
163             case '3':
164                 if (len > 1)
165                 {
166                     char s[4];
167                     int n = 0;
168                     s[0] = *in;
169                     s[1] = *++in;                   
170                     s[2] = *++in;
171                     s[3] = '\0';
172                     len = len - 2;
173                     sscanf(s, "%o", &n);
174                     *out++ = n;
175                 }
176                 break;
177             default:
178                 *out++ = *in;
179                 break;
180             }
181             in++;
182         }
183         else
184             *out++ = *in++;
185     return out - out_buf;
186 }
187
188 int p_query_parse_attr(struct yaz_pqf_parser *li, ODR o,
189                               int num_attr, Odr_int *attr_list,
190                               char **attr_clist, Odr_oid **attr_set)
191 {
192     const char *cp;
193     size_t i;
194
195     if (!(cp = strchr(li->lex_buf, '=')) ||
196         (size_t) (cp-li->lex_buf) > li->lex_len)
197     {
198         attr_set[num_attr] = query_oid_getvalbyname(li, o);
199         if (attr_set[num_attr] == 0)
200         {
201             li->error = YAZ_PQF_ERROR_ATTSET;
202             return 0;
203         }
204         if (!lex(li))
205         {
206             li->error = YAZ_PQF_ERROR_MISSING;
207             return 0;
208         }
209         if (!(cp = strchr(li->lex_buf, '=')))
210         {
211             li->error = YAZ_PQF_ERROR_BADATTR;
212             return 0;
213         }
214     }
215     else 
216     {
217         if (num_attr > 0)
218             attr_set[num_attr] = attr_set[num_attr-1];
219         else
220             attr_set[num_attr] = 0;
221     }
222     if (*li->lex_buf < '0' || *li->lex_buf > '9')
223     {
224         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
225         return 0;
226     }
227     attr_list[2*num_attr] = odr_atoi(li->lex_buf);
228     cp++;
229
230     /* inspect value .. and make it a integer if it appears to be */
231     for (i = cp - li->lex_buf; i < li->lex_len; i++)
232         if (li->lex_buf[i] < '0' || li->lex_buf[i] > '9')
233         {
234             int len = li->lex_len - (cp - li->lex_buf);
235             attr_list[2*num_attr+1] = 0;
236             attr_clist[num_attr] = (char *) odr_malloc(o, len+1);
237             len = escape_string(attr_clist[num_attr], cp, len);
238             attr_clist[num_attr][len] = '\0';
239             return 1;
240         }
241     attr_list[2*num_attr+1] = odr_atoi(cp);
242     attr_clist[num_attr] = 0;
243     return 1;
244 }
245
246 Z_AttributeList *get_attributeList(ODR o,
247         int num_attr, Odr_int *attr_list,
248         char **attr_clist, Odr_oid **attr_set)
249 {
250     int i, k = 0;
251     Odr_int *attr_tmp;
252     Z_AttributeElement **elements;
253     Z_AttributeList *attributes= (Z_AttributeList *) odr_malloc(o, sizeof(*attributes));
254     attributes->num_attributes = num_attr;
255     if (!num_attr) {
256         attributes->attributes = (Z_AttributeElement**)odr_nullval();
257         return attributes;
258     }
259     elements = (Z_AttributeElement**) odr_malloc (o, num_attr * sizeof(*elements));
260
261     attr_tmp = (Odr_int *)odr_malloc(o, num_attr * 2 * sizeof(*attr_tmp));
262     memcpy(attr_tmp, attr_list, num_attr * 2 * sizeof(*attr_tmp));
263     for (i = num_attr; --i >= 0; )
264     {
265         int j;
266         for (j = i+1; j<num_attr; j++)
267             if (attr_tmp[2*j] == attr_tmp[2*i])
268                 break;
269         if (j < num_attr)
270             continue;
271         elements[k] =
272             (Z_AttributeElement*)odr_malloc(o,sizeof(**elements));
273         elements[k]->attributeType = &attr_tmp[2*i];
274         elements[k]->attributeSet = attr_set[i];
275
276         if (attr_clist[i])
277         {
278             elements[k]->which = Z_AttributeValue_complex;
279             elements[k]->value.complex = (Z_ComplexAttribute *)
280                 odr_malloc(o, sizeof(Z_ComplexAttribute));
281             elements[k]->value.complex->num_list = 1;
282             elements[k]->value.complex->list =
283                 (Z_StringOrNumeric **)
284                 odr_malloc(o, 1 * sizeof(Z_StringOrNumeric *));
285             elements[k]->value.complex->list[0] =
286                 (Z_StringOrNumeric *)
287                 odr_malloc(o, sizeof(Z_StringOrNumeric));
288             elements[k]->value.complex->list[0]->which =
289                 Z_StringOrNumeric_string;
290             elements[k]->value.complex->list[0]->u.string =
291                 attr_clist[i];
292             elements[k]->value.complex->semanticAction = 0;
293             elements[k]->value.complex->num_semanticAction = 0;
294         }
295         else
296         {
297             elements[k]->which = Z_AttributeValue_numeric;
298             elements[k]->value.numeric = &attr_tmp[2*i+1];
299         }
300         k++;
301     }
302     attributes->num_attributes = k;
303     attributes->attributes = elements;
304     return attributes;
305 }
306
307 Z_Term *z_Term_create(ODR o, int term_type, const char *buf, size_t len)
308 {
309     Z_Term *term = (Z_Term *)odr_malloc(o, sizeof(*term));
310     Odr_oct *term_octet = (Odr_oct *)odr_malloc(o, sizeof(*term_octet));
311     term_octet->buf = (unsigned char *)odr_malloc(o, 1 + len);
312     memcpy(term_octet->buf, buf, len);
313     term_octet->size = term_octet->len = len;
314     term_octet->buf[term_octet->size] = 0;  /* null terminate */
315     
316     switch (term_type)
317     {
318     case Z_Term_general:
319         term->which = Z_Term_general;
320         term->u.general = term_octet;
321         break;
322     case Z_Term_characterString:
323         term->which = Z_Term_characterString;
324         term->u.characterString = (char*) term_octet->buf; 
325         /* null terminated above */
326         break;
327     case Z_Term_numeric:
328         term->which = Z_Term_numeric;
329         term->u.numeric = odr_intdup(o, odr_atoi((const char*) term_octet->buf));
330         break;
331     case Z_Term_null:
332         term->which = Z_Term_null;
333         term->u.null = odr_nullval();
334         break;
335     case Z_Term_external:
336         term->which = Z_Term_external;
337         term->u.external = 0;
338         break;
339     default:
340         term->which = Z_Term_null;
341         term->u.null = odr_nullval();
342         break;
343     }
344     return term;
345 }
346
347 static Z_AttributesPlusTerm *rpn_term_attributes(
348     struct yaz_pqf_parser *li, ODR o, Z_AttributeList *attributes)
349 {
350     char *es_str = odr_malloc(o, li->lex_len+1);
351     int es_len = escape_string(es_str, li->lex_buf, li->lex_len);
352     Z_Term *term = z_Term_create(o, li->term_type, es_str, es_len);
353     Z_AttributesPlusTerm *zapt = (Z_AttributesPlusTerm *)
354         odr_malloc(o, sizeof(*zapt));
355
356     zapt->term = term;
357     zapt->attributes = attributes;
358     return zapt;
359 }
360
361 static Z_AttributesPlusTerm *rpn_term(struct yaz_pqf_parser *li, ODR o,
362                                       int num_attr, Odr_int *attr_list,
363                                       char **attr_clist, Odr_oid **attr_set)
364 {
365     return rpn_term_attributes(li, o, get_attributeList(o, num_attr, attr_list, attr_clist, attr_set));
366 }
367
368 static Z_Operand *rpn_simple(struct yaz_pqf_parser *li, ODR o,
369                              int num_attr, Odr_int *attr_list,
370                              char **attr_clist,
371                              Odr_oid **attr_set)
372 {
373     Z_Operand *zo;
374
375     zo = (Z_Operand *)odr_malloc(o, sizeof(*zo));
376     switch (li->query_look)
377     {
378     case 't':
379         zo->which = Z_Operand_APT;
380         if (!(zo->u.attributesPlusTerm =
381               rpn_term(li, o, num_attr, attr_list, attr_clist, attr_set)))
382             return 0;
383         lex(li);
384         break;
385     case 's':
386         lex(li);
387         if (!li->query_look)
388         {
389             li->error = YAZ_PQF_ERROR_MISSING;
390             return 0;
391         }
392         zo->which = Z_Operand_resultSetId;
393         zo->u.resultSetId = (char *)odr_malloc(o, li->lex_len+1);
394         memcpy(zo->u.resultSetId, li->lex_buf, li->lex_len);
395         zo->u.resultSetId[li->lex_len] = '\0';
396         lex(li);
397         break;
398     default:
399         /* we're only called if one of the above types are seens so
400            this shouldn't happen */
401         li->error = YAZ_PQF_ERROR_INTERNAL;
402         return 0;
403     }
404     return zo;
405 }
406
407 static Z_ProximityOperator *rpn_proximity(struct yaz_pqf_parser *li, ODR o)
408 {
409     Z_ProximityOperator *p = (Z_ProximityOperator *)odr_malloc(o, sizeof(*p));
410
411     if (!lex(li))
412     {
413         li->error = YAZ_PQF_ERROR_MISSING;
414         return NULL;
415     }
416     if (*li->lex_buf == '1')
417         p->exclusion = odr_booldup(o, 1);
418     else if (*li->lex_buf == '0')
419         p->exclusion = odr_booldup(o, 0);
420     else if (*li->lex_buf == 'v' || *li->lex_buf == 'n')
421         p->exclusion = NULL;
422     else
423     {
424         li->error = YAZ_PQF_ERROR_PROXIMITY;
425         return NULL;
426     }
427
428     if (!lex(li))
429     {
430         li->error = YAZ_PQF_ERROR_MISSING;
431         return NULL;
432     }
433     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
434         p->distance = odr_intdup(o, odr_atoi(li->lex_buf));
435     else
436     {
437         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
438         return NULL;
439     }
440
441     if (!lex(li))
442     {
443         li->error = YAZ_PQF_ERROR_MISSING;
444         return NULL;
445     }
446     if (*li->lex_buf == '1')
447         p->ordered = odr_booldup(o, 1);
448     else if (*li->lex_buf == '0')
449         p->ordered = odr_booldup(o, 0);
450     else
451     {
452         li->error = YAZ_PQF_ERROR_PROXIMITY;
453         return NULL;
454     }
455     
456     if (!lex (li))
457     {
458         li->error = YAZ_PQF_ERROR_MISSING;
459         return NULL;
460     }
461     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
462         p->relationType = odr_intdup(o, odr_atoi(li->lex_buf));
463     else
464     {
465         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
466         return NULL;
467     }
468
469     if (!lex(li))
470     {
471         li->error = YAZ_PQF_ERROR_MISSING;
472         return NULL;
473     }
474     if (*li->lex_buf == 'k')
475         p->which = Z_ProximityOperator_known;
476     else if (*li->lex_buf == 'p')
477         p->which = Z_ProximityOperator_private;
478     else
479         p->which = atoi(li->lex_buf);
480
481     if (p->which != Z_ProximityOperator_known
482         && p->which != Z_ProximityOperator_private)
483     {
484         li->error = YAZ_PQF_ERROR_PROXIMITY;
485         return NULL;
486     }
487
488     if (!lex(li))
489     {
490         li->error = YAZ_PQF_ERROR_MISSING;
491         return NULL;
492     }
493     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
494         p->u.known = odr_intdup(o, odr_atoi(li->lex_buf));
495     else
496     {
497         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
498         return NULL;
499     }
500     return p;
501 }
502
503 static Z_Complex *rpn_complex(struct yaz_pqf_parser *li, ODR o,
504                               int num_attr, int max_attr, 
505                               Odr_int *attr_list, char **attr_clist,
506                               Odr_oid **attr_set)
507 {
508     Z_Complex *zc;
509     Z_Operator *zo;
510
511     zc = (Z_Complex *)odr_malloc(o, sizeof(*zc));
512     zo = (Z_Operator *)odr_malloc(o, sizeof(*zo));
513     zc->roperator = zo;
514     switch (li->query_look)
515     {
516     case 'a':
517         zo->which = Z_Operator_and;
518         zo->u.op_and = odr_nullval();
519         break;
520     case 'o':
521         zo->which = Z_Operator_or;
522         zo->u.op_or = odr_nullval();
523         break;
524     case 'n':
525         zo->which = Z_Operator_and_not;
526         zo->u.and_not = odr_nullval();
527         break;
528     case 'p':
529         zo->which = Z_Operator_prox;
530         zo->u.prox = rpn_proximity(li, o);
531         if (!zo->u.prox)
532             return NULL;
533         break;
534     default:
535         /* we're only called if one of the above types are seens so
536            this shouldn't happen */
537         li->error = YAZ_PQF_ERROR_INTERNAL;
538         return NULL;
539     }
540     lex(li);
541     if (!(zc->s1 =
542           rpn_structure(li, o, num_attr, max_attr, attr_list,
543                         attr_clist, attr_set)))
544         return NULL;
545     if (!(zc->s2 =
546           rpn_structure(li, o, num_attr, max_attr, attr_list,
547                         attr_clist, attr_set)))
548         return NULL;
549     return zc;
550 }
551
552 static void rpn_term_type(struct yaz_pqf_parser *li)
553 {
554     if (!li->query_look)
555         return ;
556     if (compare_term(li, "general", 0))
557         li->term_type = Z_Term_general;
558     else if (compare_term(li, "numeric", 0))
559         li->term_type = Z_Term_numeric;
560     else if (compare_term(li, "string", 0))
561         li->term_type = Z_Term_characterString;
562     else if (compare_term(li, "oid", 0))
563         li->term_type = Z_Term_oid;
564     else if (compare_term(li, "datetime", 0))
565         li->term_type = Z_Term_dateTime;
566     else if (compare_term(li, "null", 0))
567         li->term_type = Z_Term_null;
568 #if 0
569     else if (compare_term(li, "range", 0))
570     {
571         /* prepare for external: range search .. */
572         li->term_type = Z_Term_external;
573         li->external_type = VAL_MULTISRCH2;
574     }
575 #endif
576     lex(li);
577 }
578                            
579 static Z_RPNStructure *rpn_structure(struct yaz_pqf_parser *li, ODR o,
580                                      int num_attr, int max_attr, 
581                                      Odr_int *attr_list,
582                                      char **attr_clist,
583                                      Odr_oid **attr_set)
584 {
585     Z_RPNStructure *sz;
586
587     sz = (Z_RPNStructure *)odr_malloc(o, sizeof(*sz));
588     switch (li->query_look)
589     {
590     case 'a':
591     case 'o':
592     case 'n':
593     case 'p':
594         sz->which = Z_RPNStructure_complex;
595         if (!(sz->u.complex =
596               rpn_complex(li, o, num_attr, max_attr, attr_list,
597                           attr_clist, attr_set)))
598             return NULL;
599         break;
600     case 't':
601     case 's':
602         sz->which = Z_RPNStructure_simple;
603         if (!(sz->u.simple =
604               rpn_simple(li, o, num_attr, attr_list,
605                          attr_clist, attr_set)))
606             return NULL;
607         break;
608     case 'l':
609         lex(li);
610         if (!li->query_look)
611         {
612             li->error = YAZ_PQF_ERROR_MISSING;
613             return 0;
614         }
615         if (num_attr >= max_attr)
616         {
617             li->error = YAZ_PQF_ERROR_TOOMANY;
618             return 0;
619         }
620         if (!p_query_parse_attr(li, o, num_attr, attr_list,
621                                 attr_clist, attr_set))
622             return 0;
623         num_attr++;
624         lex(li);
625         return
626             rpn_structure(li, o, num_attr, max_attr, attr_list,
627                           attr_clist,  attr_set);
628     case 'y':
629         lex(li);
630         rpn_term_type(li);
631         return
632             rpn_structure(li, o, num_attr, max_attr, attr_list,
633                           attr_clist, attr_set);
634     case 0:                /* operator/operand expected! */
635         li->error = YAZ_PQF_ERROR_MISSING;
636         return 0;
637     }
638     return sz;
639 }
640
641 static Z_RPNQuery *p_query_rpn_mk(ODR o, struct yaz_pqf_parser *li)
642 {
643     Z_RPNQuery *zq;
644     Odr_int attr_array[1024];
645     char *attr_clist[512];
646     Odr_oid *attr_set[512];
647     Odr_oid *top_set = 0;
648
649     zq = (Z_RPNQuery *)odr_malloc(o, sizeof(*zq));
650     lex(li);
651     if (li->query_look == 'r')
652     {
653         lex(li);
654         top_set = query_oid_getvalbyname(li, o);
655         if (!top_set)
656         {
657             li->error = YAZ_PQF_ERROR_ATTSET;
658             return NULL;
659         }
660         lex(li);
661     }
662     if (!top_set)
663     {
664         top_set = odr_oiddup(o, yaz_oid_attset_bib_1);
665     }
666
667     zq->attributeSetId = top_set;
668
669     if (!zq->attributeSetId)
670     {
671         li->error = YAZ_PQF_ERROR_ATTSET;
672         return 0;
673     }
674
675     if (!(zq->RPNStructure = rpn_structure(li, o, 0, 512,
676                                            attr_array, attr_clist, attr_set)))
677         return 0;
678     if (li->query_look)
679     {
680         li->error = YAZ_PQF_ERROR_EXTRA;
681         return 0;
682     }
683     return zq;
684 }
685
686 Z_RPNQuery *p_query_rpn(ODR o, const char *qbuf)
687 {
688     struct yaz_pqf_parser li;
689
690     li.error = 0;
691     li.left_sep = "{\"";
692     li.right_sep = "}\"";
693     li.escape_char = '@';
694     li.term_type = Z_Term_general;
695     li.query_buf = li.query_ptr = qbuf;
696     li.lex_buf = 0;
697     return p_query_rpn_mk(o, &li);
698 }
699
700
701 static Z_AttributeList *p_query_scan_attributes_mk(struct yaz_pqf_parser *li,
702                                              ODR o,
703                                              Odr_oid **attributeSetP)
704 {
705     Odr_int attr_list[1024];
706     char *attr_clist[512];
707     Odr_oid *attr_set[512];
708     int num_attr = 0;
709     int max_attr = 512;
710     Odr_oid *top_set = 0;
711
712     lex(li);
713     if (li->query_look == 'r')
714     {
715         lex(li);
716         top_set = query_oid_getvalbyname(li, o);
717         if (!top_set)
718         {
719             li->error = YAZ_PQF_ERROR_ATTSET;
720             return NULL;
721         }
722         lex(li);
723     }
724     if (!top_set)
725     {
726         top_set = odr_oiddup(o, yaz_oid_attset_bib_1);
727     }
728     *attributeSetP = top_set;
729
730     while (1)
731     {
732         if (li->query_look == 'l')
733         {
734             lex(li);
735             if (!li->query_look)
736             {
737                 li->error = YAZ_PQF_ERROR_MISSING;
738                 return 0;
739             }
740             if (num_attr >= max_attr)
741             {
742                 li->error = YAZ_PQF_ERROR_TOOMANY;
743                 return 0;
744             }
745             if (!p_query_parse_attr(li, o, num_attr, attr_list,
746                                     attr_clist, attr_set))
747                 return 0;
748             num_attr++;
749             lex(li);
750         }
751         else if (li->query_look == 'y')
752         {
753             lex(li);
754             rpn_term_type(li);
755         }
756         else
757             break;
758     }
759     return get_attributeList(o, num_attr, attr_list, attr_clist, attr_set);
760 }
761
762 static Z_AttributesPlusTerm *p_query_scan_mk(struct yaz_pqf_parser *li,
763                                                  ODR o,
764                                                  Odr_oid **attributeSetP)
765 {
766     Z_AttributeList *attr_list = p_query_scan_attributes_mk(li, o, attributeSetP);
767     Z_AttributesPlusTerm *apt;
768
769     if (!li->query_look)
770     {
771         li->error = YAZ_PQF_ERROR_MISSING;
772         return 0;
773     }
774     apt = rpn_term_attributes(li, o, attr_list);
775
776     lex(li);
777
778     if (li->query_look != 0)
779     {
780         li->error = YAZ_PQF_ERROR_EXTRA;
781         return 0;
782     }
783     return apt;
784 }
785
786 YAZ_PQF_Parser yaz_pqf_create(void)
787 {
788     YAZ_PQF_Parser p = (YAZ_PQF_Parser) xmalloc(sizeof(*p));
789
790     p->error = 0;
791     p->left_sep = "{\"";
792     p->right_sep = "}\"";
793     p->escape_char = '@';
794     p->term_type = Z_Term_general;
795
796     return p;
797 }
798
799 void yaz_pqf_destroy(YAZ_PQF_Parser p)
800 {
801     xfree(p);
802 }
803
804 Z_RPNQuery *yaz_pqf_parse(YAZ_PQF_Parser p, ODR o, const char *qbuf)
805 {
806     if (!p)
807         return 0;
808     p->query_buf = p->query_ptr = qbuf;
809     p->lex_buf = 0;
810     return p_query_rpn_mk(o, p);
811 }
812
813 Z_AttributesPlusTerm *yaz_pqf_scan(YAZ_PQF_Parser p, ODR o,
814                                    Odr_oid **attributeSetP,
815                                    const char *qbuf)
816 {
817     if (!p)
818         return 0;
819     p->query_buf = p->query_ptr = qbuf;
820     p->lex_buf = 0;
821     return p_query_scan_mk(p, o, attributeSetP);
822 }
823
824 Z_AttributeList *yaz_pqf_scan_attribute_list(YAZ_PQF_Parser p, ODR o,
825                                    Odr_oid **attributeSetP,
826                                    const char *qbuf)
827 {
828     if (!p)
829         return 0;
830     p->query_buf = p->query_ptr = qbuf;
831     p->lex_buf = 0;
832     return p_query_scan_attributes_mk(p, o, attributeSetP);
833 }
834
835 static Z_FacetField* parse_facet(ODR odr, const char *facet, int length)
836 {
837     YAZ_PQF_Parser pqf_parser = yaz_pqf_create();
838     char *buffer = odr_strdupn(odr, facet, length);
839     Odr_oid *attributeSetId;
840     Z_FacetField *facet_field = 0;
841     Z_AttributeList *attribute_list =
842         yaz_pqf_scan_attribute_list(pqf_parser, odr, &attributeSetId, buffer);
843     
844     if (attribute_list)
845     {
846         facet_field = odr_malloc(odr, sizeof(*facet_field));
847         facet_field->attributes = attribute_list;
848         facet_field->num_terms = 0;
849         facet_field->terms = 0;
850     }
851     yaz_pqf_destroy(pqf_parser);
852     return facet_field;
853 }
854
855 #define FACET_DElIMITER ','
856
857 static int scan_facet_argument(const char *arg) {
858     int index;
859     int length = strlen(arg);
860     int count = 1;
861     for (index = 0; index < length; index++) {
862         if (arg[index] == FACET_DElIMITER)
863             count++;
864     }
865     return count;
866 }
867
868 /**
869  * yax_pdg_parse_facet_list: Parses a comma-separated list of AttributeList(s) into a FacetList.
870  * It does not handle the optional facet term(s).
871  *
872  */
873 Z_FacetList *yaz_pqf_parse_facet_list(ODR odr, const char *facet) {
874     Z_FacetList *facet_list = 0;
875     Z_FacetField  **elements;
876     int index = 0;
877     int num_elements = scan_facet_argument(facet);
878     if (num_elements == 0)
879         return facet_list;
880     facet_list = odr_malloc(odr, sizeof(*facet_list));
881     facet_list->num = num_elements;
882     elements = odr_malloc(odr, num_elements * sizeof(*elements));
883     facet_list->elements = elements;
884     for (index = 0; index < num_elements;) {
885         const char *pos = strchr(facet, FACET_DElIMITER);
886         if (pos == 0)
887             pos = facet + strlen(facet);
888         elements[index] = parse_facet(odr, (const char *) facet, (pos - facet));
889         if (elements[index]) {
890             index++;
891         }
892         else {
893             num_elements--;
894             facet_list->num = num_elements;
895         }
896         facet = pos + 1;
897     }
898     return facet_list;
899 }
900
901
902
903 int yaz_pqf_error(YAZ_PQF_Parser p, const char **msg, size_t *off)
904 {
905     switch (p->error)
906     {
907     case YAZ_PQF_ERROR_NONE:
908         *msg = "no error"; break;
909     case YAZ_PQF_ERROR_EXTRA:
910         *msg = "extra token"; break;
911     case YAZ_PQF_ERROR_MISSING:
912         *msg = "missing token"; break;
913     case YAZ_PQF_ERROR_ATTSET:
914         *msg = "unknown attribute set"; break;
915     case YAZ_PQF_ERROR_TOOMANY:
916         *msg = "too many attributes"; break;
917     case YAZ_PQF_ERROR_BADATTR:
918         *msg = "bad attribute specification"; break;
919     case YAZ_PQF_ERROR_INTERNAL:
920         *msg = "internal error"; break;
921     case YAZ_PQF_ERROR_PROXIMITY:
922         *msg = "proximity error"; break;
923     case YAZ_PQF_ERROR_BAD_INTEGER:
924         *msg = "bad integer"; break;
925     default:
926         *msg = "unknown error"; break;
927     }
928     *off = p->query_ptr - p->query_buf;
929     return p->error;
930 }
931 /*
932  * Local variables:
933  * c-basic-offset: 4
934  * c-file-style: "Stroustrup"
935  * indent-tabs-mode: nil
936  * End:
937  * vim: shiftwidth=4 tabstop=8 expandtab
938  */
939