8db6ac62d5c6d3b7d707a505fa71ef8f45b387b1
[yaz-moved-to-github.git] / src / pquery.c
1 /* This file is part of the YAZ toolkit.
2  * Copyright (C) 1995-2011 Index Data
3  * See the file LICENSE for details.
4  */
5 /**
6  * \file pquery.c
7  * \brief Implements PQF parsing
8  */
9 #if HAVE_CONFIG_H
10 #include <config.h>
11 #endif
12
13 #include <stdio.h>
14 #include <string.h>
15 #include <stdlib.h>
16
17 #include <yaz/proto.h>
18 #include <yaz/oid_db.h>
19 #include <yaz/pquery.h>
20
21 struct yaz_pqf_parser {
22     const char *query_buf;
23     const char *query_ptr;
24     const char *lex_buf;
25     size_t lex_len;
26     int query_look;
27     char *left_sep;
28     char *right_sep;
29     int escape_char;
30     int term_type;
31     int external_type;
32     int error;
33 };
34
35 static Z_RPNStructure *rpn_structure(struct yaz_pqf_parser *li, ODR o,
36                                      int num_attr, int max_attr, 
37                                      Odr_int *attr_list, char **attr_clist,
38                                      Odr_oid **attr_set);
39
40 static Odr_oid *query_oid_getvalbyname(struct yaz_pqf_parser *li, ODR o)
41 {
42     char buf[32];
43
44     if (li->lex_len >= sizeof(buf)-1)
45         return 0;
46     memcpy(buf, li->lex_buf, li->lex_len);
47     buf[li->lex_len] = '\0';
48     return yaz_string_to_oid_odr(yaz_oid_std(), CLASS_ATTSET, buf, o);
49 }
50
51 static int compare_term(struct yaz_pqf_parser *li, const char *src,
52                         size_t off)
53 {
54     size_t len=strlen(src);
55     
56     if (li->lex_len == len+off && !memcmp(li->lex_buf+off, src, len-off))
57         return 1;
58     return 0;
59 }
60
61 static int query_token(struct yaz_pqf_parser *li)
62 {
63     int sep_char = ' ';
64     const char *sep_match;
65     const char **qptr = &li->query_ptr;
66
67     while (**qptr == ' ')
68         (*qptr)++;
69     if (**qptr == '\0')
70         return 0;
71     li->lex_len = 0;
72     if ((sep_match = strchr(li->left_sep, **qptr)))
73     {
74         sep_char = li->right_sep[sep_match - li->left_sep];
75         ++(*qptr);
76     }
77     li->lex_buf = *qptr;
78    
79     if (**qptr == li->escape_char && yaz_isdigit((*qptr)[1]))
80     {
81         ++(li->lex_len);
82         ++(*qptr);
83         return 'l';
84     }
85     while (**qptr && **qptr != sep_char)
86     {
87         if (**qptr == '\\' && (*qptr)[1])
88         {
89             ++(li->lex_len);
90             ++(*qptr);
91         }
92         ++(li->lex_len);
93         ++(*qptr);
94     }
95     if (**qptr)
96         ++(*qptr);
97     if (sep_char == ' ' &&
98         li->lex_len >= 1 && li->lex_buf[0] == li->escape_char)
99     {
100         if (compare_term(li, "and", 1))
101             return 'a';
102         if (compare_term(li, "or", 1))
103             return 'o';
104         if (compare_term(li, "not", 1))
105             return 'n';
106         if (compare_term(li, "attr", 1))
107             return 'l';
108         if (compare_term(li, "set", 1))
109             return 's';
110         if (compare_term(li, "attrset", 1))
111             return 'r';
112         if (compare_term(li, "prox", 1))
113             return 'p';
114         if (compare_term(li, "term", 1))
115             return 'y';
116     }
117     return 't';
118 }
119
120 static int lex(struct yaz_pqf_parser *li)
121 {
122     return li->query_look = query_token(li);
123 }
124
125 int escape_string(char *out_buf, const char *in, int len)
126 {
127
128     char *out = out_buf;
129     while (--len >= 0)
130         if (*in == '\\' && len > 0)
131         {
132             --len;
133             switch (*++in)
134             {
135             case 't':
136                 *out++ = '\t';
137                 break;
138             case 'n':
139                 *out++ = '\n';
140                 break;
141             case 'r':
142                 *out++ = '\r';
143                 break;
144             case 'f':
145                 *out++ = '\f';
146                 break;
147             case 'x':
148                 if (len > 1)
149                 {
150                     char s[4];
151                     int n = 0;
152                     s[0] = *++in;
153                     s[1] = *++in;
154                     s[2] = '\0';
155                     len = len - 2;
156                     sscanf(s, "%x", &n);
157                     *out++ = n;
158                 }
159                 break;
160             case '0':
161             case '1':
162             case '2':
163             case '3':
164                 if (len > 1)
165                 {
166                     char s[4];
167                     int n = 0;
168                     s[0] = *in;
169                     s[1] = *++in;                   
170                     s[2] = *++in;
171                     s[3] = '\0';
172                     len = len - 2;
173                     sscanf(s, "%o", &n);
174                     *out++ = n;
175                 }
176                 break;
177             default:
178                 *out++ = *in;
179                 break;
180             }
181             in++;
182         }
183         else
184             *out++ = *in++;
185     return out - out_buf;
186 }
187
188 int p_query_parse_attr(struct yaz_pqf_parser *li, ODR o,
189                               int num_attr, Odr_int *attr_list,
190                               char **attr_clist, Odr_oid **attr_set)
191 {
192     const char *cp;
193     size_t i;
194
195     if (!(cp = strchr(li->lex_buf, '=')) ||
196         (size_t) (cp-li->lex_buf) > li->lex_len)
197     {
198         attr_set[num_attr] = query_oid_getvalbyname(li, o);
199         if (attr_set[num_attr] == 0)
200         {
201             li->error = YAZ_PQF_ERROR_ATTSET;
202             return 0;
203         }
204         if (!lex(li))
205         {
206             li->error = YAZ_PQF_ERROR_MISSING;
207             return 0;
208         }
209         if (!(cp = strchr(li->lex_buf, '=')))
210         {
211             li->error = YAZ_PQF_ERROR_BADATTR;
212             return 0;
213         }
214     }
215     else 
216     {
217         if (num_attr > 0)
218             attr_set[num_attr] = attr_set[num_attr-1];
219         else
220             attr_set[num_attr] = 0;
221     }
222     if (*li->lex_buf < '0' || *li->lex_buf > '9')
223     {
224         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
225         return 0;
226     }
227     attr_list[2*num_attr] = odr_atoi(li->lex_buf);
228     cp++;
229
230     /* inspect value .. and make it a integer if it appears to be */
231     for (i = cp - li->lex_buf; i < li->lex_len; i++)
232         if (li->lex_buf[i] < '0' || li->lex_buf[i] > '9')
233         {
234             int len = li->lex_len - (cp - li->lex_buf);
235             attr_list[2*num_attr+1] = 0;
236             attr_clist[num_attr] = (char *) odr_malloc(o, len+1);
237             len = escape_string(attr_clist[num_attr], cp, len);
238             attr_clist[num_attr][len] = '\0';
239             return 1;
240         }
241     attr_list[2*num_attr+1] = odr_atoi(cp);
242     attr_clist[num_attr] = 0;
243     return 1;
244 }
245
246 Z_AttributeList *get_attributeList(ODR o, int num_attr, Odr_int *attr_list,
247                                    char **attr_clist, Odr_oid **attr_set)
248 {
249     int i, k = 0;
250     Odr_int *attr_tmp;
251     Z_AttributeElement **elements;
252     Z_AttributeList *attributes= (Z_AttributeList *)
253         odr_malloc(o, sizeof(*attributes));
254     attributes->num_attributes = num_attr;
255     if (!num_attr)
256     {
257         attributes->attributes = (Z_AttributeElement**)odr_nullval();
258         return attributes;
259     }
260     elements = (Z_AttributeElement**)
261         odr_malloc(o, num_attr * sizeof(*elements));
262
263     attr_tmp = (Odr_int *)odr_malloc(o, num_attr * 2 * sizeof(*attr_tmp));
264     memcpy(attr_tmp, attr_list, num_attr * 2 * sizeof(*attr_tmp));
265     for (i = num_attr; --i >= 0; )
266     {
267         int j;
268         for (j = i+1; j<num_attr; j++)
269             if (attr_tmp[2*j] == attr_tmp[2*i])
270                 break;
271         if (j < num_attr)
272             continue;
273         elements[k] =
274             (Z_AttributeElement*)odr_malloc(o,sizeof(**elements));
275         elements[k]->attributeType = &attr_tmp[2*i];
276         elements[k]->attributeSet = attr_set[i];
277
278         if (attr_clist[i])
279         {
280             elements[k]->which = Z_AttributeValue_complex;
281             elements[k]->value.complex = (Z_ComplexAttribute *)
282                 odr_malloc(o, sizeof(Z_ComplexAttribute));
283             elements[k]->value.complex->num_list = 1;
284             elements[k]->value.complex->list =
285                 (Z_StringOrNumeric **)
286                 odr_malloc(o, 1 * sizeof(Z_StringOrNumeric *));
287             elements[k]->value.complex->list[0] =
288                 (Z_StringOrNumeric *)
289                 odr_malloc(o, sizeof(Z_StringOrNumeric));
290             elements[k]->value.complex->list[0]->which =
291                 Z_StringOrNumeric_string;
292             elements[k]->value.complex->list[0]->u.string =
293                 attr_clist[i];
294             elements[k]->value.complex->semanticAction = 0;
295             elements[k]->value.complex->num_semanticAction = 0;
296         }
297         else
298         {
299             elements[k]->which = Z_AttributeValue_numeric;
300             elements[k]->value.numeric = &attr_tmp[2*i+1];
301         }
302         k++;
303     }
304     attributes->num_attributes = k;
305     attributes->attributes = elements;
306     return attributes;
307 }
308
309 Z_Term *z_Term_create(ODR o, int term_type, const char *buf, size_t len)
310 {
311     Z_Term *term = (Z_Term *)odr_malloc(o, sizeof(*term));
312     Odr_oct *term_octet = (Odr_oct *)odr_malloc(o, sizeof(*term_octet));
313     term_octet->buf = (unsigned char *)odr_malloc(o, 1 + len);
314     memcpy(term_octet->buf, buf, len);
315     term_octet->size = term_octet->len = len;
316     term_octet->buf[term_octet->size] = 0;  /* null terminate */
317     
318     switch (term_type)
319     {
320     case Z_Term_general:
321         term->which = Z_Term_general;
322         term->u.general = term_octet;
323         break;
324     case Z_Term_characterString:
325         term->which = Z_Term_characterString;
326         term->u.characterString = (char*) term_octet->buf; 
327         /* null terminated above */
328         break;
329     case Z_Term_numeric:
330         term->which = Z_Term_numeric;
331         term->u.numeric = odr_intdup(o, odr_atoi((const char*) term_octet->buf));
332         break;
333     case Z_Term_null:
334         term->which = Z_Term_null;
335         term->u.null = odr_nullval();
336         break;
337     case Z_Term_external:
338         term->which = Z_Term_external;
339         term->u.external = 0;
340         break;
341     default:
342         term->which = Z_Term_null;
343         term->u.null = odr_nullval();
344         break;
345     }
346     return term;
347 }
348
349 static Z_AttributesPlusTerm *rpn_term_attributes(
350     struct yaz_pqf_parser *li, ODR o, Z_AttributeList *attributes)
351 {
352     char *es_str = odr_malloc(o, li->lex_len+1);
353     int es_len = escape_string(es_str, li->lex_buf, li->lex_len);
354     Z_Term *term = z_Term_create(o, li->term_type, es_str, es_len);
355     Z_AttributesPlusTerm *zapt = (Z_AttributesPlusTerm *)
356         odr_malloc(o, sizeof(*zapt));
357
358     zapt->term = term;
359     zapt->attributes = attributes;
360     return zapt;
361 }
362
363 static Z_AttributesPlusTerm *rpn_term(struct yaz_pqf_parser *li, ODR o,
364                                       int num_attr, Odr_int *attr_list,
365                                       char **attr_clist, Odr_oid **attr_set)
366 {
367     return rpn_term_attributes(li, o, get_attributeList(o, num_attr, attr_list, attr_clist, attr_set));
368 }
369
370 static Z_Operand *rpn_simple(struct yaz_pqf_parser *li, ODR o,
371                              int num_attr, Odr_int *attr_list,
372                              char **attr_clist,
373                              Odr_oid **attr_set)
374 {
375     Z_Operand *zo;
376
377     zo = (Z_Operand *)odr_malloc(o, sizeof(*zo));
378     switch (li->query_look)
379     {
380     case 't':
381         zo->which = Z_Operand_APT;
382         if (!(zo->u.attributesPlusTerm =
383               rpn_term(li, o, num_attr, attr_list, attr_clist, attr_set)))
384             return 0;
385         lex(li);
386         break;
387     case 's':
388         lex(li);
389         if (!li->query_look)
390         {
391             li->error = YAZ_PQF_ERROR_MISSING;
392             return 0;
393         }
394         zo->which = Z_Operand_resultSetId;
395         zo->u.resultSetId = (char *)odr_malloc(o, li->lex_len+1);
396         memcpy(zo->u.resultSetId, li->lex_buf, li->lex_len);
397         zo->u.resultSetId[li->lex_len] = '\0';
398         lex(li);
399         break;
400     default:
401         /* we're only called if one of the above types are seens so
402            this shouldn't happen */
403         li->error = YAZ_PQF_ERROR_INTERNAL;
404         return 0;
405     }
406     return zo;
407 }
408
409 static Z_ProximityOperator *rpn_proximity(struct yaz_pqf_parser *li, ODR o)
410 {
411     Z_ProximityOperator *p = (Z_ProximityOperator *)odr_malloc(o, sizeof(*p));
412
413     if (!lex(li))
414     {
415         li->error = YAZ_PQF_ERROR_MISSING;
416         return NULL;
417     }
418     if (*li->lex_buf == '1')
419         p->exclusion = odr_booldup(o, 1);
420     else if (*li->lex_buf == '0')
421         p->exclusion = odr_booldup(o, 0);
422     else if (*li->lex_buf == 'v' || *li->lex_buf == 'n')
423         p->exclusion = NULL;
424     else
425     {
426         li->error = YAZ_PQF_ERROR_PROXIMITY;
427         return NULL;
428     }
429
430     if (!lex(li))
431     {
432         li->error = YAZ_PQF_ERROR_MISSING;
433         return NULL;
434     }
435     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
436         p->distance = odr_intdup(o, odr_atoi(li->lex_buf));
437     else
438     {
439         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
440         return NULL;
441     }
442
443     if (!lex(li))
444     {
445         li->error = YAZ_PQF_ERROR_MISSING;
446         return NULL;
447     }
448     if (*li->lex_buf == '1')
449         p->ordered = odr_booldup(o, 1);
450     else if (*li->lex_buf == '0')
451         p->ordered = odr_booldup(o, 0);
452     else
453     {
454         li->error = YAZ_PQF_ERROR_PROXIMITY;
455         return NULL;
456     }
457     
458     if (!lex (li))
459     {
460         li->error = YAZ_PQF_ERROR_MISSING;
461         return NULL;
462     }
463     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
464         p->relationType = odr_intdup(o, odr_atoi(li->lex_buf));
465     else
466     {
467         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
468         return NULL;
469     }
470
471     if (!lex(li))
472     {
473         li->error = YAZ_PQF_ERROR_MISSING;
474         return NULL;
475     }
476     if (*li->lex_buf == 'k')
477         p->which = Z_ProximityOperator_known;
478     else if (*li->lex_buf == 'p')
479         p->which = Z_ProximityOperator_private;
480     else
481         p->which = atoi(li->lex_buf);
482
483     if (p->which != Z_ProximityOperator_known
484         && p->which != Z_ProximityOperator_private)
485     {
486         li->error = YAZ_PQF_ERROR_PROXIMITY;
487         return NULL;
488     }
489
490     if (!lex(li))
491     {
492         li->error = YAZ_PQF_ERROR_MISSING;
493         return NULL;
494     }
495     if (*li->lex_buf >= '0' && *li->lex_buf <= '9')
496         p->u.known = odr_intdup(o, odr_atoi(li->lex_buf));
497     else
498     {
499         li->error = YAZ_PQF_ERROR_BAD_INTEGER;
500         return NULL;
501     }
502     return p;
503 }
504
505 static Z_Complex *rpn_complex(struct yaz_pqf_parser *li, ODR o,
506                               int num_attr, int max_attr, 
507                               Odr_int *attr_list, char **attr_clist,
508                               Odr_oid **attr_set)
509 {
510     Z_Complex *zc;
511     Z_Operator *zo;
512
513     zc = (Z_Complex *)odr_malloc(o, sizeof(*zc));
514     zo = (Z_Operator *)odr_malloc(o, sizeof(*zo));
515     zc->roperator = zo;
516     switch (li->query_look)
517     {
518     case 'a':
519         zo->which = Z_Operator_and;
520         zo->u.op_and = odr_nullval();
521         break;
522     case 'o':
523         zo->which = Z_Operator_or;
524         zo->u.op_or = odr_nullval();
525         break;
526     case 'n':
527         zo->which = Z_Operator_and_not;
528         zo->u.and_not = odr_nullval();
529         break;
530     case 'p':
531         zo->which = Z_Operator_prox;
532         zo->u.prox = rpn_proximity(li, o);
533         if (!zo->u.prox)
534             return NULL;
535         break;
536     default:
537         /* we're only called if one of the above types are seens so
538            this shouldn't happen */
539         li->error = YAZ_PQF_ERROR_INTERNAL;
540         return NULL;
541     }
542     lex(li);
543     if (!(zc->s1 =
544           rpn_structure(li, o, num_attr, max_attr, attr_list,
545                         attr_clist, attr_set)))
546         return NULL;
547     if (!(zc->s2 =
548           rpn_structure(li, o, num_attr, max_attr, attr_list,
549                         attr_clist, attr_set)))
550         return NULL;
551     return zc;
552 }
553
554 static void rpn_term_type(struct yaz_pqf_parser *li)
555 {
556     if (!li->query_look)
557         return ;
558     if (compare_term(li, "general", 0))
559         li->term_type = Z_Term_general;
560     else if (compare_term(li, "numeric", 0))
561         li->term_type = Z_Term_numeric;
562     else if (compare_term(li, "string", 0))
563         li->term_type = Z_Term_characterString;
564     else if (compare_term(li, "oid", 0))
565         li->term_type = Z_Term_oid;
566     else if (compare_term(li, "datetime", 0))
567         li->term_type = Z_Term_dateTime;
568     else if (compare_term(li, "null", 0))
569         li->term_type = Z_Term_null;
570 #if 0
571     else if (compare_term(li, "range", 0))
572     {
573         /* prepare for external: range search .. */
574         li->term_type = Z_Term_external;
575         li->external_type = VAL_MULTISRCH2;
576     }
577 #endif
578     lex(li);
579 }
580                            
581 static Z_RPNStructure *rpn_structure(struct yaz_pqf_parser *li, ODR o,
582                                      int num_attr, int max_attr, 
583                                      Odr_int *attr_list,
584                                      char **attr_clist,
585                                      Odr_oid **attr_set)
586 {
587     Z_RPNStructure *sz;
588
589     sz = (Z_RPNStructure *)odr_malloc(o, sizeof(*sz));
590     switch (li->query_look)
591     {
592     case 'a':
593     case 'o':
594     case 'n':
595     case 'p':
596         sz->which = Z_RPNStructure_complex;
597         if (!(sz->u.complex =
598               rpn_complex(li, o, num_attr, max_attr, attr_list,
599                           attr_clist, attr_set)))
600             return NULL;
601         break;
602     case 't':
603     case 's':
604         sz->which = Z_RPNStructure_simple;
605         if (!(sz->u.simple =
606               rpn_simple(li, o, num_attr, attr_list,
607                          attr_clist, attr_set)))
608             return NULL;
609         break;
610     case 'l':
611         lex(li);
612         if (!li->query_look)
613         {
614             li->error = YAZ_PQF_ERROR_MISSING;
615             return 0;
616         }
617         if (num_attr >= max_attr)
618         {
619             li->error = YAZ_PQF_ERROR_TOOMANY;
620             return 0;
621         }
622         if (!p_query_parse_attr(li, o, num_attr, attr_list,
623                                 attr_clist, attr_set))
624             return 0;
625         num_attr++;
626         lex(li);
627         return
628             rpn_structure(li, o, num_attr, max_attr, attr_list,
629                           attr_clist,  attr_set);
630     case 'y':
631         lex(li);
632         rpn_term_type(li);
633         return
634             rpn_structure(li, o, num_attr, max_attr, attr_list,
635                           attr_clist, attr_set);
636     case 0:                /* operator/operand expected! */
637         li->error = YAZ_PQF_ERROR_MISSING;
638         return 0;
639     }
640     return sz;
641 }
642
643 static Z_RPNQuery *p_query_rpn_mk(ODR o, struct yaz_pqf_parser *li)
644 {
645     Z_RPNQuery *zq;
646     Odr_int attr_array[1024];
647     char *attr_clist[512];
648     Odr_oid *attr_set[512];
649     Odr_oid *top_set = 0;
650
651     zq = (Z_RPNQuery *)odr_malloc(o, sizeof(*zq));
652     lex(li);
653     if (li->query_look == 'r')
654     {
655         lex(li);
656         top_set = query_oid_getvalbyname(li, o);
657         if (!top_set)
658         {
659             li->error = YAZ_PQF_ERROR_ATTSET;
660             return NULL;
661         }
662         lex(li);
663     }
664     if (!top_set)
665     {
666         top_set = odr_oiddup(o, yaz_oid_attset_bib_1);
667     }
668
669     zq->attributeSetId = top_set;
670
671     if (!zq->attributeSetId)
672     {
673         li->error = YAZ_PQF_ERROR_ATTSET;
674         return 0;
675     }
676
677     if (!(zq->RPNStructure = rpn_structure(li, o, 0, 512,
678                                            attr_array, attr_clist, attr_set)))
679         return 0;
680     if (li->query_look)
681     {
682         li->error = YAZ_PQF_ERROR_EXTRA;
683         return 0;
684     }
685     return zq;
686 }
687
688 static void pqf_parser_begin(struct yaz_pqf_parser *li, const char *buf)
689 {
690     li->query_buf = li->query_ptr = buf;
691     li->lex_buf = 0;
692 }
693
694 Z_RPNQuery *p_query_rpn(ODR o, const char *qbuf)
695 {
696     struct yaz_pqf_parser li;
697
698     li.error = 0;
699     li.left_sep = "{\"";
700     li.right_sep = "}\"";
701     li.escape_char = '@';
702     li.term_type = Z_Term_general;
703
704     pqf_parser_begin(&li, qbuf);
705     return p_query_rpn_mk(o, &li);
706 }
707
708 static Z_AttributeList *p_query_scan_attributes_mk(struct yaz_pqf_parser *li,
709                                              ODR o,
710                                              Odr_oid **attributeSetP)
711 {
712     Odr_int attr_list[1024];
713     char *attr_clist[512];
714     Odr_oid *attr_set[512];
715     int num_attr = 0;
716     int max_attr = 512;
717     Odr_oid *top_set = 0;
718
719     lex(li);
720     if (li->query_look == 'r')
721     {
722         lex(li);
723         top_set = query_oid_getvalbyname(li, o);
724         if (!top_set)
725         {
726             li->error = YAZ_PQF_ERROR_ATTSET;
727             return NULL;
728         }
729         lex(li);
730     }
731     if (!top_set)
732     {
733         top_set = odr_oiddup(o, yaz_oid_attset_bib_1);
734     }
735     *attributeSetP = top_set;
736
737     while (1)
738     {
739         if (li->query_look == 'l')
740         {
741             lex(li);
742             if (!li->query_look)
743             {
744                 li->error = YAZ_PQF_ERROR_MISSING;
745                 return 0;
746             }
747             if (num_attr >= max_attr)
748             {
749                 li->error = YAZ_PQF_ERROR_TOOMANY;
750                 return 0;
751             }
752             if (!p_query_parse_attr(li, o, num_attr, attr_list,
753                                     attr_clist, attr_set))
754                 return 0;
755             num_attr++;
756             lex(li);
757         }
758         else if (li->query_look == 'y')
759         {
760             lex(li);
761             rpn_term_type(li);
762         }
763         else
764             break;
765     }
766     return get_attributeList(o, num_attr, attr_list, attr_clist, attr_set);
767 }
768
769 static Z_AttributesPlusTerm *p_query_scan_mk(struct yaz_pqf_parser *li,
770                                              ODR o,
771                                              Odr_oid **attributeSetP)
772 {
773     Z_AttributeList *attr_list = p_query_scan_attributes_mk(li, o, attributeSetP);
774     Z_AttributesPlusTerm *apt;
775
776     if (!li->query_look)
777     {
778         li->error = YAZ_PQF_ERROR_MISSING;
779         return 0;
780     }
781     apt = rpn_term_attributes(li, o, attr_list);
782
783     lex(li);
784
785     if (li->query_look != 0)
786     {
787         li->error = YAZ_PQF_ERROR_EXTRA;
788         return 0;
789     }
790     return apt;
791 }
792
793 YAZ_PQF_Parser yaz_pqf_create(void)
794 {
795     YAZ_PQF_Parser p = (YAZ_PQF_Parser) xmalloc(sizeof(*p));
796
797     p->error = 0;
798     p->left_sep = "{\"";
799     p->right_sep = "}\"";
800     p->escape_char = '@';
801     p->term_type = Z_Term_general;
802
803     return p;
804 }
805
806 void yaz_pqf_destroy(YAZ_PQF_Parser p)
807 {
808     xfree(p);
809 }
810
811 Z_RPNQuery *yaz_pqf_parse(YAZ_PQF_Parser p, ODR o, const char *qbuf)
812 {
813     if (!p)
814         return 0;
815     pqf_parser_begin(p, qbuf);
816     return p_query_rpn_mk(o, p);
817 }
818
819 Z_AttributesPlusTerm *yaz_pqf_scan(YAZ_PQF_Parser p, ODR o,
820                                    Odr_oid **attributeSetP,
821                                    const char *qbuf)
822 {
823     if (!p)
824         return 0;
825     pqf_parser_begin(p, qbuf);
826     return p_query_scan_mk(p, o, attributeSetP);
827 }
828
829 Z_AttributeList *yaz_pqf_scan_attribute_list(YAZ_PQF_Parser p, ODR o,
830                                              Odr_oid **attributeSetP,
831                                              const char *qbuf)
832 {
833     if (!p)
834         return 0;
835     pqf_parser_begin(p, qbuf);
836     return p_query_scan_attributes_mk(p, o, attributeSetP);
837 }
838
839 static Z_FacetField* parse_facet(ODR odr, const char *facet)
840 {
841     YAZ_PQF_Parser pqf_parser = yaz_pqf_create();
842     struct yaz_pqf_parser *li = pqf_parser;
843     Odr_oid *attributeSetId;
844     Z_FacetField *facet_field = 0;
845     Z_AttributeList *attribute_list;
846
847     pqf_parser_begin(pqf_parser, facet);
848     attribute_list = p_query_scan_attributes_mk(li, odr, &attributeSetId);
849     if (attribute_list)
850     {
851         facet_field = (Z_FacetField *) odr_malloc(odr, sizeof(*facet_field));
852         facet_field->attributes = attribute_list;
853         facet_field->num_terms = 0;
854         facet_field->terms = odr_malloc(odr, 10 * sizeof(*facet_field->terms));
855         while (li->query_look == 't')
856         {
857             if (facet_field->num_terms < 10)
858             {
859                 char *es_str = odr_malloc(odr, li->lex_len+1);
860                 int es_len = escape_string(es_str, li->lex_buf, li->lex_len);
861                 Z_Term *term = z_Term_create(odr, li->term_type, es_str, es_len);
862
863                 facet_field->terms[facet_field->num_terms] =
864                     (Z_FacetTerm *) odr_malloc(odr, sizeof(Z_FacetTerm));
865                 facet_field->terms[facet_field->num_terms]->term = term;
866                 facet_field->terms[facet_field->num_terms]->count = 
867                     odr_intdup(odr, 0);
868                 facet_field->num_terms++;
869             }
870             lex(li);
871         }
872     }
873     yaz_pqf_destroy(pqf_parser);
874     return facet_field;
875 }
876
877 Z_FacetList *yaz_pqf_parse_facet_list(ODR o, const char *qbuf)
878 {
879     char **darray;
880     int num;
881
882     nmem_strsplit(odr_getmem(o), ",", qbuf, &darray, &num);
883     if (num > 0)
884     {
885         int i;
886         Z_FacetList *fl = (Z_FacetList*) odr_malloc(o, sizeof(*fl));
887         fl->num = num;
888         fl->elements = (Z_FacetField **)
889             odr_malloc(o, num * sizeof(*fl->elements));
890         for (i = 0; i < num; i++)
891         {
892             fl->elements[i] = parse_facet(o, darray[i]);
893             if (!fl->elements[i])
894                 return 0;
895         }
896         return fl;
897     }
898     else
899         return 0;
900 }
901
902 int yaz_pqf_error(YAZ_PQF_Parser p, const char **msg, size_t *off)
903 {
904     switch (p->error)
905     {
906     case YAZ_PQF_ERROR_NONE:
907         *msg = "no error"; break;
908     case YAZ_PQF_ERROR_EXTRA:
909         *msg = "extra token"; break;
910     case YAZ_PQF_ERROR_MISSING:
911         *msg = "missing token"; break;
912     case YAZ_PQF_ERROR_ATTSET:
913         *msg = "unknown attribute set"; break;
914     case YAZ_PQF_ERROR_TOOMANY:
915         *msg = "too many attributes"; break;
916     case YAZ_PQF_ERROR_BADATTR:
917         *msg = "bad attribute specification"; break;
918     case YAZ_PQF_ERROR_INTERNAL:
919         *msg = "internal error"; break;
920     case YAZ_PQF_ERROR_PROXIMITY:
921         *msg = "proximity error"; break;
922     case YAZ_PQF_ERROR_BAD_INTEGER:
923         *msg = "bad integer"; break;
924     default:
925         *msg = "unknown error"; break;
926     }
927     *off = p->query_ptr - p->query_buf;
928     return p->error;
929 }
930 /*
931  * Local variables:
932  * c-basic-offset: 4
933  * c-file-style: "Stroustrup"
934  * indent-tabs-mode: nil
935  * End:
936  * vim: shiftwidth=4 tabstop=8 expandtab
937  */
938