Moved stop word support code to separate ccl_stop_words.c and
[yaz-moved-to-github.git] / src / cclqual.c
index 6eedfb2..67ef7fa 100644 (file)
@@ -48,7 +48,7 @@
 /* CCL qualifiers
  * Europagate, 1995
  *
- * $Id: cclqual.c,v 1.6 2007-04-26 21:41:57 adam Exp $
+ * $Id: cclqual.c,v 1.10 2007-05-01 12:22:11 adam Exp $
  *
  * Old Europagate Log:
  *
@@ -85,7 +85,8 @@
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
-
+#include <yaz/snprintf.h>
+#include <yaz/tokenizer.h>
 #include "cclp.h"
 
 /** CCL Qualifier */
@@ -108,144 +109,148 @@ struct ccl_qualifiers {
 /** CCL Qualifier special */
 struct ccl_qualifier_special {
     char *name;
-    char *value;
+    const char **values;
     struct ccl_qualifier_special *next;
 };
 
 
-static struct ccl_qualifier *ccl_qual_lookup (CCL_bibset b,
-                                              const char *n, size_t len)
+static struct ccl_qualifier *ccl_qual_lookup(CCL_bibset b,
+                                             const char *n, size_t len)
 {
     struct ccl_qualifier *q;
     for (q = b->list; q; q = q->next)
-        if (len == strlen(q->name) && !memcmp (q->name, n, len))
+        if (len == strlen(q->name) && !memcmp(q->name, n, len))
             break;
     return q;
 }
 
-
-void ccl_qual_add_special (CCL_bibset bibset, const char *n, const char *v)
+void ccl_qual_add_special_ar(CCL_bibset bibset, const char *n,
+                             const char **values)
 {
     struct ccl_qualifier_special *p;
-    const char *pe;
-
     for (p = bibset->special; p && strcmp(p->name, n); p = p->next)
         ;
     if (p)
-        xfree (p->value);
+    {
+        if (p->values)
+        {
+            int i;
+            for (i = 0; p->values[i]; i++)
+                xfree((char *) p->values[i]);
+            xfree(p->values);
+        }
+    }
     else
     {
-        p = (struct ccl_qualifier_special *) xmalloc (sizeof(*p));
+        p = (struct ccl_qualifier_special *) xmalloc(sizeof(*p));
         p->name = xstrdup(n);
-        p->value = 0;
         p->next = bibset->special;
         bibset->special = p;
     }
-    while (strchr(" \t", *v))
-        ++v;
-    for (pe = v + strlen(v); pe != v; --pe)
-        if (!strchr(" \n\r\t", pe[-1]))
-            break;
-    p->value = (char*) xmalloc (pe - v + 1);
-    if (pe - v)
-        memcpy (p->value, v, pe - v);
-    p->value[pe - v] = '\0';
+    p->values = values;
 }
 
-static int next_token(const char **cpp, const char **dst)
+void ccl_qual_add_special(CCL_bibset bibset, const char *n, const char *cp)
 {
-    int len = 0;
-    const char *cp = *cpp;
-    while (*cp && strchr(" \r\n\t\f", *cp))
-        cp++;
-    if (dst)
-        *dst = cp;
-    len = 0;
-    while (*cp && !strchr(" \r\n\t\f", *cp))
+    size_t no = 2;
+    char **vlist = xmalloc(no * sizeof(*vlist));
+    yaz_tok_cfg_t yt = yaz_tok_cfg_create();
+    int t;
+    int i = 0;
+    
+    yaz_tok_parse_t tp = yaz_tok_parse_buf(yt, cp);
+    
+    yaz_tok_cfg_destroy(yt);
+    
+    t = yaz_tok_move(tp);
+    while (t == YAZ_TOK_STRING)
     {
-        cp++;
-        len++;
+        if (i >= no-1)
+            vlist = xrealloc(vlist, (no = no * 2) * sizeof(*vlist));
+        vlist[i++] = xstrdup(yaz_tok_parse_string(tp));
+        t = yaz_tok_move(tp); 
     }
-    *cpp = cp;
-    return len;
+    vlist[i] = 0;
+    ccl_qual_add_special_ar(bibset, n, (const char **) vlist);
+    
+    yaz_tok_parse_destroy(tp);
 }
 
-void ccl_qual_add_combi (CCL_bibset b, const char *n, const char *names)
+
+/** \brief adds specifies qualifier aliases
+    
+    \param b bibset
+    \param n qualifier name
+    \param names list of qualifier aliases
+*/
+void ccl_qual_add_combi(CCL_bibset b, const char *n, const char **names)
 {
-    const char *cp, *cp1;
-    int i, len;
+    int i;
     struct ccl_qualifier *q;
     for (q = b->list; q && strcmp(q->name, n); q = q->next)
         ;
     if (q)
         return ;
-    q = (struct ccl_qualifier *) xmalloc (sizeof(*q));
+    q = (struct ccl_qualifier *) xmalloc(sizeof(*q));
     q->name = xstrdup(n);
     q->attr_list = 0;
     q->next = b->list;
     b->list = q;
     
-    cp = names;
-    for (i = 0; next_token(&cp, 0); i++)
+    for (i = 0; names[i]; i++)
         ;
     q->no_sub = i;
-    q->sub = (struct ccl_qualifier **) xmalloc (sizeof(*q->sub) *
-                                               (1+q->no_sub));
-    cp = names;
-    for (i = 0; (len = next_token(&cp, &cp1)); i++)
-    {
-        q->sub[i] = ccl_qual_lookup (b, cp1, len);
-    }
+    q->sub = (struct ccl_qualifier **)
+        xmalloc(sizeof(*q->sub) * (1+q->no_sub));
+    for (i = 0; names[i]; i++)
+        q->sub[i] = ccl_qual_lookup(b, names[i], strlen(names[i]));
 }
 
-/**
- * ccl_qual_add: Add qualifier to Bibset. If qualifier already
- *               exists, then attributes are appendend to old
- *               definition.
- * name:    name of qualifier
- * no:      No of attribute type/value pairs.
- * pairs:   Attributes. pairs[0] first type, pair[1] first value,
- *          ... pair[2*no-2] last type, pair[2*no-1] last value.
- */
+/** \brief adds specifies attributes for qualifier
+    
+    \param b bibset
+    \param name qualifier name
+    \param no number of attribute type+value pairs
+    \param type_ar attributes type of size no
+    \param value_ar attribute value of size no
+    \param svalue_ar attribute string values ([i] only used  if != NULL)
+    \param attsets attribute sets of size no
+*/
 
-void ccl_qual_add_set (CCL_bibset b, const char *name, int no,
+void ccl_qual_add_set(CCL_bibset b, const char *name, int no,
                        int *type_ar, int *value_ar, char **svalue_ar,
                        char **attsets)
 {
     struct ccl_qualifier *q;
     struct ccl_rpn_attr **attrp;
 
-    ccl_assert (b);
+    ccl_assert(b);
     for (q = b->list; q; q = q->next)
-        if (!strcmp (name, q->name))
+        if (!strcmp(name, q->name))
             break;
     if (!q)
     {
-        struct ccl_qualifier *new_qual =
-            (struct ccl_qualifier *)xmalloc (sizeof(*new_qual));
-        ccl_assert (new_qual);
+        q = (struct ccl_qualifier *)xmalloc(sizeof(*q));
+        ccl_assert(q);
         
-        new_qual->next = b->list;
-        b->list = new_qual;
+        q->next = b->list;
+        b->list = q;
         
-        new_qual->name = xstrdup(name);
-        attrp = &new_qual->attr_list;
+        q->name = xstrdup(name);
+        q->attr_list = 0;
 
-        new_qual->no_sub = 0;
-        new_qual->sub = 0;
-    }
-    else
-    {
-        attrp = &q->attr_list;
-        while (*attrp)
-            attrp = &(*attrp)->next;
+        q->no_sub = 0;
+        q->sub = 0;
     }
+    attrp = &q->attr_list;
+    while (*attrp)
+        attrp = &(*attrp)->next;
     while (--no >= 0)
     {
         struct ccl_rpn_attr *attr;
 
-        attr = (struct ccl_rpn_attr *)xmalloc (sizeof(*attr));
-        ccl_assert (attr);
+        attr = (struct ccl_rpn_attr *)xmalloc(sizeof(*attr));
+        ccl_assert(attr);
         attr->set = *attsets++;
         attr->type = *type_ar++;
         if (*svalue_ar)
@@ -266,24 +271,24 @@ void ccl_qual_add_set (CCL_bibset b, const char *name, int no,
     *attrp = NULL;
 }
 
-/**
- * ccl_qual_mk: Make new (empty) bibset.
- * return:   empty bibset.
+/** \brief creates Bibset
+    \returns bibset
  */
-CCL_bibset ccl_qual_mk (void)
+CCL_bibset ccl_qual_mk(void)
 {
-    CCL_bibset b = (CCL_bibset)xmalloc (sizeof(*b));
-    ccl_assert (b);
+    CCL_bibset b = (CCL_bibset)xmalloc(sizeof(*b));
+    ccl_assert(b);
     b->list = NULL;     
     b->special = NULL;
     return b;
 }
 
-/**
- * ccl_qual_rm: Delete bibset.
- * b:        pointer to bibset
+/** \brief destroys Bibset
+    \param b pointer to Bibset
+    
+    *b will be set to NULL.
  */
-void ccl_qual_rm (CCL_bibset *b)
+void ccl_qual_rm(CCL_bibset *b)
 {
     struct ccl_qualifier *q, *q1;
     struct ccl_qualifier_special *sp, *sp1;
@@ -301,76 +306,86 @@ void ccl_qual_rm (CCL_bibset *b)
                 xfree(attr->set);
             if (attr->kind == CCL_RPN_ATTR_STRING)
                 xfree(attr->value.str);
-            xfree (attr);
+            xfree(attr);
         }
         q1 = q->next;
-        xfree (q->name);
+        xfree(q->name);
         if (q->sub)
-            xfree (q->sub);
-        xfree (q);
+            xfree(q->sub);
+        xfree(q);
     }
     for (sp = (*b)->special; sp; sp = sp1)
     {
         sp1 = sp->next;
-        xfree (sp->name);
-        xfree (sp->value);
-        xfree (sp);
+        xfree(sp->name);
+        if (sp->values)
+        {
+            int i;
+            for (i = 0; sp->values[i]; i++)
+                xfree((char*) sp->values[i]);
+            xfree(sp->values);
+        }
+        xfree(sp);
     }
-    xfree (*b);
+    xfree(*b);
     *b = NULL;
 }
 
-/**
- * ccl_qual_search: Search for qualifier in bibset.
- * b:      Bibset
- * name:   Name of qualifier to search for (need no null-termination)
- * len:    Length of name.
- * return: Attribute info. NULL if not found.
- */
-struct ccl_rpn_attr *ccl_qual_search (CCL_parser cclp,
-                                      const char *name, size_t len,
-                                      int seq)
+ccl_qualifier_t ccl_qual_search(CCL_parser cclp, const char *name, 
+                                size_t name_len, int seq)
 {
-    struct ccl_qualifier *q;
-    const char *aliases;
+    struct ccl_qualifier *q = 0;
+    const char **aliases;
     int case_sensitive = cclp->ccl_case_sensitive;
 
-    ccl_assert (cclp);
+    ccl_assert(cclp);
     if (!cclp->bibset)
-        return NULL;
+        return 0;
 
     aliases = ccl_qual_search_special(cclp->bibset, "case");
     if (aliases)
-        case_sensitive = atoi(aliases);
+        case_sensitive = atoi(aliases[0]);
 
     for (q = cclp->bibset->list; q; q = q->next)
-        if (strlen(q->name) == len)
+        if (strlen(q->name) == name_len)
         {
             if (case_sensitive)
             {
-                if (!memcmp (name, q->name, len))
+                if (!memcmp(name, q->name, name_len))
                     break;
             }
             else
             {
-                if (!ccl_memicmp (name, q->name, len))
+                if (!ccl_memicmp(name, q->name, name_len))
                     break;
             }
         }
     if (q)
     {
-        if (q->attr_list && seq == 0)
-            return q->attr_list;
-        if (seq < q->no_sub && q->sub[seq])
+        if (q->no_sub)
         {
-            return q->sub[seq]->attr_list;
+            if (seq < q->no_sub)
+                q = q->sub[seq];
+            else
+                q = 0;
         }
+        else if (seq)
+            q = 0;
     }
-    return 0;
+    return q;
+}
+
+struct ccl_rpn_attr *ccl_qual_get_attr(ccl_qualifier_t q)
+{
+    return q->attr_list;
+}
+
+const char *ccl_qual_get_name(ccl_qualifier_t q)
+{
+    return q->name;
 }
 
-const char *ccl_qual_search_special (CCL_bibset b,
-                                     const char *name)
+const char **ccl_qual_search_special(CCL_bibset b, const char *name)
 {
     struct ccl_qualifier_special *q;
     if (!b)
@@ -378,9 +393,34 @@ const char *ccl_qual_search_special (CCL_bibset b,
     for (q = b->special; q && strcmp(q->name, name); q = q->next)
         ;
     if (q)
-        return q->value;
+        return q->values;
     return 0;
 }
+
+int ccl_search_stop(CCL_bibset bibset, const char *qname,
+                    const char *src_str, size_t src_len)
+{
+    const char **slist = 0;
+    if (qname)
+    {
+        char qname_buf[80];
+        yaz_snprintf(qname_buf, sizeof(qname_buf)-1, "stop.%s",
+                     qname);
+        slist = ccl_qual_search_special(bibset, qname_buf);
+    }
+    if (!slist)
+        slist = ccl_qual_search_special(bibset, "stop.*");
+    if (slist)
+    {
+        int i;
+        for (i = 0; slist[i]; i++)
+            if (src_len == strlen(slist[i]) 
+                && ccl_memicmp(slist[i], src_str, src_len) == 0)
+                return 1;
+    }
+    return 0;
+}
+
 /*
  * Local variables:
  * c-basic-offset: 4