For backward compatibility GET will be used when URL (+params) length is lower than...
[pazpar2-moved-to-github.git] / src / test_relevance.c
index af391bf..b3707f7 100644 (file)
@@ -1,7 +1,5 @@
-/* $Id: test_relevance.c,v 1.3 2007-04-19 11:57:53 marc Exp $
-   Copyright (c) 2006-2007, Index Data.
-
-This file is part of Pazpar2.
+/* This file is part of Pazpar2.
+   Copyright (C) 2006-2008 Index Data
 
 Pazpar2 is free software; you can redistribute it and/or modify it under
 the terms of the GNU General Public License as published by the Free
@@ -14,24 +12,13 @@ FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
 for more details.
 
 You should have received a copy of the GNU General Public License
-along with Pazpar2; see the file LICENSE.  If not, write to the
-Free Software Foundation, 59 Temple Place - Suite 330, Boston, MA
-02111-1307, USA.
- */
+along with this program; if not, write to the Free Software
+Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
 
-#include <stdlib.h>
-#include <stdio.h>
-#include <string.h>
-#include <sys/time.h>
-#include <unistd.h>
-#include <sys/socket.h>
-#include <netdb.h>
-#include <signal.h>
-#include <ctype.h>
-#include <assert.h>
+*/
 
 #if HAVE_CONFIG_H
-#include "cconfig.h"
+#include <config.h>
 #endif
 
 #define USE_TIMING 0
@@ -42,238 +29,153 @@ Free Software Foundation, 59 Temple Place - Suite 330, Boston, MA
 #include <yaz/test.h>
 
 
-//#include "pazpar2.h"
+#include "pazpar2_config.h"
 #include "relevance.h"
+#include "record.h"
+#include "reclists.h"
 
+#if 0
 
+void test_relevance_7bit(int argc, char **argv)
+{
+  NMEM         nmem = nmem_create();
 
+  struct conf_service *service = 0; 
+  service =  conf_service_create(nmem, 1, 1);
 
+  conf_service_add_metadata(nmem, service, 0, "title",
+                            Metadata_type_generic, Metadata_merge_unique,
+                            1, 1, 1, 0);
+  
+  conf_service_add_sortkey(nmem, service, 0, "title",
+                           Metadata_sortkey_string);
 
+  //conf_service_add_sortkey(nmem, service, 1, "relevance",
+  //                         Metadata_sortkey_relevance);
+  
 
 
 
-void test_relevance(int argc, char **argv)
-{
-  NMEM         nmem = nmem_create();
-  int numrecs = 10;
+  // setting up records
+  
+  // why on earth do we have a client dangeling from the record ??
+  // record->client = client;
+
+  union data_types data_ape = {"ape"};
+  union data_types data_bee = {"bee"};
+  union data_types data_fish = {"fish"};
+  union data_types data_zebra = {"zebra"};
+  
+
+  //union data_types data_year;
+  //data_num.number.min = 2005;
+  //data_num.number.max = 2007;
+
+  int no_recs = 4;
+
+  const char *mk_ape_fish = "ape fish";
+  struct record *rec_ape_fish = 0;
+  rec_ape_fish 
+      = record_create(nmem, service->num_metadata, service->num_sortkeys);
+  record_add_metadata(nmem, rec_ape_fish, service, "title", data_ape);
+  //record_assign_sortkey(nmem, rec_ape_fish, service, "relevance", data_ape);
+  record_assign_sortkey(nmem, rec_ape_fish, service, "title", data_ape);
+  record_add_metadata(nmem, rec_ape_fish, service, "title", data_fish);
+  YAZ_CHECK(rec_ape_fish);  
+
+  const char *mk_bee_fish = "bee fish";
+  struct record *rec_bee_fish = 0;
+  rec_bee_fish 
+      = record_create(nmem, service->num_metadata, service->num_sortkeys);
+  record_add_metadata(nmem, rec_bee_fish, service, "title", data_bee);
+  //record_assign_sortkey(nmem, rec_bee_fish, service, "relevance", data_bee);
+  record_assign_sortkey(nmem, rec_bee_fish, service, "title", data_bee);
+  record_add_metadata(nmem, rec_bee_fish, service, "title", data_fish);
+  YAZ_CHECK(rec_bee_fish);
+  const char *mk_fish_bee = "fish bee";
+  struct record *rec_fish_bee = 0;
+  rec_fish_bee 
+      = record_create(nmem, service->num_metadata, service->num_sortkeys);
+  record_add_metadata(nmem, rec_fish_bee, service, "title", data_fish);
+  //record_assign_sortkey(nmem, rec_fish_bee, service, "relevance", data_fish);
+  record_assign_sortkey(nmem, rec_fish_bee, service, "title", data_fish);
+  record_add_metadata(nmem, rec_fish_bee, service, "title", data_bee);
+  YAZ_CHECK(rec_fish_bee);
+  
+  const char *mk_zebra_bee = "zebra bee";
+  struct record *rec_zebra_bee = 0;
+    rec_zebra_bee 
+      = record_create(nmem, service->num_metadata, service->num_sortkeys);
+  record_add_metadata(nmem, rec_zebra_bee, service, "title", data_zebra);
+  //record_assign_sortkey(nmem, rec_zebra_bee, service, "relevance", data_zebra);
+  record_assign_sortkey(nmem, rec_zebra_bee, service, "title", data_zebra);
+  record_add_metadata(nmem, rec_zebra_bee, service, "title", data_bee);
+  YAZ_CHECK(rec_zebra_bee);
+
+  
+  struct reclist *list = 0;
+  list = reclist_create(nmem, no_recs);
+  YAZ_CHECK(list);
+
+  int no_merged = 0;
+
 
   const char * queryterms[] = 
-      {"abe", "fisk", 0};
+      {"ape", "fish", 0};
   //    {"ål", "økologi", "æble", 0};
 
+
+  //struct relevance *rel = 0;
+  //rel = relevance_create(nmem, queryterms, no_recs);
+  //YAZ_CHECK(rel);
+  
   struct record_cluster *cluster = 0;
-  struct conf_service *service = 0; 
-  struct reclist *list = 0;
-  struct record *record = 0;
-  const char *mergekey = "amergekey";
-  int total = 0;
 
-  struct relevance *rel = 0;
 
-  rel = relevance_create(nmem, queryterms, numrecs);
-  list = reclist_create(nmem, numrecs);
-  
-  service =  conf_service_create(nmem);
-
-  // setting up service - sic!
-  // this should have been done by a nice service_create function !!!
-
-  //service->num_metadata = 1;
-  //service->metadata = 0;
-  //service->num_sortkeys = 0;
-  //service->sortkeys = 0;
-
-
-  //if (service->num_metadata)
-  //    service->metadata 
-  //        = nmem_malloc(nmem, 
-  //                      sizeof(struct conf_metadata) * service->num_metadata);
-  //else
-  //    service->metadata = 0;
-  //service->metadata->name = nmem_strdup(nmem, "aname");
-  //service->metadata->brief = 1;
-  //service->metadata->termlist = 1;
-  //service->metadata->rank = 1;
-  //service->metadata->type = Metadata_type_generic;
-  //service->metadata->type = Metadata_type_year;
-  //service->metadata->merge = Metadata_merge_no;
-  //service->metadata->merge = Metadata_merge_unique;
-  //service->metadata->merge = Metadata_merge_longest;
-  //service->metadata->merge = Metadata_merge_range;
-  //service->metadata->merge = Metadata_merge_all;
-
-  service->metadata 
-      = conf_metadata_create(nmem, "name",
-                             Metadata_type_generic, Metadata_merge_unique,
-                             1, 1, 1, 0);
-  service->num_metadata = 1;
-
-  conf_service_add_metadata(nmem, service, "name",
-                             Metadata_type_generic, Metadata_merge_unique,
-                             1, 1, 1, 0);
-
-
-  if (service->num_sortkeys)
-      service->sortkeys 
-          = nmem_malloc(nmem, 
-                        sizeof(struct conf_sortkey) * service->num_sortkeys);
-  else
-      service->sortkeys = 0;
-  // service->sortkeys.type = Metadata_sortkey_numeric;
-  // service->sortkeys.type = Metadata_sortkey_skiparticle;
-  // service->sortkeys.name = service->metadata->name;
-  //service->metadata->sortkey_offset = sk_node;
-
-
-
-  // preparing one record
-  // this should have been done by a nice record_create function
-  // why the heck does the record know which client it belongs to ?? 
-
-  record = nmem_malloc(nmem, sizeof(struct record));
-  record->next = 0;
-  // which client should I use for record->client = cl;  ??
-  record->client = 0;
-  // and which sortkeys data_types list should I use ??
-  record->sortkeys = 0;
-  record->metadata 
-      = nmem_malloc(nmem, 
-                    sizeof(struct record_metadata*) * service->num_metadata);
-  memset(record->metadata, 0, 
-         sizeof(struct record_metadata*) * service->num_metadata);
-
-
-  // now we need to put some actual data into the record ... how ??
-  // there is a hell of a lot spagetti code in logic.c ingest_record()
-  // line 694 ff snippet from there:
-  // this code needs to be analyzed and the fundamental stuff extracted
-
-#if 0 
-  service->metadata[imeta].name;
-  md = &service->metadata[imeta];
-   if (md->sortkey_offset >= 0)
-                        sk = &service->sortkeys[md->sortkey_offset];
+  // insert records into recordlist and get clusters 
+  // since metadata keys differ, we get multiple clusters ?? 
+  cluster 
+      = reclist_insert(list, service, rec_ape_fish, mk_ape_fish, &no_merged);
+  YAZ_CHECK(cluster);
+  data_types_assign(nmem, &cluster->sortkeys[0], *rec_ape_fish->sortkeys[0]);
+  //relevance_newrec(rel, cluster);
 
-  // Find out where we are putting it           if (md->merge == Metadata_merge_no)
-                wheretoput = &res->metadata[imeta];
-            else
-                wheretoput = &cluster->metadata[imeta];
-            
-            
-            // Put it there
-            newm = nmem_malloc(se->nmem, sizeof(struct record_metadata));
-            newm->next = 0;
-            if (md->type == Metadata_type_generic)
-            {
-                char *p, *pe;
-                for (p = (char *) value; *p && isspace(*p); p++)
-                    ;
-                for (pe = p + strlen(p) - 1;
-                        pe > p && strchr(" ,/.:([", *pe); pe--)
-                    *pe = '\0';
-                newm->data.text = nmem_strdup(se->nmem, p);
-
-            }
-            else if (md->type == Metadata_type_year)
-            {
-                if (extract_years((char *) value, &first, &last) < 0)
-                    continue;
-            }
-            else
-            {
-                yaz_log(YLOG_WARN, "Unknown type in metadata element %s", type);
-                continue;
-            }
-            if (md->type == Metadata_type_year && md->merge != Metadata_merge_range)
-            {
-                yaz_log(YLOG_WARN, "Only range merging supported for years");
-                continue;
-            }
-            if (md->merge == Metadata_merge_unique)
-            {
-                struct record_metadata *mnode;
-                for (mnode = *wheretoput; mnode; mnode = mnode->next)
-                    if (!strcmp((const char *) mnode->data.text, newm->data.text))
-                        break;
-                if (!mnode)
-                {
-                    newm->next = *wheretoput;
-                    *wheretoput = newm;
-                }
-            }
-            else if (md->merge == Metadata_merge_longest)
-            {
-                if (!*wheretoput ||
-                        strlen(newm->data.text) > strlen((*wheretoput)->data.text))
-                {
-                    *wheretoput = newm;
-                    if (sk)
-                    {
-                        char *s = nmem_strdup(se->nmem, newm->data.text);
-                        if (!cluster->sortkeys[md->sortkey_offset])
-                            cluster->sortkeys[md->sortkey_offset] = 
-                                nmem_malloc(se->nmem, sizeof(union data_types));
-                        normalize_mergekey(s,
-                                (sk->type == Metadata_sortkey_skiparticle));
-                        cluster->sortkeys[md->sortkey_offset]->text = s;
-                    }
-                }
-            }
-            else if (md->merge == Metadata_merge_all || md->merge == Metadata_merge_no)
-            {
-                newm->next = *wheretoput;
-                *wheretoput = newm;
-            }
-            else if (md->merge == Metadata_merge_range)
-            {
-                assert(md->type == Metadata_type_year);
-                if (!*wheretoput)
-                {
-                    *wheretoput = newm;
-                    (*wheretoput)->data.number.min = first;
-                    (*wheretoput)->data.number.max = last;
-                    if (sk)
-                        cluster->sortkeys[md->sortkey_offset] = &newm->data;
-                }
-                else
-                {
-                    if (first < (*wheretoput)->data.number.min)
-                        (*wheretoput)->data.number.min = first;
-                    if (last > (*wheretoput)->data.number.max)
-                        (*wheretoput)->data.number.max = last;
-                }
-            if (md->rank)
-                relevance_countwords(se->relevance, cluster, 
-                                     (char *) value, md->rank);
-            if (md->termlist)
-            {
-                if (md->type == Metadata_type_year)
-                {
-                    char year[64];
-                    sprintf(year, "%d", last);
-                    add_facet(se, (char *) type, year);
-                    if (first != last)
-                    {
-                        sprintf(year, "%d", first);
-                        add_facet(se, (char *) type, year);
-                    }
-                }
-                else
-                    add_facet(se, (char *) type, (char *) value);
-            }
-#endif
+  cluster 
+      = reclist_insert(list, service, rec_bee_fish, mk_bee_fish, &no_merged);
+  YAZ_CHECK(cluster);
+  data_types_assign(nmem, &cluster->sortkeys[0], *rec_bee_fish->sortkeys[0]);
+  //relevance_newrec(rel, cluster);
 
-  //mergekey_norm = (xmlChar *) nmem_strdup(se->nmem, (char*) mergekey);
-  //normalize_mergekey((char *) mergekey_norm, 0);
+  cluster 
+      = reclist_insert(list, service, rec_fish_bee, mk_fish_bee, &no_merged);
+  YAZ_CHECK(cluster);
+  data_types_assign(nmem, &cluster->sortkeys[0], *rec_fish_bee->sortkeys[0]);
+  //relevance_newrec(rel, cluster);
+
+  cluster 
+      = reclist_insert(list, service, rec_zebra_bee, mk_zebra_bee, &no_merged);
+  YAZ_CHECK(cluster);
+  data_types_assign(nmem, &cluster->sortkeys[0], *rec_zebra_bee->sortkeys[0]);
+  //relevance_newrec(rel, cluster);
 
 
-  // insert one record into recordlist/cluster - what's a cluster, exactly??
-  cluster = reclist_insert(list, service, record, (char *)mergekey, &total);
+  YAZ_CHECK(no_recs == no_merged);
 
+  // now sorting according to sorting criteria, here ascending title
+  struct reclist_sortparms *sort_parms = 0;
 
-  relevance_newrec(rel, cluster);
+  reclist_sortparms_insert(nmem, &sort_parms, service, "title", 1);
 
+  //reclist_sortparms_insert(nmem, &sort_parms, service, "relevance", 1);
+
+  // crashes with a fat segmentation fault! To be traced tomorrow
+  reclist_sort(list, sort_parms);
+  
+
+                        
+  //mergekey_norm = (xmlChar *) nmem_strdup(se->nmem, (char*) mergekey);
+  //normalize_mergekey((char *) mergekey_norm, 0);
 
 
 
@@ -291,11 +193,11 @@ void test_relevance(int argc, char **argv)
 
   nmem_destroy(nmem);
 
-  YAZ_CHECK(0 == 0);
-  YAZ_CHECK_EQ(0, 1);
-
+  //YAZ_CHECK(0 == 0);
+  //YAZ_CHECK_EQ(0, 1);
 }
 
+#endif
 
 int main(int argc, char **argv)
 {
@@ -303,7 +205,7 @@ int main(int argc, char **argv)
     YAZ_CHECK_LOG(); 
 
 
-    test_relevance(argc, argv); 
+    //test_relevance_7bit(argc, argv); 
 
     
     YAZ_CHECK_TERM;