Added logging of CQL/PQF queries for ZOOM-based code
[pazpar2-moved-to-github.git] / src / client.c
1 /* This file is part of Pazpar2.
2    Copyright (C) 2006-2008 Index Data
3
4 Pazpar2 is free software; you can redistribute it and/or modify it under
5 the terms of the GNU General Public License as published by the Free
6 Software Foundation; either version 2, or (at your option) any later
7 version.
8
9 Pazpar2 is distributed in the hope that it will be useful, but WITHOUT ANY
10 WARRANTY; without even the implied warranty of MERCHANTABILITY or
11 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
12 for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 */
19
20 /** \file client.c
21     \brief Z39.50 client 
22 */
23
24 #if HAVE_CONFIG_H
25 #include <config.h>
26 #endif
27
28 #include <stdlib.h>
29 #include <stdio.h>
30 #include <string.h>
31 #if HAVE_SYS_TIME_H
32 #include <sys/time.h>
33 #endif
34 #if HAVE_UNISTD_H
35 #include <unistd.h>
36 #endif
37 #include <signal.h>
38 #include <assert.h>
39
40 #include <yaz/marcdisp.h>
41 #include <yaz/comstack.h>
42 #include <yaz/tcpip.h>
43 #include <yaz/proto.h>
44 #include <yaz/readconf.h>
45 #include <yaz/pquery.h>
46 #include <yaz/otherinfo.h>
47 #include <yaz/yaz-util.h>
48 #include <yaz/nmem.h>
49 #include <yaz/query-charset.h>
50 #include <yaz/querytowrbuf.h>
51 #include <yaz/oid_db.h>
52 #include <yaz/diagbib1.h>
53 #include <yaz/snprintf.h>
54 #include <yaz/rpn2cql.h>
55
56 #define USE_TIMING 0
57 #if USE_TIMING
58 #include <yaz/timing.h>
59 #endif
60
61 #include "pazpar2.h"
62
63 #include "client.h"
64 #include "connection.h"
65 #include "settings.h"
66
67 /** \brief Represents client state for a connection to one search target */
68 struct client {
69     struct session_database *database;
70     struct connection *connection;
71     struct session *session;
72     char *pquery; // Current search
73     char *cqlquery; // used for SRU targets only
74     int hits;
75     int record_offset;
76     int diagnostic;
77     enum client_state state;
78     struct show_raw *show_raw;
79     struct client *next;     // next client in session or next in free list
80 };
81
82 struct show_raw {
83     int active; // whether this request has been sent to the server
84     int position;
85     int binary;
86     char *syntax;
87     char *esn;
88     void (*error_handler)(void *data, const char *addinfo);
89     void (*record_handler)(void *data, const char *buf, size_t sz);
90     void *data;
91     struct show_raw *next;
92 };
93
94 static const char *client_states[] = {
95     "Client_Connecting",
96     "Client_Idle",
97     "Client_Working",
98     "Client_Error",
99     "Client_Failed",
100     "Client_Disconnected"
101 };
102
103 static struct client *client_freelist = 0;
104
105 const char *client_get_state_str(struct client *cl)
106 {
107     return client_states[cl->state];
108 }
109
110 enum client_state client_get_state(struct client *cl)
111 {
112     return cl->state;
113 }
114
115 void client_set_state(struct client *cl, enum client_state st)
116 {
117     cl->state = st;
118     if (cl->session)
119     {
120         int no_active = session_active_clients(cl->session);
121         if (no_active == 0)
122             session_alert_watch(cl->session, SESSION_WATCH_SHOW);
123     }
124 }
125
126 static void client_show_raw_error(struct client *cl, const char *addinfo);
127
128 // Close connection and set state to error
129 void client_fatal(struct client *cl)
130 {
131     yaz_log(YLOG_WARN, "Fatal error from %s", client_get_url(cl));
132     connection_destroy(cl->connection);
133     client_set_state(cl, Client_Error);
134 }
135
136 struct connection *client_get_connection(struct client *cl)
137 {
138     return cl->connection;
139 }
140
141 struct session_database *client_get_database(struct client *cl)
142 {
143     return cl->database;
144 }
145
146 struct session *client_get_session(struct client *cl)
147 {
148     return cl->session;
149 }
150
151 const char *client_get_pquery(struct client *cl)
152 {
153     return cl->pquery;
154 }
155
156 static void client_send_raw_present(struct client *cl);
157
158 int client_show_raw_begin(struct client *cl, int position,
159                           const char *syntax, const char *esn,
160                           void *data,
161                           void (*error_handler)(void *data, const char *addinfo),
162                           void (*record_handler)(void *data, const char *buf,
163                                                  size_t sz),
164                           void **data2,
165                           int binary)
166 {
167     struct show_raw *rr, **rrp;
168     if (!cl->connection)
169     {   /* the client has no connection */
170         return -1;
171     }
172     rr = xmalloc(sizeof(*rr));
173     *data2 = rr;
174     rr->position = position;
175     rr->active = 0;
176     rr->data = data;
177     rr->error_handler = error_handler;
178     rr->record_handler = record_handler;
179     rr->binary = binary;
180     if (syntax)
181         rr->syntax = xstrdup(syntax);
182     else
183         rr->syntax = 0;
184     if (esn)
185         rr->esn = xstrdup(esn);
186     else
187         rr->esn = 0;
188     rr->next = 0;
189     
190     for (rrp = &cl->show_raw; *rrp; rrp = &(*rrp)->next)
191         ;
192     *rrp = rr;
193     
194     if (cl->state == Client_Failed)
195     {
196         client_show_raw_error(cl, "client failed");
197     }
198     else if (cl->state == Client_Disconnected)
199     {
200         client_show_raw_error(cl, "client disconnected");
201     }
202     else
203     {
204         client_send_raw_present(cl);
205     }
206     return 0;
207 }
208
209 void client_show_raw_remove(struct client *cl, void *data)
210 {
211     struct show_raw *rr = data;
212     struct show_raw **rrp = &cl->show_raw;
213     while (*rrp != rr)
214         rrp = &(*rrp)->next;
215     if (*rrp)
216     {
217         *rrp = rr->next;
218         xfree(rr);
219     }
220 }
221
222 void client_show_raw_dequeue(struct client *cl)
223 {
224     struct show_raw *rr = cl->show_raw;
225
226     cl->show_raw = rr->next;
227     xfree(rr);
228 }
229
230 static void client_show_raw_error(struct client *cl, const char *addinfo)
231 {
232     while (cl->show_raw)
233     {
234         cl->show_raw->error_handler(cl->show_raw->data, addinfo);
235         client_show_raw_dequeue(cl);
236     }
237 }
238
239 static void client_send_raw_present(struct client *cl)
240 {
241     struct session_database *sdb = client_get_database(cl);
242     struct connection *co = client_get_connection(cl);
243     ZOOM_resultset set = connection_get_resultset(co);
244
245     int offset = cl->show_raw->position;
246     const char *syntax = 0;
247     const char *elements = 0;
248
249     assert(cl->show_raw);
250     assert(set);
251
252     yaz_log(YLOG_DEBUG, "%s: trying to present %d record(s) from %d",
253             client_get_url(cl), 1, offset);
254
255     if (cl->show_raw->syntax)
256         syntax = cl->show_raw->syntax;
257     else
258         syntax = session_setting_oneval(sdb, PZ_REQUESTSYNTAX);
259     ZOOM_resultset_option_set(set, "preferredRecordSyntax", syntax);
260
261     if (cl->show_raw->esn)
262         elements = cl->show_raw->esn;
263     else
264         elements = session_setting_oneval(sdb, PZ_ELEMENTS);
265     if (elements && *elements)
266         ZOOM_resultset_option_set(set, "elementSetName", elements);
267
268     ZOOM_resultset_records(set, 0, offset-1, 1);
269     cl->show_raw->active = 1;
270
271     connection_continue(co);
272 }
273
274 static int nativesyntax_to_type(struct session_database *sdb, char *type)
275 {
276     const char *s = session_setting_oneval(sdb, PZ_NATIVESYNTAX);
277
278     if (s && *s)
279     {
280         if (!strncmp(s, "iso2709", 7))
281         {
282             const char *cp = strchr(s, ';');
283             yaz_snprintf(type, 80, "xml; charset=%s", cp ? cp+1 : "marc-8s");
284         }
285         else if (!strncmp(s, "xml", 3))
286         {
287             strcpy(type, "xml");
288         }
289         else
290             return -1;
291         return 0;
292     }
293     return -1;
294 }
295
296 static void ingest_raw_record(struct client *cl, ZOOM_record rec)
297 {
298     const char *buf;
299     int len;
300     char type[80];
301
302     if (cl->show_raw->binary)
303         strcpy(type, "raw");
304     else
305     {
306         struct session_database *sdb = client_get_database(cl);
307         nativesyntax_to_type(sdb, type);
308     }
309
310     buf = ZOOM_record_get(rec, type, &len);
311     cl->show_raw->record_handler(cl->show_raw->data,  buf, len);
312     client_show_raw_dequeue(cl);
313 }
314
315 void client_search_response(struct client *cl)
316 {
317     struct connection *co = cl->connection;
318     struct session *se = cl->session;
319     ZOOM_connection link = connection_get_link(co);
320     ZOOM_resultset resultset = connection_get_resultset(co);
321     const char *error, *addinfo;
322
323     if (ZOOM_connection_error(link, &error, &addinfo))
324     {
325         cl->hits = 0;
326         client_set_state(cl, Client_Error);
327         yaz_log(YLOG_WARN, "Search error %s (%s): %s",
328             error, addinfo, client_get_url(cl));
329     }
330     else
331     {
332         cl->record_offset = 0;
333         cl->hits = ZOOM_resultset_size(resultset);
334         se->total_hits += cl->hits;
335     }
336 }
337
338
339 void client_record_response(struct client *cl)
340 {
341     struct connection *co = cl->connection;
342     ZOOM_connection link = connection_get_link(co);
343     ZOOM_resultset resultset = connection_get_resultset(co);
344     const char *error, *addinfo;
345
346     if (ZOOM_connection_error(link, &error, &addinfo))
347     {
348         client_set_state(cl, Client_Error);
349         yaz_log(YLOG_WARN, "Search error %s (%s): %s",
350             error, addinfo, client_get_url(cl));
351     }
352     else
353     {
354         ZOOM_record rec = 0;
355         const char *msg, *addinfo;
356         
357         if (cl->show_raw && cl->show_raw->active)
358         {
359             if ((rec = ZOOM_resultset_record(resultset,
360                                              cl->show_raw->position-1)))
361             {
362                 cl->show_raw->active = 0;
363                 ingest_raw_record(cl, rec);
364             }
365             else
366             {
367                 yaz_log(YLOG_WARN, "Expected record, but got NULL, offset=%d",
368                         cl->show_raw->position-1);
369             }
370         }
371         else
372         {
373             int offset = cl->record_offset;
374             if ((rec = ZOOM_resultset_record(resultset, offset)))
375             {
376                 cl->record_offset++;
377                 if (ZOOM_record_error(rec, &msg, &addinfo, 0))
378                     yaz_log(YLOG_WARN, "Record error %s (%s): %s (rec #%d)",
379                             error, addinfo, client_get_url(cl),
380                             cl->record_offset);
381                 else
382                 {
383                     struct session_database *sdb = client_get_database(cl);
384                     const char *xmlrec;
385                     char type[80];
386                     nativesyntax_to_type(sdb, type);
387                     if ((xmlrec = ZOOM_record_get(rec, type, NULL)))
388                     {
389                         if (ingest_record(cl, xmlrec, cl->record_offset))
390                         {
391                             session_alert_watch(cl->session, SESSION_WATCH_SHOW);
392                             session_alert_watch(cl->session, SESSION_WATCH_RECORD);
393                         }
394                         else
395                             yaz_log(YLOG_WARN, "Failed to ingest");
396                     }
397                     else
398                         yaz_log(YLOG_WARN, "Failed to extract ZOOM record");
399                 }
400
401             }
402             else
403             {
404                 yaz_log(YLOG_WARN, "Expected record, but got NULL, offset=%d",
405                         offset);
406             }
407         }
408     }
409 }
410
411 void client_start_search(struct client *cl)
412 {
413     struct session_database *sdb = client_get_database(cl);
414     struct connection *co = client_get_connection(cl);
415     ZOOM_connection link = connection_get_link(co);
416     ZOOM_resultset rs;
417     char *databaseName = sdb->database->databases[0];
418     const char *opt_piggyback = session_setting_oneval(sdb, PZ_PIGGYBACK);
419     const char *opt_queryenc = session_setting_oneval(sdb, PZ_QUERYENCODING);
420     const char *opt_elements = session_setting_oneval(sdb, PZ_ELEMENTS);
421     const char *opt_requestsyn = session_setting_oneval(sdb, PZ_REQUESTSYNTAX);
422     const char *opt_maxrecs = session_setting_oneval(sdb, PZ_MAXRECS);
423     const char *opt_sru = session_setting_oneval(sdb, PZ_SRU);
424
425     assert(link);
426
427     cl->hits = -1;
428     cl->record_offset = 0;
429     cl->diagnostic = 0;
430     client_set_state(cl, Client_Working);
431
432     if (*opt_piggyback)
433         ZOOM_connection_option_set(link, "piggyback", opt_piggyback);
434     else
435         ZOOM_connection_option_set(link, "piggyback", "1");
436     if (*opt_queryenc)
437         ZOOM_connection_option_set(link, "rpnCharset", opt_queryenc);
438     if (*opt_sru && *opt_elements)
439         ZOOM_connection_option_set(link, "schema", opt_elements);
440     else if (*opt_elements)
441         ZOOM_connection_option_set(link, "elementSetName", opt_elements);
442     if (*opt_requestsyn)
443         ZOOM_connection_option_set(link, "preferredRecordSyntax", opt_requestsyn);
444     if (*opt_maxrecs)
445         ZOOM_connection_option_set(link, "count", opt_maxrecs);
446     else
447     {
448         char n[128];
449         sprintf(n, "%d", global_parameters.toget);
450         ZOOM_connection_option_set(link, "count", n);
451     }
452     if (databaseName)
453         ZOOM_connection_option_set(link, "databaseName", databaseName);
454
455     ZOOM_connection_option_set(link, "presentChunk", "20");
456
457     if (cl->cqlquery)
458     {
459         yaz_log(YLOG_LOG, "Search %s CQL: %s", sdb->database->url, cl->cqlquery);
460         ZOOM_query q = ZOOM_query_create();
461         ZOOM_query_cql(q, cl->cqlquery);
462         rs = ZOOM_connection_search(link, q);
463         ZOOM_query_destroy(q);
464     }
465     else
466     {
467         yaz_log(YLOG_LOG, "Search %s PQF: %s", sdb->database->url, cl->pquery);
468         rs = ZOOM_connection_search_pqf(link, cl->pquery);
469     }
470     connection_set_resultset(co, rs);
471     connection_continue(co);
472 }
473
474 struct client *client_create(void)
475 {
476     struct client *r;
477     if (client_freelist)
478     {
479         r = client_freelist;
480         client_freelist = client_freelist->next;
481     }
482     else
483         r = xmalloc(sizeof(struct client));
484     r->pquery = 0;
485     r->cqlquery = 0;
486     r->database = 0;
487     r->connection = 0;
488     r->session = 0;
489     r->hits = 0;
490     r->record_offset = 0;
491     r->diagnostic = 0;
492     r->state = Client_Disconnected;
493     r->show_raw = 0;
494     r->next = 0;
495     return r;
496 }
497
498 void client_destroy(struct client *c)
499 {
500     struct session *se = c->session;
501     if (c == se->clients)
502         se->clients = c->next;
503     else
504     {
505         struct client *cc;
506         for (cc = se->clients; cc && cc->next != c; cc = cc->next)
507             ;
508         if (cc)
509             cc->next = c->next;
510     }
511     xfree(c->pquery);
512     xfree(c->cqlquery);
513
514     if (c->connection)
515         connection_release(c->connection);
516     c->next = client_freelist;
517     client_freelist = c;
518 }
519
520 void client_set_connection(struct client *cl, struct connection *con)
521 {
522     cl->connection = con;
523 }
524
525 void client_disconnect(struct client *cl)
526 {
527     if (cl->state != Client_Idle)
528         client_set_state(cl, Client_Disconnected);
529     client_set_connection(cl, 0);
530 }
531
532 // Extract terms from query into null-terminated termlist
533 static void extract_terms(NMEM nmem, struct ccl_rpn_node *query, char **termlist)
534 {
535     int num = 0;
536
537     pull_terms(nmem, query, termlist, &num);
538     termlist[num] = 0;
539 }
540
541 // Initialize CCL map for a target
542 static CCL_bibset prepare_cclmap(struct client *cl)
543 {
544     struct session_database *sdb = client_get_database(cl);
545     struct setting *s;
546     CCL_bibset res;
547
548     if (!sdb->settings)
549         return 0;
550     res = ccl_qual_mk();
551     for (s = sdb->settings[PZ_CCLMAP]; s; s = s->next)
552     {
553         char *p = strchr(s->name + 3, ':');
554         if (!p)
555         {
556             yaz_log(YLOG_WARN, "Malformed cclmap name: %s", s->name);
557             ccl_qual_rm(&res);
558             return 0;
559         }
560         p++;
561         ccl_qual_fitem(res, s->value, p);
562     }
563     return res;
564 }
565
566 // returns a xmalloced CQL query corresponding to the pquery in client
567 static char *make_cqlquery(struct client *cl)
568 {
569     cql_transform_t cqlt = cql_transform_create();
570     Z_RPNQuery *zquery;
571     char *r;
572     WRBUF wrb = wrbuf_alloc();
573     int status;
574
575     zquery = p_query_rpn(global_parameters.odr_out, cl->pquery);
576     if ((status = cql_transform_rpn2cql_wrbuf(cqlt, wrb, zquery)))
577     {
578         yaz_log(YLOG_WARN, "failed to generate CQL query, code=%d", status);
579         return 0;
580     }
581     r = xstrdup(wrbuf_cstr(wrb));
582
583     wrbuf_destroy(wrb);
584     odr_reset(global_parameters.odr_out); // releases the zquery
585     cql_transform_close(cqlt);
586     return r;
587 }
588
589 // Parse the query given the settings specific to this client
590 int client_parse_query(struct client *cl, const char *query)
591 {
592     struct session *se = client_get_session(cl);
593     struct session_database *sdb = client_get_database(cl);
594     struct ccl_rpn_node *cn;
595     int cerror, cpos;
596     CCL_bibset ccl_map = prepare_cclmap(cl);
597     const char *sru = session_setting_oneval(sdb, PZ_SRU);
598     const char *pqf_prefix = session_setting_oneval(sdb, PZ_PQF_PREFIX);
599
600     if (!ccl_map)
601         return -1;
602
603     cn = ccl_find_str(ccl_map, query, &cerror, &cpos);
604     ccl_qual_rm(&ccl_map);
605     if (!cn)
606     {
607         client_set_state(cl, Client_Error);
608         yaz_log(YLOG_WARN, "Failed to parse query for %s",
609                          client_get_database(cl)->database->url);
610         return -1;
611     }
612     wrbuf_rewind(se->wrbuf);
613     if (*pqf_prefix)
614     {
615         wrbuf_puts(se->wrbuf, pqf_prefix);
616         wrbuf_puts(se->wrbuf, " ");
617     }
618     ccl_pquery(se->wrbuf, cn);
619     xfree(cl->pquery);
620     cl->pquery = xstrdup(wrbuf_cstr(se->wrbuf));
621
622     xfree(cl->cqlquery);
623     if (*sru)
624     {
625         if (!(cl->cqlquery = make_cqlquery(cl)))
626             return -1;
627     }
628     else
629         cl->cqlquery = 0;
630
631     if (!se->relevance)
632     {
633         // Initialize relevance structure with query terms
634         char *p[512];
635         extract_terms(se->nmem, cn, p);
636         se->relevance = relevance_create(
637             global_parameters.server->relevance_pct,
638             se->nmem, (const char **) p,
639             se->expected_maxrecs);
640     }
641
642     ccl_rpn_delete(cn);
643     return 0;
644 }
645
646 void client_set_session(struct client *cl, struct session *se)
647 {
648     cl->session = se;
649     cl->next = se->clients;
650     se->clients = cl;
651 }
652
653 int client_is_active(struct client *cl)
654 {
655     if (cl->connection && (cl->state == Client_Connecting ||
656                            cl->state == Client_Working))
657         return 1;
658     return 0;
659 }
660
661 struct client *client_next_in_session(struct client *cl)
662 {
663     if (cl)
664         return cl->next;
665     return 0;
666
667 }
668
669 int client_get_hits(struct client *cl)
670 {
671     return cl->hits;
672 }
673
674 int client_get_num_records(struct client *cl)
675 {
676     return cl->record_offset;
677 }
678
679 int client_get_diagnostic(struct client *cl)
680 {
681     return cl->diagnostic;
682 }
683
684 void client_set_database(struct client *cl, struct session_database *db)
685 {
686     cl->database = db;
687 }
688
689 struct host *client_get_host(struct client *cl)
690 {
691     return client_get_database(cl)->database->host;
692 }
693
694 const char *client_get_url(struct client *cl)
695 {
696     return client_get_database(cl)->database->url;
697 }
698
699 /*
700  * Local variables:
701  * c-basic-offset: 4
702  * indent-tabs-mode: nil
703  * End:
704  * vim: shiftwidth=4 tabstop=8 expandtab
705  */