Changed sscanf in urldecode to use more portable scan-spec.
[pazpar2-moved-to-github.git] / src / http.c
1 /* This file is part of Pazpar2.
2    Copyright (C) 2006-2008 Index Data
3
4 Pazpar2 is free software; you can redistribute it and/or modify it under
5 the terms of the GNU General Public License as published by the Free
6 Software Foundation; either version 2, or (at your option) any later
7 version.
8
9 Pazpar2 is distributed in the hope that it will be useful, but WITHOUT ANY
10 WARRANTY; without even the implied warranty of MERCHANTABILITY or
11 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
12 for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 */
19
20 #if HAVE_CONFIG_H
21 #include <config.h>
22 #endif
23
24 #include <stdio.h>
25 #ifdef WIN32
26 #include <winsock.h>
27 typedef int socklen_t;
28 #endif
29
30 #if HAVE_SYS_SOCKET_H
31 #include <sys/socket.h>
32 #endif
33
34 #include <sys/types.h>
35
36 #include <yaz/snprintf.h>
37 #if HAVE_UNISTD_H
38 #include <unistd.h>
39 #endif
40
41 #include <stdlib.h>
42 #include <string.h>
43 #include <ctype.h>
44 #include <fcntl.h>
45 #if HAVE_NETDB_H
46 #include <netdb.h>
47 #endif
48
49 #include <errno.h>
50 #include <assert.h>
51 #include <string.h>
52
53 #if HAVE_NETINET_IN_H
54 #include <netinet/in.h>
55 #endif
56
57 #if HAVE_ARPA_INET_H
58 #include <arpa/inet.h>
59 #endif
60
61 #include <yaz/yaz-util.h>
62 #include <yaz/comstack.h>
63 #include <yaz/nmem.h>
64
65 #include "util.h"
66 #include "eventl.h"
67 #include "pazpar2.h"
68 #include "http.h"
69 #include "http_command.h"
70
71 #define MAX_HTTP_HEADER 4096
72
73 static void proxy_io(IOCHAN i, int event);
74 static struct http_channel *http_create(const char *addr);
75 static void http_destroy(IOCHAN i);
76
77 // If this is set, we proxy normal HTTP requests
78 static struct sockaddr_in *proxy_addr = 0; 
79 static char proxy_url[256] = "";
80 static char myurl[256] = "";
81 static struct http_buf *http_buf_freelist = 0;
82 static struct http_channel *http_channel_freelist = 0;
83
84 struct http_channel_observer_s {
85     void *data;
86     void *data2;
87     http_channel_destroy_t destroy;
88     struct http_channel_observer_s *next;
89     struct http_channel *chan;
90 };
91
92
93 static const char *http_lookup_header(struct http_header *header,
94                                       const char *name)
95 {
96     for (; header; header = header->next)
97         if (!strcasecmp(name, header->name))
98             return header->value;
99     return 0;
100 }
101
102 static struct http_buf *http_buf_create()
103 {
104     struct http_buf *r;
105
106     if (http_buf_freelist)
107     {
108         r = http_buf_freelist;
109         http_buf_freelist = http_buf_freelist->next;
110     }
111     else
112         r = xmalloc(sizeof(struct http_buf));
113     r->offset = 0;
114     r->len = 0;
115     r->next = 0;
116     return r;
117 }
118
119 static void http_buf_destroy(struct http_buf *b)
120 {
121     b->next = http_buf_freelist;
122     http_buf_freelist = b;
123 }
124
125 static void http_buf_destroy_queue(struct http_buf *b)
126 {
127     struct http_buf *p;
128     while (b)
129     {
130         p = b->next;
131         http_buf_destroy(b);
132         b = p;
133     }
134 }
135
136 static struct http_buf *http_buf_bybuf(char *b, int len)
137 {
138     struct http_buf *res = 0;
139     struct http_buf **p = &res;
140
141     while (len)
142     {
143         int tocopy = len;
144         if (tocopy > HTTP_BUF_SIZE)
145             tocopy = HTTP_BUF_SIZE;
146         *p = http_buf_create();
147         memcpy((*p)->buf, b, tocopy);
148         (*p)->len = tocopy;
149         len -= tocopy;
150         b += tocopy;
151         p = &(*p)->next;
152     }
153     return res;
154 }
155
156 // Add a (chain of) buffers to the end of an existing queue.
157 static void http_buf_enqueue(struct http_buf **queue, struct http_buf *b)
158 {
159     while (*queue)
160         queue = &(*queue)->next;
161     *queue = b;
162 }
163
164 static struct http_buf *http_buf_bywrbuf(WRBUF wrbuf)
165 {
166     // Heavens to Betsy (buf)!
167     return http_buf_bybuf(wrbuf_buf(wrbuf), wrbuf_len(wrbuf));
168 }
169
170 // Non-destructively collapse chain of buffers into a string (max *len)
171 // Return
172 static void http_buf_peek(struct http_buf *b, char *buf, int len)
173 {
174     int rd = 0;
175     while (b && rd < len)
176     {
177         int toread = len - rd;
178         if (toread > b->len)
179             toread = b->len;
180         memcpy(buf + rd, b->buf + b->offset, toread);
181         rd += toread;
182         b = b->next;
183     }
184     buf[rd] = '\0';
185 }
186
187 static int http_buf_size(struct http_buf *b)
188 {
189     int sz = 0;
190     for (; b; b = b->next)
191         sz += b->len;
192     return sz;
193 }
194
195 // Ddestructively munch up to len  from head of queue.
196 static int http_buf_read(struct http_buf **b, char *buf, int len)
197 {
198     int rd = 0;
199     while ((*b) && rd < len)
200     {
201         int toread = len - rd;
202         if (toread > (*b)->len)
203             toread = (*b)->len;
204         memcpy(buf + rd, (*b)->buf + (*b)->offset, toread);
205         rd += toread;
206         if (toread < (*b)->len)
207         {
208             (*b)->len -= toread;
209             (*b)->offset += toread;
210             break;
211         }
212         else
213         {
214             struct http_buf *n = (*b)->next;
215             http_buf_destroy(*b);
216             *b = n;
217         }
218     }
219     buf[rd] = '\0';
220     return rd;
221 }
222
223 // Buffers may overlap.
224 static void urldecode(char *i, char *o)
225 {
226     while (*i)
227     {
228         if (*i == '+')
229         {
230             *(o++) = ' ';
231             i++;
232         }
233         else if (*i == '%' && i[1] && i[2])
234         {
235             int v;
236             i++;
237             sscanf(i, "%2x", &v);
238             *o++ = v;
239             i += 2;
240         }
241         else
242             *(o++) = *(i++);
243     }
244     *o = '\0';
245 }
246
247 // Warning: Buffers may not overlap
248 void urlencode(const char *i, char *o)
249 {
250     while (*i)
251     {
252         if (strchr(" /:", *i))
253         {
254             sprintf(o, "%%%.2X", (int) *i);
255             o += 3;
256         }
257         else
258             *(o++) = *i;
259         i++;
260     }
261     *o = '\0';
262 }
263
264 void http_addheader(struct http_response *r, const char *name, const char *value)
265 {
266     struct http_channel *c = r->channel;
267     struct http_header *h = nmem_malloc(c->nmem, sizeof *h);
268     h->name = nmem_strdup(c->nmem, name);
269     h->value = nmem_strdup(c->nmem, value);
270     h->next = r->headers;
271     r->headers = h;
272 }
273
274 char *http_argbyname(struct http_request *r, char *name)
275 {
276     struct http_argument *p;
277     if (!name)
278         return 0;
279     for (p = r->arguments; p; p = p->next)
280         if (!strcmp(p->name, name))
281             return p->value;
282     return 0;
283 }
284
285 char *http_headerbyname(struct http_header *h, char *name)
286 {
287     for (; h; h = h->next)
288         if (!strcmp(h->name, name))
289             return h->value;
290     return 0;
291 }
292
293 struct http_response *http_create_response(struct http_channel *c)
294 {
295     struct http_response *r = nmem_malloc(c->nmem, sizeof(*r));
296     strcpy(r->code, "200");
297     r->msg = "OK";
298     r->channel = c;
299     r->headers = 0;
300     r->payload = 0;
301     r->content_type = "text/xml";
302     return r;
303 }
304
305
306 static const char *next_crlf(const char *cp, size_t *skipped)
307 {
308     const char *next_cp = strchr(cp, '\n');
309     if (next_cp)
310     {
311         if (next_cp > cp && next_cp[-1] == '\r')
312             *skipped = next_cp - cp - 1;
313         else
314             *skipped = next_cp - cp;
315         next_cp++;
316     }
317     return next_cp;
318 }
319
320 // Check if buf contains a package (minus payload)
321 static int package_check(const char *buf, int sz)
322 {
323     int content_len = 0;
324     int len = 0;
325
326     while (*buf)
327     {
328         size_t skipped = 0;
329         const char *b = next_crlf(buf, &skipped);
330
331         if (!b)
332         {
333             // we did not find CRLF.. See if buffer is too large..
334             if (sz >= MAX_HTTP_HEADER-1)
335                 return MAX_HTTP_HEADER-1; // yes. Return that (will fail later)
336             break;
337         }
338         len += (b - buf);
339         if (skipped == 0)
340         {
341             // CRLF CRLF , i.e. end of header
342             if (len + content_len <= sz)
343                 return len + content_len;
344             break;
345         }
346         buf = b;
347         // following first skip of \r\n so that we don't consider Method
348         if (!strncasecmp(buf, "Content-Length:", 15))
349         {
350             const char *cp = buf+15;
351             while (*cp == ' ')
352                 cp++;
353             content_len = 0;
354             while (*cp && isdigit(*cp))
355                 content_len = content_len*10 + (*cp++ - '0');
356             if (content_len < 0) /* prevent negative offsets */
357                 content_len = 0;
358         }
359     }
360     return 0;     // incomplete request
361 }
362
363 // Check if we have a request. Return 0 or length
364 static int request_check(struct http_buf *queue)
365 {
366     char tmp[MAX_HTTP_HEADER];
367
368     // only peek at the header..
369     http_buf_peek(queue, tmp, MAX_HTTP_HEADER-1);
370     // still we only return non-zero if the complete request is received..
371     return package_check(tmp, http_buf_size(queue));
372 }
373
374 struct http_response *http_parse_response_buf(struct http_channel *c, const char *buf, int len)
375 {
376     char tmp[MAX_HTTP_HEADER];
377     struct http_response *r = http_create_response(c);
378     char *p, *p2;
379     struct http_header **hp = &r->headers;
380
381     if (len >= MAX_HTTP_HEADER)
382         return 0;
383     memcpy(tmp, buf, len);
384     for (p = tmp; *p && *p != ' '; p++) // Skip HTTP version
385         ;
386     p++;
387     // Response code
388     for (p2 = p; *p2 && *p2 != ' ' && p2 - p < 3; p2++)
389         r->code[p2 - p] = *p2;
390     if (!(p = strstr(tmp, "\r\n")))
391         return 0;
392     p += 2;
393     while (*p)
394     {
395         if (!(p2 = strstr(p, "\r\n")))
396             return 0;
397         if (p == p2) // End of headers
398             break;
399         else
400         {
401             struct http_header *h = *hp = nmem_malloc(c->nmem, sizeof(*h));
402             char *value = strchr(p, ':');
403             if (!value)
404                 return 0;
405             *(value++) = '\0';
406             h->name = nmem_strdup(c->nmem, p);
407             while (isspace(*value))
408                 value++;
409             if (value >= p2)  // Empty header;
410             {
411                 h->value = "";
412                 p = p2 + 2;
413                 continue;
414             }
415             *p2 = '\0';
416             h->value = nmem_strdup(c->nmem, value);
417             h->next = 0;
418             hp = &h->next;
419             p = p2 + 2;
420         }
421     }
422     return r;
423 }
424
425 static int http_parse_arguments(struct http_request *r, NMEM nmem,
426                                 const char *args)
427 {
428     const char *p2 = args;
429
430     while (*p2)
431     {
432         struct http_argument *a;
433         const char *equal = strchr(p2, '=');
434         const char *eoa = strchr(p2, '&');
435         if (!equal)
436         {
437             yaz_log(YLOG_WARN, "Expected '=' in argument");
438             return -1;
439         }
440         if (!eoa)
441             eoa = equal + strlen(equal); // last argument
442         else if (equal > eoa)
443         {
444             yaz_log(YLOG_WARN, "Missing '&' in argument");
445             return -1;
446         }
447         a = nmem_malloc(nmem, sizeof(struct http_argument));
448         a->name = nmem_strdupn(nmem, p2, equal - p2);
449         a->value = nmem_strdupn(nmem, equal+1, eoa - equal - 1);
450         urldecode(a->name, a->name);
451         urldecode(a->value, a->value);
452         a->next = r->arguments;
453         r->arguments = a;
454         p2 = eoa;
455         while (*p2 == '&')
456             p2++;
457     }
458     return 0;
459 }
460
461 struct http_request *http_parse_request(struct http_channel *c,
462                                         struct http_buf **queue,
463                                         int len)
464 {
465     struct http_request *r = nmem_malloc(c->nmem, sizeof(*r));
466     char *p, *p2;
467     char *start = nmem_malloc(c->nmem, len+1);
468     char *buf = start;
469
470     if (http_buf_read(queue, buf, len) < len)
471     {
472         yaz_log(YLOG_WARN, "http_buf_read < len (%d)", len);
473         return 0;
474     }
475     r->search = "";
476     r->channel = c;
477     r->arguments = 0;
478     r->headers = 0;
479     r->content_buf = 0;
480     r->content_len = 0;
481     // Parse first line
482     for (p = buf, p2 = r->method; *p && *p != ' ' && p - buf < 19; p++)
483         *(p2++) = *p;
484     if (*p != ' ')
485     {
486         yaz_log(YLOG_WARN, "Unexpected HTTP method in request");
487         return 0;
488     }
489     *p2 = '\0';
490
491     if (!(buf = strchr(buf, ' ')))
492     {
493         yaz_log(YLOG_WARN, "Missing Request-URI in HTTP request");
494         return 0;
495     }
496     buf++;
497     if (!(p = strchr(buf, ' ')))
498     {
499         yaz_log(YLOG_WARN, "HTTP Request-URI not terminated (too long?)");
500         return 0;
501     }
502     *(p++) = '\0';
503     if ((p2 = strchr(buf, '?'))) // Do we have arguments?
504         *(p2++) = '\0';
505     r->path = nmem_strdup(c->nmem, buf);
506     if (p2)
507     {
508         r->search = nmem_strdup(c->nmem, p2);
509         // Parse Arguments
510         http_parse_arguments(r, c->nmem, p2);
511     }
512     buf = p;
513
514     if (strncmp(buf, "HTTP/", 5))
515         strcpy(r->http_version, "1.0");
516     else
517     {
518         size_t skipped;
519         buf += 5; // strlen("HTTP/")
520
521         p = (char*) next_crlf(buf, &skipped);
522         if (!p || skipped < 3 || skipped > 5)
523             return 0;
524
525         memcpy(r->http_version, buf, skipped);
526         r->http_version[skipped] = '\0';
527         buf = p;
528     }
529     strcpy(c->version, r->http_version);
530
531     r->headers = 0;
532     while (*buf)
533     {
534         size_t skipped;
535
536         p = (char *) next_crlf(buf, &skipped);
537         if (!p)
538         {
539             return 0;
540         }
541         else if (skipped == 0)
542         {
543             buf = p;
544             break;
545         }
546         else
547         {
548             char *cp;
549             char *n_v = nmem_malloc(c->nmem, skipped+1);
550             struct http_header *h = nmem_malloc(c->nmem, sizeof(*h));
551
552             memcpy(n_v, buf, skipped);
553             n_v[skipped] = '\0';
554
555             if (!(cp = strchr(n_v, ':')))
556                 return 0;
557             h->name = nmem_strdupn(c->nmem, n_v, cp - n_v);
558             cp++;
559             while (isspace(*cp))
560                 cp++;
561             h->value = nmem_strdup(c->nmem, cp);
562             h->next = r->headers;
563             r->headers = h;
564             buf = p;
565         }
566     }
567
568     // determine if we do keep alive
569     if (!strcmp(c->version, "1.0"))
570     {
571         const char *v = http_lookup_header(r->headers, "Connection");
572         if (v && !strcmp(v, "Keep-Alive"))
573             c->keep_alive = 1;
574         else
575             c->keep_alive = 0;
576     }
577     else
578     {
579         const char *v = http_lookup_header(r->headers, "Connection");
580         if (v && !strcmp(v, "close"))
581             c->keep_alive = 0;
582         else
583             c->keep_alive = 1;
584     }
585     if (buf < start + len)
586     {
587         const char *content_type = http_lookup_header(r->headers,
588                                                       "Content-Type");
589         r->content_len = start + len - buf;
590         r->content_buf = buf;
591
592         if (!strcmp(content_type, "application/x-www-form-urlencoded"))
593         {
594             http_parse_arguments(r, c->nmem, r->content_buf);
595         }
596     }
597     return r;
598 }
599
600 static struct http_buf *http_serialize_response(struct http_channel *c,
601         struct http_response *r)
602 {
603     struct http_header *h;
604
605     wrbuf_rewind(c->wrbuf);
606     wrbuf_printf(c->wrbuf, "HTTP/%s %s %s\r\n", c->version, r->code, r->msg);
607     for (h = r->headers; h; h = h->next)
608         wrbuf_printf(c->wrbuf, "%s: %s\r\n", h->name, h->value);
609     if (r->payload)
610     {
611         wrbuf_printf(c->wrbuf, "Content-Length: %d\r\n", r->payload ?
612                 (int) strlen(r->payload) : 0);
613         wrbuf_printf(c->wrbuf, "Content-Type: %s\r\n", r->content_type);
614         if (!strcmp(r->content_type, "text/xml"))
615         {
616             xmlDoc *doc = xmlParseMemory(r->payload, strlen(r->payload));
617             if (doc)
618             {
619                 xmlFreeDoc(doc);
620             }
621             else
622             {
623                 yaz_log(YLOG_WARN, "Sending non-wellformed "
624                         "response (bug #1162");
625                 yaz_log(YLOG_WARN, "payload: %s", r->payload);
626             }
627         }
628     }
629     wrbuf_puts(c->wrbuf, "\r\n");
630
631     if (r->payload)
632         wrbuf_puts(c->wrbuf, r->payload);
633
634     return http_buf_bywrbuf(c->wrbuf);
635 }
636
637 // Serialize a HTTP request
638 static struct http_buf *http_serialize_request(struct http_request *r)
639 {
640     struct http_channel *c = r->channel;
641     struct http_header *h;
642
643     wrbuf_rewind(c->wrbuf);
644     wrbuf_printf(c->wrbuf, "%s %s%s%s", r->method, r->path,
645                  *r->search ? "?" : "", r->search);
646
647     wrbuf_printf(c->wrbuf, " HTTP/%s\r\n", r->http_version);
648
649     for (h = r->headers; h; h = h->next)
650         wrbuf_printf(c->wrbuf, "%s: %s\r\n", h->name, h->value);
651
652     wrbuf_puts(c->wrbuf, "\r\n");
653
654     if (r->content_buf)
655         wrbuf_write(c->wrbuf, r->content_buf, r->content_len);
656
657 #if 0
658     yaz_log(YLOG_LOG, "WRITING TO PROXY:\n%s\n----",
659             wrbuf_cstr(c->wrbuf));
660 #endif
661     return http_buf_bywrbuf(c->wrbuf);
662 }
663
664
665 static int http_weshouldproxy(struct http_request *rq)
666 {
667     if (proxy_addr && !strstr(rq->path, "search.pz2"))
668         return 1;
669     return 0;
670 }
671
672
673 struct http_header * http_header_append(struct http_channel *ch, 
674                                         struct http_header * hp, 
675                                         const char *name, 
676                                         const char *value)
677 {
678     struct http_header *hpnew = 0; 
679
680     if (!hp | !ch)
681         return 0;
682
683     while (hp && hp->next)
684         hp = hp->next;
685
686     if(name && strlen(name)&& value && strlen(value)){
687         hpnew = nmem_malloc(ch->nmem, sizeof *hpnew);
688         hpnew->name = nmem_strdup(ch->nmem, name);
689         hpnew->value = nmem_strdup(ch->nmem, value);
690         
691         hpnew->next = 0;
692         hp->next = hpnew;
693         hp = hp->next;
694         
695         return hpnew;
696     }
697
698     return hp;
699 }
700
701    
702 static int is_inprogress(void)
703 {
704 #ifdef WIN32
705     if (WSAGetLastError() == WSAEWOULDBLOCK)
706         return 1;
707 #else
708     if (errno == EINPROGRESS)
709         return 1;
710 #endif
711     return 0;
712
713
714 static void enable_nonblock(int sock)
715 {
716     int flags;
717 #ifdef WIN32
718     flags = (flags & CS_FLAGS_BLOCKING) ? 0 : 1;
719     if (ioctlsocket(sock, FIONBIO, &flags) < 0)
720         yaz_log(YLOG_FATAL|YLOG_ERRNO, "ioctlsocket");
721 #else
722     if ((flags = fcntl(sock, F_GETFL, 0)) < 0) 
723         yaz_log(YLOG_FATAL|YLOG_ERRNO, "fcntl");
724     if (fcntl(sock, F_SETFL, flags | O_NONBLOCK) < 0)
725         yaz_log(YLOG_FATAL|YLOG_ERRNO, "fcntl2");
726 #endif
727 }
728
729 static int http_proxy(struct http_request *rq)
730 {
731     struct http_channel *c = rq->channel;
732     struct http_proxy *p = c->proxy;
733     struct http_header *hp;
734     struct http_buf *requestbuf;
735     char server_via[128] = "";
736     char server_port[16] = "";
737     struct conf_server *ser = global_parameters.server;
738
739     if (!p) // This is a new connection. Create a proxy channel
740     {
741         int sock;
742         struct protoent *pe;
743         int one = 1;
744
745         if (!(pe = getprotobyname("tcp"))) {
746             abort();
747         }
748         if ((sock = socket(PF_INET, SOCK_STREAM, pe->p_proto)) < 0)
749         {
750             yaz_log(YLOG_WARN|YLOG_ERRNO, "socket");
751             return -1;
752         }
753         if (setsockopt(sock, SOL_SOCKET, SO_REUSEADDR, (char*)
754                         &one, sizeof(one)) < 0)
755             abort();
756         enable_nonblock(sock);
757         if (connect(sock, (struct sockaddr *) proxy_addr, 
758                     sizeof(*proxy_addr)) < 0)
759         {
760             if (!is_inprogress()) 
761             {
762                 yaz_log(YLOG_WARN|YLOG_ERRNO, "Proxy connect");
763                 return -1;
764             }
765         }
766         p = xmalloc(sizeof(struct http_proxy));
767         p->oqueue = 0;
768         p->channel = c;
769         p->first_response = 1;
770         c->proxy = p;
771         // We will add EVENT_OUTPUT below
772         p->iochan = iochan_create(sock, proxy_io, EVENT_INPUT);
773         iochan_setdata(p->iochan, p);
774         pazpar2_add_channel(p->iochan);
775     }
776
777     // Do _not_ modify Host: header, just checking it's existence
778
779     if (!http_lookup_header(rq->headers, "Host"))
780     {
781         yaz_log(YLOG_WARN, "Failed to find Host header in proxy");
782         return -1;
783     }
784     
785     // Add new header about paraz2 version, host, remote client address, etc.
786     {
787         hp = rq->headers;
788         hp = http_header_append(c, hp, 
789                                 "X-Pazpar2-Version", PACKAGE_VERSION);
790         hp = http_header_append(c, hp, 
791                                 "X-Pazpar2-Server-Host", ser->host);
792         sprintf(server_port, "%d",  ser->port);
793         hp = http_header_append(c, hp, 
794                                 "X-Pazpar2-Server-Port", server_port);
795         sprintf(server_via,  "1.1 %s:%s (%s/%s)",  
796                 ser->host, server_port, PACKAGE_NAME, PACKAGE_VERSION);
797         hp = http_header_append(c, hp, "Via" , server_via);
798         hp = http_header_append(c, hp, "X-Forwarded-For", c->addr);
799     }
800     
801     requestbuf = http_serialize_request(rq);
802
803     http_buf_enqueue(&p->oqueue, requestbuf);
804     iochan_setflag(p->iochan, EVENT_OUTPUT);
805     return 0;
806 }
807
808 void http_send_response(struct http_channel *ch)
809 {
810     struct http_response *rs = ch->response;
811     struct http_buf *hb;
812
813     assert(rs);
814     hb = http_serialize_response(ch, rs);
815     if (!hb)
816     {
817         yaz_log(YLOG_WARN, "Failed to serialize HTTP response");
818         http_destroy(ch->iochan);
819     }
820     else
821     {
822         http_buf_enqueue(&ch->oqueue, hb);
823         iochan_setflag(ch->iochan, EVENT_OUTPUT);
824         ch->state = Http_Idle;
825     }
826 }
827
828 static void http_error(struct http_channel *hc, int no, const char *msg)
829 {
830     struct http_response *rs = http_create_response(hc);
831
832     hc->response = rs;
833     hc->keep_alive = 0;  // not keeping this HTTP session alive
834
835     sprintf(rs->code, "%d", no);
836
837     rs->msg = nmem_strdup(hc->nmem, msg);
838     rs->payload = nmem_malloc(hc->nmem, 100);
839     yaz_snprintf(rs->payload, 99, "<error>HTTP Error %d: %s</error>\n",
840                  no, msg);
841     http_send_response(hc);
842 }
843
844 static void http_io(IOCHAN i, int event)
845 {
846     struct http_channel *hc = iochan_getdata(i);
847
848     switch (event)
849     {
850         int res, reqlen;
851         struct http_buf *htbuf;
852
853         case EVENT_INPUT:
854             htbuf = http_buf_create();
855             res = recv(iochan_getfd(i), htbuf->buf, HTTP_BUF_SIZE -1, 0);
856             if (res == -1 && errno == EAGAIN)
857             {
858                 http_buf_destroy(htbuf);
859                 return;
860             }
861             if (res <= 0)
862             {
863                 http_buf_destroy(htbuf);
864                 http_destroy(i);
865                 return;
866             }
867             htbuf->buf[res] = '\0';
868             htbuf->len = res;
869             http_buf_enqueue(&hc->iqueue, htbuf);
870
871             while (1)
872             {
873                 if (hc->state == Http_Busy)
874                     return;
875                 reqlen = request_check(hc->iqueue);
876                 if (reqlen <= 2)
877                     return;
878                 // we have a complete HTTP request
879                 nmem_reset(hc->nmem);
880                 if (!(hc->request = http_parse_request(hc, &hc->iqueue, reqlen)))
881                 {
882                     yaz_log(YLOG_WARN, "Failed to parse request");
883                     http_error(hc, 400, "Bad Request");
884                     return;
885                 }
886                 hc->response = 0;
887                 yaz_log(YLOG_LOG, "Request: %s %s%s%s", hc->request->method,
888                         hc->request->path,
889                         *hc->request->search ? "?" : "",
890                         hc->request->search);
891                 if (http_weshouldproxy(hc->request))
892                     http_proxy(hc->request);
893                 else
894                 {
895                     // Execute our business logic!
896                     hc->state = Http_Busy;
897                     http_command(hc);
898                 }
899             }
900             break;
901         case EVENT_OUTPUT:
902             if (hc->oqueue)
903             {
904                 struct http_buf *wb = hc->oqueue;
905                 res = send(iochan_getfd(hc->iochan), wb->buf + wb->offset, wb->len, 0);
906                 if (res <= 0)
907                 {
908                     yaz_log(YLOG_WARN|YLOG_ERRNO, "write");
909                     http_destroy(i);
910                     return;
911                 }
912                 if (res == wb->len)
913                 {
914                     hc->oqueue = hc->oqueue->next;
915                     http_buf_destroy(wb);
916                 }
917                 else
918                 {
919                     wb->len -= res;
920                     wb->offset += res;
921                 }
922                 if (!hc->oqueue) {
923                     if (!hc->keep_alive)
924                     {
925                         http_destroy(i);
926                         return;
927                     }
928                     else
929                     {
930                         iochan_clearflag(i, EVENT_OUTPUT);
931                         if (hc->iqueue)
932                             iochan_setevent(hc->iochan, EVENT_INPUT);
933                     }
934                 }
935             }
936
937             if (!hc->oqueue && hc->proxy && !hc->proxy->iochan) 
938                 http_destroy(i); // Server closed; we're done
939             break;
940         default:
941             yaz_log(YLOG_WARN, "Unexpected event on connection");
942             http_destroy(i);
943     }
944 }
945
946 // Handles I/O on a client connection to a backend web server (proxy mode)
947 static void proxy_io(IOCHAN pi, int event)
948 {
949     struct http_proxy *pc = iochan_getdata(pi);
950     struct http_channel *hc = pc->channel;
951
952     switch (event)
953     {
954         int res;
955         struct http_buf *htbuf;
956
957         case EVENT_INPUT:
958             htbuf = http_buf_create();
959             res = recv(iochan_getfd(pi), htbuf->buf, HTTP_BUF_SIZE -1, 0);
960             if (res == 0 || (res < 0 && !is_inprogress()))
961             {
962                 if (hc->oqueue)
963                 {
964                     yaz_log(YLOG_WARN, "Proxy read came up short");
965                     // Close channel and alert client HTTP channel that we're gone
966                     http_buf_destroy(htbuf);
967 #ifdef WIN32
968                     closesocket(iochan_getfd(pi));
969 #else
970                     close(iochan_getfd(pi));
971 #endif
972                     iochan_destroy(pi);
973                     pc->iochan = 0;
974                 }
975                 else
976                 {
977                     http_destroy(hc->iochan);
978                     return;
979                 }
980             }
981             else
982             {
983                 htbuf->buf[res] = '\0';
984                 htbuf->offset = 0;
985                 htbuf->len = res;
986                 // Write any remaining payload
987                 if (htbuf->len - htbuf->offset > 0)
988                     http_buf_enqueue(&hc->oqueue, htbuf);
989             }
990             iochan_setflag(hc->iochan, EVENT_OUTPUT);
991             break;
992         case EVENT_OUTPUT:
993             if (!(htbuf = pc->oqueue))
994             {
995                 iochan_clearflag(pi, EVENT_OUTPUT);
996                 return;
997             }
998             res = send(iochan_getfd(pi), htbuf->buf + htbuf->offset, htbuf->len, 0);
999             if (res <= 0)
1000             {
1001                 yaz_log(YLOG_WARN|YLOG_ERRNO, "write");
1002                 http_destroy(hc->iochan);
1003                 return;
1004             }
1005             if (res == htbuf->len)
1006             { 
1007                 struct http_buf *np = htbuf->next;
1008                 http_buf_destroy(htbuf);
1009                 pc->oqueue = np;
1010             }
1011             else
1012             {
1013                 htbuf->len -= res;
1014                 htbuf->offset += res;
1015             }
1016
1017             if (!pc->oqueue) {
1018                 iochan_setflags(pi, EVENT_INPUT); // Turns off output flag
1019             }
1020             break;
1021         default:
1022             yaz_log(YLOG_WARN, "Unexpected event on connection");
1023             http_destroy(hc->iochan);
1024     }
1025 }
1026
1027 static void http_fire_observers(struct http_channel *c);
1028 static void http_destroy_observers(struct http_channel *c);
1029
1030 // Cleanup channel
1031 static void http_destroy(IOCHAN i)
1032 {
1033     struct http_channel *s = iochan_getdata(i);
1034
1035     if (s->proxy)
1036     {
1037         if (s->proxy->iochan)
1038         {
1039 #ifdef WIN32
1040             closesocket(iochan_getfd(s->proxy->iochan));
1041 #else
1042             close(iochan_getfd(s->proxy->iochan));
1043 #endif
1044             iochan_destroy(s->proxy->iochan);
1045         }
1046         http_buf_destroy_queue(s->proxy->oqueue);
1047         xfree(s->proxy);
1048     }
1049     http_buf_destroy_queue(s->iqueue);
1050     http_buf_destroy_queue(s->oqueue);
1051     http_fire_observers(s);
1052     http_destroy_observers(s);
1053     s->next = http_channel_freelist;
1054     http_channel_freelist = s;
1055 #ifdef WIN32
1056     closesocket(iochan_getfd(i));
1057 #else
1058     close(iochan_getfd(i));
1059 #endif
1060     iochan_destroy(i);
1061 }
1062
1063 static struct http_channel *http_create(const char *addr)
1064 {
1065     struct http_channel *r = http_channel_freelist;
1066
1067     if (r)
1068     {
1069         http_channel_freelist = r->next;
1070         nmem_reset(r->nmem);
1071         wrbuf_rewind(r->wrbuf);
1072     }
1073     else
1074     {
1075         r = xmalloc(sizeof(struct http_channel));
1076         r->nmem = nmem_create();
1077         r->wrbuf = wrbuf_alloc();
1078     }
1079     r->proxy = 0;
1080     r->iochan = 0;
1081     r->iqueue = r->oqueue = 0;
1082     r->state = Http_Idle;
1083     r->keep_alive = 0;
1084     r->request = 0;
1085     r->response = 0;
1086     if (!addr)
1087     {
1088         yaz_log(YLOG_WARN, "Invalid HTTP forward address");
1089         exit(1);
1090     }
1091     strcpy(r->addr, addr);
1092     r->observers = 0;
1093     return r;
1094 }
1095
1096
1097 /* Accept a new command connection */
1098 static void http_accept(IOCHAN i, int event)
1099 {
1100     struct sockaddr_in addr;
1101     int fd = iochan_getfd(i);
1102     socklen_t len;
1103     int s;
1104     IOCHAN c;
1105     struct http_channel *ch;
1106
1107     len = sizeof addr;
1108     if ((s = accept(fd, (struct sockaddr *) &addr, &len)) < 0)
1109     {
1110         yaz_log(YLOG_WARN|YLOG_ERRNO, "accept");
1111         return;
1112     }
1113     enable_nonblock(s);
1114
1115     yaz_log(YLOG_DEBUG, "New command connection");
1116     c = iochan_create(s, http_io, EVENT_INPUT | EVENT_EXCEPT);
1117     
1118     ch = http_create(inet_ntoa(addr.sin_addr));
1119     ch->iochan = c;
1120     iochan_setdata(c, ch);
1121
1122     pazpar2_add_channel(c);
1123 }
1124
1125 static int listener_socket = 0;
1126
1127 /* Create a http-channel listener, syntax [host:]port */
1128 int http_init(const char *addr)
1129 {
1130     IOCHAN c;
1131     int l;
1132     struct protoent *p;
1133     struct sockaddr_in myaddr;
1134     int one = 1;
1135     const char *pp;
1136     short port;
1137
1138     yaz_log(YLOG_LOG, "HTTP listener %s", addr);
1139
1140     memset(&myaddr, 0, sizeof myaddr);
1141     myaddr.sin_family = AF_INET;
1142     pp = strchr(addr, ':');
1143     if (pp)
1144     {
1145         int len = pp - addr;
1146         char hostname[128];
1147         struct hostent *he;
1148
1149         strncpy(hostname, addr, len);
1150         hostname[len] = '\0';
1151         if (!(he = gethostbyname(hostname))){
1152             yaz_log(YLOG_FATAL, "Unable to resolve '%s'", hostname);
1153             return 1;
1154         }
1155         
1156         memcpy(&myaddr.sin_addr.s_addr, he->h_addr_list[0], he->h_length);
1157         port = atoi(pp + 1);
1158     }
1159     else
1160     {
1161         port = atoi(addr);
1162         myaddr.sin_addr.s_addr = INADDR_ANY;
1163     }
1164
1165     myaddr.sin_port = htons(port);
1166
1167     if (!(p = getprotobyname("tcp"))) {
1168         return 1;
1169     }
1170     if ((l = socket(PF_INET, SOCK_STREAM, p->p_proto)) < 0)
1171         yaz_log(YLOG_FATAL|YLOG_ERRNO, "socket");
1172     if (setsockopt(l, SOL_SOCKET, SO_REUSEADDR, (char*)
1173                     &one, sizeof(one)) < 0)
1174         return 1;
1175
1176     if (bind(l, (struct sockaddr *) &myaddr, sizeof myaddr) < 0) 
1177     {
1178         yaz_log(YLOG_FATAL|YLOG_ERRNO, "bind");
1179         return 1;
1180     }
1181     if (listen(l, SOMAXCONN) < 0) 
1182     {
1183         yaz_log(YLOG_FATAL|YLOG_ERRNO, "listen");
1184         return 1;
1185     }
1186
1187     listener_socket = l;
1188
1189     c = iochan_create(l, http_accept, EVENT_INPUT | EVENT_EXCEPT);
1190     pazpar2_add_channel(c);
1191     return 0;
1192 }
1193
1194 void http_close_server(void)
1195 {
1196     /* break the event_loop (select) by closing down the HTTP listener sock */
1197     if (listener_socket)
1198     {
1199 #ifdef WIN32
1200         closesocket(listener_socket);
1201 #else
1202         close(listener_socket);
1203 #endif
1204     }
1205 }
1206
1207 void http_set_proxyaddr(char *host, char *base_url)
1208 {
1209     char *p;
1210     short port;
1211     struct hostent *he;
1212
1213     strcpy(myurl, base_url);
1214     strcpy(proxy_url, host);
1215     p = strchr(host, ':');
1216     yaz_log(YLOG_DEBUG, "Proxying for %s", host);
1217     yaz_log(YLOG_LOG, "HTTP backend  %s", proxy_url);
1218     if (p) {
1219         port = atoi(p + 1);
1220         *p = '\0';
1221     }
1222     else
1223         port = 80;
1224     if (!(he = gethostbyname(host))) 
1225     {
1226         fprintf(stderr, "Failed to lookup '%s'\n", host);
1227         exit(1);
1228     }
1229     proxy_addr = xmalloc(sizeof(struct sockaddr_in));
1230     proxy_addr->sin_family = he->h_addrtype;
1231     memcpy(&proxy_addr->sin_addr.s_addr, he->h_addr_list[0], he->h_length);
1232     proxy_addr->sin_port = htons(port);
1233 }
1234
1235 static void http_fire_observers(struct http_channel *c)
1236 {
1237     http_channel_observer_t p = c->observers;
1238     while (p)
1239     {
1240         p->destroy(p->data, c, p->data2);
1241         p = p->next;
1242     }
1243 }
1244
1245 static void http_destroy_observers(struct http_channel *c)
1246 {
1247     while (c->observers)
1248     {
1249         http_channel_observer_t obs = c->observers;
1250         c->observers = obs->next;
1251         xfree(obs);
1252     }
1253 }
1254
1255 http_channel_observer_t http_add_observer(struct http_channel *c, void *data,
1256                                           http_channel_destroy_t des)
1257 {
1258     http_channel_observer_t obs = xmalloc(sizeof(*obs));
1259     obs->chan = c;
1260     obs->data = data;
1261     obs->data2 = 0;
1262     obs->destroy= des;
1263     obs->next = c->observers;
1264     c->observers = obs;
1265     return obs;
1266 }
1267
1268 void http_remove_observer(http_channel_observer_t obs)
1269 {
1270     struct http_channel *c = obs->chan;
1271     http_channel_observer_t found, *p = &c->observers;
1272     while (*p != obs)
1273         p = &(*p)->next;
1274     found = *p;
1275     assert(found);
1276     *p = (*p)->next;
1277     xfree(found);
1278 }
1279
1280 struct http_channel *http_channel_observer_chan(http_channel_observer_t obs)
1281 {
1282     return obs->chan;
1283 }
1284
1285 void http_observer_set_data2(http_channel_observer_t obs, void *data2)
1286 {
1287     obs->data2 = data2;
1288 }
1289
1290
1291 /*
1292  * Local variables:
1293  * c-basic-offset: 4
1294  * indent-tabs-mode: nil
1295  * End:
1296  * vim: shiftwidth=4 tabstop=8 expandtab
1297  */