Implement z_HTTP_header_remove
[yaz-moved-to-github.git] / src / http.c
1 /* This file is part of the YAZ toolkit.
2  * Copyright (C) 1995-2013 Index Data
3  * See the file LICENSE for details.
4  */
5 /**
6  * \file http.c
7  * \brief Implements HTTP decoding
8  */
9 #if HAVE_CONFIG_H
10 #include <config.h>
11 #endif
12
13 #include <yaz/odr.h>
14 #include <yaz/yaz-version.h>
15 #include <yaz/yaz-iconv.h>
16 #include <yaz/matchstr.h>
17 #include <yaz/zgdu.h>
18 #include <yaz/base64.h>
19
20 static int decode_headers_content(ODR o, int off, Z_HTTP_Header **headers,
21                                   char **content_buf, int *content_len)
22 {
23     int i = off;
24     int chunked = 0;
25
26     *headers = 0;
27     while (i < o->size-1 && o->buf[i] == '\n')
28     {
29         int po;
30         i++;
31         if (o->buf[i] == '\r' && i < o->size-1 && o->buf[i+1] == '\n')
32         {
33             i++;
34             break;
35         }
36         if (o->buf[i] == '\n')
37             break;
38         for (po = i; ; i++)
39         {
40             if (i == o->size)
41             {
42                 o->error = OHTTP;
43                 return 0;
44             }
45             else if (o->buf[i] == ':')
46                 break;
47         }
48         *headers = (Z_HTTP_Header *) odr_malloc(o, sizeof(**headers));
49         (*headers)->name = (char*) odr_malloc(o, i - po + 1);
50         memcpy ((*headers)->name, o->buf + po, i - po);
51         (*headers)->name[i - po] = '\0';
52         i++;
53         while (i < o->size-1 && o->buf[i] == ' ')
54             i++;
55         for (po = i; i < o->size-1 && !strchr("\r\n", o->buf[i]); i++)
56             ;
57
58         (*headers)->value = (char*) odr_malloc(o, i - po + 1);
59         memcpy ((*headers)->value, o->buf + po, i - po);
60         (*headers)->value[i - po] = '\0';
61
62         if (!yaz_strcasecmp((*headers)->name, "Transfer-Encoding")
63             &&
64             !yaz_strcasecmp((*headers)->value, "chunked"))
65             chunked = 1;
66         headers = &(*headers)->next;
67         if (i < o->size-1 && o->buf[i] == '\r')
68             i++;
69     }
70     *headers = 0;
71     if (o->buf[i] != '\n')
72     {
73         o->error = OHTTP;
74         return 0;
75     }
76     i++;
77
78     if (chunked)
79     {
80         int off = 0;
81
82         /* we know buffer will be smaller than o->size - i*/
83         *content_buf = (char*) odr_malloc(o, o->size - i);
84
85         while (1)
86         {
87             /* chunk length .. */
88             int chunk_len = 0;
89             for (; i  < o->size-2; i++)
90                 if (yaz_isdigit(o->buf[i]))
91                     chunk_len = chunk_len * 16 +
92                         (o->buf[i] - '0');
93                 else if (yaz_isupper(o->buf[i]))
94                     chunk_len = chunk_len * 16 +
95                         (o->buf[i] - ('A'-10));
96                 else if (yaz_islower(o->buf[i]))
97                     chunk_len = chunk_len * 16 +
98                         (o->buf[i] - ('a'-10));
99                 else
100                     break;
101             /* chunk extension ... */
102             while (o->buf[i] != '\r' && o->buf[i+1] != '\n')
103             {
104                 if (i >= o->size-2)
105                 {
106                     o->error = OHTTP;
107                     return 0;
108                 }
109                 i++;
110             }
111             i += 2;  /* skip CRLF */
112             if (chunk_len == 0)
113                 break;
114             if (chunk_len < 0 || off + chunk_len > o->size)
115             {
116                 o->error = OHTTP;
117                 return 0;
118             }
119             /* copy chunk .. */
120             memcpy (*content_buf + off, o->buf + i, chunk_len);
121             i += chunk_len + 2; /* skip chunk+CRLF */
122             off += chunk_len;
123         }
124         if (!off)
125             *content_buf = 0;
126         *content_len = off;
127     }
128     else
129     {
130         if (i > o->size)
131         {
132             o->error = OHTTP;
133             return 0;
134         }
135         else if (i == o->size)
136         {
137             *content_buf = 0;
138             *content_len = 0;
139         }
140         else
141         {
142             *content_len = o->size - i;
143             *content_buf = (char*) odr_malloc(o, *content_len + 1);
144             memcpy(*content_buf, o->buf + i, *content_len);
145             (*content_buf)[*content_len] = '\0';
146         }
147     }
148     return 1;
149 }
150
151 void z_HTTP_header_add_content_type(ODR o, Z_HTTP_Header **hp,
152                                     const char *content_type,
153                                     const char *charset)
154 {
155     const char *l = "Content-Type";
156     if (charset)
157     {
158         char *ctype = (char *)
159             odr_malloc(o, strlen(content_type)+strlen(charset) + 15);
160         sprintf(ctype, "%s; charset=%s", content_type, charset);
161         z_HTTP_header_add(o, hp, l, ctype);
162     }
163     else
164         z_HTTP_header_add(o, hp, l, content_type);
165
166 }
167
168 /*
169  * HTTP Basic authentication is described at:
170  * http://tools.ietf.org/html/rfc1945#section-11.1
171  */
172 void z_HTTP_header_add_basic_auth(ODR o, Z_HTTP_Header **hp,
173                                   const char *username, const char *password)
174 {
175     char *tmp, *buf;
176     int len;
177
178     if (username == 0)
179         return;
180     if (password == 0)
181         password = "";
182
183     len = strlen(username) + strlen(password);
184     tmp = (char *) odr_malloc(o, len+2);
185     sprintf(tmp, "%s:%s", username, password);
186     buf = (char *) odr_malloc(o, (len+1) * 8/6 + 12);
187     strcpy(buf, "Basic ");
188     yaz_base64encode(tmp, &buf[strlen(buf)]);
189     z_HTTP_header_set(o, hp, "Authorization", buf);
190 }
191
192
193 void z_HTTP_header_add(ODR o, Z_HTTP_Header **hp, const char *n,
194                        const char *v)
195 {
196     while (*hp)
197         hp = &(*hp)->next;
198     *hp = (Z_HTTP_Header *) odr_malloc(o, sizeof(**hp));
199     (*hp)->name = odr_strdup(o, n);
200     (*hp)->value = odr_strdup(o, v);
201     (*hp)->next = 0;
202 }
203
204 void z_HTTP_header_set(ODR o, Z_HTTP_Header **hp, const char *n,
205                        const char *v)
206 {
207     while (*hp)
208     {
209         if (!yaz_strcasecmp((*hp)->name, n))
210         {
211             (*hp)->value = odr_strdup(o, v);
212             return;
213         }
214         hp = &(*hp)->next;
215     }
216     *hp = (Z_HTTP_Header *) odr_malloc(o, sizeof(**hp));
217     (*hp)->name = odr_strdup(o, n);
218     (*hp)->value = odr_strdup(o, v);
219     (*hp)->next = 0;
220 }
221
222 const char *z_HTTP_header_remove(Z_HTTP_Header **hp, const char *n)
223 {
224     while (*hp)
225     {
226         if (!yaz_strcasecmp((*hp)->name, n))
227         {
228             const char *v = (*hp)->value;
229             *hp = (*hp)->next;
230             return v;
231         }
232         hp = &(*hp)->next;
233     }
234     return 0;
235 }
236
237 const char *z_HTTP_header_lookup(const Z_HTTP_Header *hp, const char *n)
238 {
239     for (; hp; hp = hp->next)
240         if (!yaz_strcasecmp(hp->name, n))
241             return hp->value;
242     return 0;
243 }
244
245
246 Z_GDU *z_get_HTTP_Request(ODR o)
247 {
248     Z_GDU *p = (Z_GDU *) odr_malloc(o, sizeof(*p));
249     Z_HTTP_Request *hreq;
250
251     p->which = Z_GDU_HTTP_Request;
252     p->u.HTTP_Request = (Z_HTTP_Request *) odr_malloc(o, sizeof(*hreq));
253     hreq = p->u.HTTP_Request;
254     hreq->headers = 0;
255     hreq->content_len = 0;
256     hreq->content_buf = 0;
257     hreq->version = "1.1";
258     hreq->method = "POST";
259     hreq->path = "/";
260     z_HTTP_header_add(o, &hreq->headers, "User-Agent", "YAZ/" YAZ_VERSION);
261     return p;
262 }
263
264
265 Z_GDU *z_get_HTTP_Request_host_path(ODR odr,
266                                     const char *host,
267                                     const char *path)
268 {
269     Z_GDU *p = z_get_HTTP_Request(odr);
270
271     p->u.HTTP_Request->path = odr_strdup(odr, path);
272
273     if (host)
274     {
275         const char *cp0 = strstr(host, "://");
276         const char *cp1 = 0;
277         if (cp0)
278             cp0 = cp0+3;
279         else
280             cp0 = host;
281
282         cp1 = strchr(cp0, '/');
283         if (!cp1)
284             cp1 = cp0+strlen(cp0);
285
286         if (cp0 && cp1)
287         {
288             char *h = (char*) odr_malloc(odr, cp1 - cp0 + 1);
289             memcpy (h, cp0, cp1 - cp0);
290             h[cp1-cp0] = '\0';
291             z_HTTP_header_add(odr, &p->u.HTTP_Request->headers,
292                               "Host", h);
293         }
294     }
295     return p;
296 }
297
298 Z_GDU *z_get_HTTP_Request_uri(ODR odr, const char *uri, const char *args,
299                               int use_full_uri)
300 {
301     Z_GDU *p = z_get_HTTP_Request(odr);
302     const char *cp0 = strstr(uri, "://");
303     const char *cp1 = 0;
304     if (cp0)
305         cp0 = cp0+3;
306     else
307         cp0 = uri;
308
309     cp1 = strchr(cp0, '/');
310     if (!cp1)
311         cp1 = cp0+strlen(cp0);
312
313     if (cp0 && cp1)
314     {
315         char *h = (char*) odr_malloc(odr, cp1 - cp0 + 1);
316         memcpy (h, cp0, cp1 - cp0);
317         h[cp1-cp0] = '\0';
318         z_HTTP_header_add(odr, &p->u.HTTP_Request->headers,
319                           "Host", h);
320     }
321
322     if (!args)
323     {
324         if (*cp1)
325             args = cp1 + 1;
326         else
327             args = "";
328     }
329     p->u.HTTP_Request->path = odr_malloc(odr, cp1 - uri + strlen(args) + 2);
330     if (use_full_uri)
331     {
332         memcpy(p->u.HTTP_Request->path, uri, cp1 - uri);
333         strcpy(p->u.HTTP_Request->path + (cp1 - uri), "/");
334     }
335     else
336         strcpy(p->u.HTTP_Request->path, "/");
337     strcat(p->u.HTTP_Request->path, args);
338     return p;
339 }
340
341 Z_GDU *z_get_HTTP_Response(ODR o, int code)
342 {
343     Z_GDU *p = (Z_GDU *) odr_malloc(o, sizeof(*p));
344     Z_HTTP_Response *hres;
345
346     p->which = Z_GDU_HTTP_Response;
347     p->u.HTTP_Response = (Z_HTTP_Response *) odr_malloc(o, sizeof(*hres));
348     hres = p->u.HTTP_Response;
349     hres->headers = 0;
350     hres->content_len = 0;
351     hres->content_buf = 0;
352     hres->code = code;
353     hres->version = "1.1";
354     z_HTTP_header_add(o, &hres->headers, "Server",
355                       "YAZ/" YAZ_VERSION);
356     if (code != 200)
357     {
358         hres->content_buf = (char*) odr_malloc(o, 400);
359         sprintf(hres->content_buf,
360                 "<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01//EN\""
361                 " \"http://www.w3.org/TR/html4/strict.dtd\">\n"
362                 "<HTML>\n"
363                 " <HEAD>\n"
364                 "  <TITLE>YAZ " YAZ_VERSION "</TITLE>\n"
365                 " </HEAD>\n"
366                 " <BODY>\n"
367                 "  <P><A HREF=\"http://www.indexdata.com/yaz/\">YAZ</A> "
368                 YAZ_VERSION "</P>\n"
369                 "  <P>Error: %d</P>\n"
370                 "  <P>Description: %.50s</P>\n"
371                 " </BODY>\n"
372                 "</HTML>\n",
373                 code, z_HTTP_errmsg(code));
374         hres->content_len = strlen(hres->content_buf);
375         z_HTTP_header_add(o, &hres->headers, "Content-Type", "text/html");
376     }
377     return p;
378 }
379
380 const char *z_HTTP_errmsg(int code)
381 {
382     switch (code)
383     {
384     case 100:
385         return "Continue";
386     case 101:
387         return "Switching Protocols";
388     case 200:
389         return "OK";
390     case 201:
391         return "Created";
392     case 202:
393         return "Accepted";
394     case 203:
395         return "Non-Authoritative Information";
396     case 204:
397         return "No Content";
398     case 205:
399         return "Reset Content";
400     case 206:
401         return "Partial Content";
402     case 300:
403         return "Multiple Choices";
404     case 301:
405         return "Moved Permenently";
406     case 302:
407         return "Found";
408     case 303:
409         return "See Other";
410     case 304:
411         return "Not Modified";
412     case 305:
413         return "Use Proxy";
414     case 307:
415         return "Temporary Redirect";
416     case 400:
417         return "Bad Request";
418     case 404:
419         return "Not Found";
420     case 405:
421         return "Method Not Allowed";
422     case 406:
423         return "Not Acceptable";
424     case 407:
425         return "Proxy Authentication Required";
426     case 408:
427         return "Request Timeout";
428     case 409:
429         return "Conflict";
430     case 410:
431         return "Gone";
432     case 411:
433         return "Length Required";
434     case 412:
435         return "Precondition Failed";
436     case 413:
437         return "Request Entity Too Large";
438     case 414:
439         return "Request-URI Too Long";
440     case 415:
441         return "Unsupported Media Type";
442     case 416:
443         return "Requested Range Not Satisfiable";
444     case 417:
445         return "Expectation Failed";
446     case 500:
447         return "Internal Error";
448     case 501:
449         return "Not Implemented";
450     case 502:
451         return "Bad Gateway";
452     case 503:
453         return "Service Unavailable";
454     case 504:
455         return "Gateway Timeout";
456     case 505:
457         return "HTTP Version Not Supported";
458     default:
459         return "Unknown Error";
460     }
461 }
462
463 int yaz_decode_http_response(ODR o, Z_HTTP_Response **hr_p)
464 {
465     int i, po;
466     Z_HTTP_Response *hr = (Z_HTTP_Response *) odr_malloc(o, sizeof(*hr));
467
468     *hr_p = hr;
469     hr->content_buf = 0;
470     hr->content_len = 0;
471
472     po = i = 5;
473     while (i < o->size-2 && !strchr(" \r\n", o->buf[i]))
474         i++;
475     hr->version = (char *) odr_malloc(o, i - po + 1);
476     if (i - po)
477         memcpy(hr->version, o->buf + po, i - po);
478     hr->version[i-po] = 0;
479     if (o->buf[i] != ' ')
480     {
481         o->error = OHTTP;
482         return 0;
483     }
484     i++;
485     hr->code = 0;
486     while (i < o->size-2 && o->buf[i] >= '0' && o->buf[i] <= '9')
487     {
488         hr->code = hr->code*10 + (o->buf[i] - '0');
489         i++;
490     }
491     while (i < o->size-1 && o->buf[i] != '\n')
492         i++;
493     return decode_headers_content(o, i, &hr->headers,
494                                   &hr->content_buf, &hr->content_len);
495 }
496
497 int yaz_decode_http_request(ODR o, Z_HTTP_Request **hr_p)
498 {
499     int i, po;
500     Z_HTTP_Request *hr = (Z_HTTP_Request *) odr_malloc(o, sizeof(*hr));
501
502     *hr_p = hr;
503
504     /* method .. */
505     for (i = 0; o->buf[i] != ' '; i++)
506         if (i >= o->size-5 || i > 30)
507         {
508             o->error = OHTTP;
509             return 0;
510         }
511     hr->method = (char *) odr_malloc(o, i+1);
512     memcpy (hr->method, o->buf, i);
513     hr->method[i] = '\0';
514     /* path */
515     po = i+1;
516     for (i = po; o->buf[i] != ' '; i++)
517         if (i >= o->size-5)
518         {
519             o->error = OHTTP;
520             return 0;
521         }
522     hr->path = (char *) odr_malloc(o, i - po + 1);
523     memcpy (hr->path, o->buf+po, i - po);
524     hr->path[i - po] = '\0';
525     /* HTTP version */
526     i++;
527     if (i > o->size-5 || memcmp(o->buf+i, "HTTP/", 5))
528     {
529         o->error = OHTTP;
530         return 0;
531     }
532     i+= 5;
533     po = i;
534     while (i < o->size && !strchr("\r\n", o->buf[i]))
535         i++;
536     hr->version = (char *) odr_malloc(o, i - po + 1);
537     memcpy(hr->version, o->buf + po, i - po);
538     hr->version[i - po] = '\0';
539     /* headers */
540     if (i < o->size-1 && o->buf[i] == '\r')
541         i++;
542     if (o->buf[i] != '\n')
543     {
544         o->error = OHTTP;
545         return 0;
546     }
547     return decode_headers_content(o, i, &hr->headers,
548                                   &hr->content_buf, &hr->content_len);
549 }
550
551 static void dump_http_package(ODR o, const char *buf, size_t len)
552 {
553     int i;
554     for (i = 0; ; i++)
555     {
556         if (i == len)
557         {
558             odr_printf(o, "%.*s\n", i, buf);
559             break;
560         }
561         else if (i > 8192)
562         {
563             odr_printf(o, "%.*s\n", i, buf);
564             odr_printf(o, "(truncated\n", (long) len);
565             break;
566         }
567         else if (buf[i] == 0)
568         {
569             odr_printf(o, "%.*s\n", i, buf);
570             odr_printf(o, "(binary data)\n", (long) len);
571             break;
572         }
573     }
574 }
575
576 int yaz_encode_http_response(ODR o, Z_HTTP_Response *hr)
577 {
578     char sbuf[80];
579     Z_HTTP_Header *h;
580     int top0 = o->top;
581
582     sprintf(sbuf, "HTTP/%s %d %s\r\n", hr->version,
583             hr->code,
584             z_HTTP_errmsg(hr->code));
585     odr_write2(o, sbuf, strlen(sbuf));
586     /* use content_len for Content-Length */
587     sprintf(sbuf, "Content-Length: %d\r\n", hr->content_len);
588     odr_write2(o, sbuf, strlen(sbuf));
589     for (h = hr->headers; h; h = h->next)
590     {
591         if (yaz_strcasecmp(h->name, "Content-Length")
592             && yaz_strcasecmp(h->name, "Transfer-Encoding"))
593         {   /* skip Content-Length if given. content_len rules */
594             odr_write2(o, h->name, strlen(h->name));
595             odr_write2(o, ": ", 2);
596             odr_write2(o, h->value, strlen(h->value));
597             odr_write2(o, "\r\n", 2);
598         }
599     }
600     odr_write(o, (unsigned char *) "\r\n", 2);
601     if (hr->content_buf)
602         odr_write2(o, hr->content_buf, hr->content_len);
603     if (o->direction == ODR_PRINT)
604     {
605         odr_printf(o, "-- HTTP response:\n");
606         dump_http_package(o, (const char *) o->buf + top0, o->top - top0);
607         odr_printf(o, "--\n");
608     }
609     return 1;
610 }
611
612 int yaz_encode_http_request(ODR o, Z_HTTP_Request *hr)
613 {
614     Z_HTTP_Header *h;
615     int top0 = o->top;
616
617     odr_write2(o, hr->method, strlen(hr->method));
618     odr_write2(o, " ", 1);
619     odr_write2(o, hr->path, strlen(hr->path));
620     odr_write2(o, " HTTP/", 6);
621     odr_write2(o, hr->version, strlen(hr->version));
622     odr_write2(o, "\r\n", 2);
623     if (hr->content_len &&
624         !z_HTTP_header_lookup(hr->headers,
625                               "Content-Length"))
626     {
627         char lstr[60];
628         sprintf(lstr, "Content-Length: %d\r\n",
629                 hr->content_len);
630         odr_write2(o, lstr, strlen(lstr));
631     }
632     for (h = hr->headers; h; h = h->next)
633     {
634         odr_write2(o, h->name, strlen(h->name));
635         odr_write2(o, ": ", 2);
636         odr_write2(o, h->value, strlen(h->value));
637         odr_write2(o, "\r\n", 2);
638     }
639     odr_write2(o, "\r\n", 2);
640     if (hr->content_buf)
641         odr_write2(o, hr->content_buf, hr->content_len);
642     if (o->direction == ODR_PRINT)
643     {
644         odr_printf(o, "-- HTTP request:\n");
645         dump_http_package(o, (const char *) o->buf + top0, o->top - top0);
646         odr_printf(o, "--\n");
647     }
648     return 1;
649 }
650
651 /*
652  * Local variables:
653  * c-basic-offset: 4
654  * c-file-style: "Stroustrup"
655  * indent-tabs-mode: nil
656  * End:
657  * vim: shiftwidth=4 tabstop=8 expandtab
658  */
659