Moved zebrautl.h to idzebra/util.h.
[idzebra-moved-to-github.git] / rset / rstemp.c
1 /* $Id: rstemp.c,v 1.61 2005-03-30 09:25:24 adam Exp $
2    Copyright (C) 1995-2005
3    Index Data ApS
4
5 This file is part of the Zebra server.
6
7 Zebra is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with Zebra; see the file LICENSE.zebra.  If not, write to the
19 Free Software Foundation, 59 Temple Place - Suite 330, Boston, MA
20 02111-1307, USA.
21 */
22
23 #include <assert.h>
24 #include <fcntl.h>
25 #include <stdlib.h>
26 #include <stdio.h>
27 #include <string.h>
28 #ifdef WIN32
29 #include <io.h>
30 #else
31 #include <unistd.h>
32 #endif
33 #include <sys/types.h>
34
35 #include <idzebra/util.h>
36 #include <rset.h>
37
38 static RSFD r_open(RSET ct, int flag);
39 static void r_close(RSFD rfd);
40 static void r_delete(RSET ct);
41 static int r_read(RSFD rfd, void *buf, TERMID *term);
42 static int r_write(RSFD rfd, const void *buf);
43 static void r_pos(RSFD rfd, double *current, double  *total);
44 static void r_flush(RSFD rfd, int mk);
45 static void r_reread(RSFD rfd);
46
47
48 static const struct rset_control control = 
49 {
50     "temp",
51     r_delete,
52     rset_get_one_term,
53     r_open,
54     r_close,
55     rset_default_forward,
56     r_pos, 
57     r_read,
58     r_write,
59 };
60
61 const struct rset_control *rset_kind_temp = &control;
62
63 struct rset_temp_info {
64     int     fd;            /* file descriptor for temp file */
65     char   *fname;         /* name of temp file */
66     char   *buf_mem;       /* window buffer */
67     size_t  buf_size;      /* size of window */
68     size_t  pos_end;       /* last position in set */
69     size_t  pos_buf;       /* position of first byte in window */
70     size_t  pos_border;    /* position of last byte+1 in window */
71     int     dirty;         /* window is dirty */
72     zint     hits;          /* no of hits */
73     char   *temp_path;
74 };
75
76 struct rset_temp_rfd {
77     void *buf;
78     size_t  pos_cur;       /* current position in set */
79                            /* FIXME - term pos or what ??  */
80     zint cur; /* number of the current hit */
81 };
82
83 static int log_level = 0;
84 static int log_level_initialized = 0;
85
86 RSET rstemp_create( NMEM nmem, const struct key_control *kcontrol,
87                     int scope, const char *temp_path, TERMID term)
88 {
89     RSET rnew = rset_create_base(&control, nmem, kcontrol, scope,term);
90     struct rset_temp_info *info;
91     if (!log_level_initialized)
92     {
93         log_level = yaz_log_module_level("rstemp");
94         log_level_initialized = 1;
95     }
96     info = (struct rset_temp_info *) nmem_malloc(rnew->nmem, sizeof(*info));
97     info->fd = -1;
98     info->fname = NULL;
99     info->buf_size = 4096;
100     info->buf_mem = (char *) nmem_malloc(rnew->nmem, info->buf_size);
101     info->pos_end = 0;
102     info->pos_buf = 0;
103     info->dirty = 0;
104     info->hits = 0;
105
106     if (!temp_path)
107         info->temp_path = NULL;
108     else
109         info->temp_path = nmem_strdup(rnew->nmem, temp_path);
110     rnew->priv = info; 
111     return rnew;
112 } /* rstemp_create */
113
114 static void r_delete(RSET ct)
115 {
116     struct rset_temp_info *info = (struct rset_temp_info*) ct->priv;
117
118     yaz_log(log_level, "r_delete: set size %ld", (long) info->pos_end);
119     if (info->fname)
120     {
121         yaz_log(log_level, "r_delete: unlink %s", info->fname);
122         unlink(info->fname);
123     }
124 }
125
126 static RSFD r_open(RSET ct, int flag)
127 {
128     struct rset_temp_info *info = (struct rset_temp_info *) ct->priv;
129     RSFD rfd;
130     struct rset_temp_rfd *prfd;
131
132     if (info->fd == -1 && info->fname)
133     {
134         if (flag & RSETF_WRITE)
135             info->fd = open(info->fname, O_BINARY|O_RDWR|O_CREAT, 0666);
136         else
137             info->fd = open(info->fname, O_BINARY|O_RDONLY);
138         if (info->fd == -1)
139         {
140             yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: open failed %s", info->fname);
141             exit(1);
142         }
143     }
144     rfd = rfd_create_base(ct);
145     if (!rfd->priv)
146     {
147         prfd = (struct rset_temp_rfd *) nmem_malloc(ct->nmem, sizeof(*prfd));
148         rfd->priv = (void *)prfd;
149         prfd->buf = nmem_malloc(ct->nmem,ct->keycontrol->key_size);
150     } 
151     else
152         prfd= rfd->priv;
153     r_flush(rfd, 0);
154     prfd->pos_cur = 0;
155     info->pos_buf = 0;
156     r_reread(rfd);
157     prfd->cur = 0;
158     return rfd;
159 }
160
161 /* r_flush:
162       flush current window to file if file is assocated with set
163  */
164 static void r_flush(RSFD rfd, int mk)
165 {
166     /* struct rset_temp_info *info = ((struct rset_temp_rfd*) rfd)->info; */
167     struct rset_temp_info *info = rfd->rset->priv;
168
169     if (!info->fname && mk)
170     {
171 #if HAVE_MKSTEMP
172         char template[1024];
173         if (info->temp_path)
174             sprintf(template, "%s/zrsXXXXXX", info->temp_path);
175         else
176             sprintf(template, "zrsXXXXXX");
177
178         info->fd = mkstemp(template);
179
180         if (info->fd == -1)
181         {
182             yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: mkstemp %s", template);
183             exit(1);
184         }
185         info->fname = nmem_strdup(rfd->rset->nmem, template);
186 #else
187         char *s = (char*) tempnam(info->temp_path, "zrs");
188         info->fname= nmem_strdup(rfd->rset->nmem, s);
189
190         yaz_log(log_level, "creating tempfile %s", info->fname);
191         info->fd = open(info->fname, O_BINARY|O_RDWR|O_CREAT, 0666);
192         if (info->fd == -1)
193         {
194             yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: open %s", info->fname);
195             exit(1);
196         }
197 #endif
198     }
199     if (info->fname && info->fd != -1 && info->dirty)
200     {
201         size_t count;
202         int r;
203         
204         if (lseek(info->fd, info->pos_buf, SEEK_SET) == -1)
205         {
206             yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: lseek (1) %s", info->fname);
207             exit(1);
208         }
209         count = info->buf_size;
210         if (count > info->pos_end - info->pos_buf)
211             count = info->pos_end - info->pos_buf;
212         if ((r = write(info->fd, info->buf_mem, count)) < (int) count)
213         {
214             if (r == -1)
215                 yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: write %s", info->fname);
216             else
217                 yaz_log(YLOG_FATAL, "rstemp: write of %ld but got %ld",
218                       (long) count, (long) r);
219             exit(1);
220         }
221         info->dirty = 0;
222     }
223 }
224
225 static void r_close(RSFD rfd)
226 {
227     /*struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd->priv; */
228     struct rset_temp_info *info = (struct rset_temp_info *)rfd->rset->priv;
229     if (rfd_is_last(rfd))
230     {
231         r_flush(rfd, 0);
232         if (info->fname && info->fd != -1)
233         {
234             close(info->fd);
235             info->fd = -1;
236         }
237     }
238     rfd_delete_base(rfd);
239 }
240
241
242 /* r_reread:
243       read from file to window if file is assocated with set -
244       indicated by fname
245  */
246 static void r_reread(RSFD rfd)
247 {
248     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd->priv; 
249     struct rset_temp_info *info = (struct rset_temp_info *)rfd->rset->priv;
250
251     if (info->fname)
252     {
253         size_t count;
254         int r;
255
256         info->pos_border = mrfd->pos_cur +
257             info->buf_size;
258         if (info->pos_border > info->pos_end)
259             info->pos_border = info->pos_end;
260         count = info->pos_border - info->pos_buf;
261         if (count > 0)
262         {
263             if (lseek(info->fd, info->pos_buf, SEEK_SET) == -1)
264             {
265                 yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: lseek (2) %s fd=%d", info->fname, info->fd);
266                 exit(1);
267             }
268             if ((r = read(info->fd, info->buf_mem, count)) < (int) count)
269             {
270                 if (r == -1)
271                     yaz_log(YLOG_FATAL|YLOG_ERRNO, "rstemp: read %s", info->fname);
272                 else
273                     yaz_log(YLOG_FATAL, "read of %ld but got %ld",
274                           (long) count, (long) r);
275                 exit(1);
276             }
277         }
278     }
279     else
280         info->pos_border = info->pos_end;
281 }
282
283 static int r_read(RSFD rfd, void *buf, TERMID *term)
284 {
285     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd->priv;  
286     struct rset_temp_info *info = (struct rset_temp_info *)rfd->rset->priv;
287
288     size_t nc = mrfd->pos_cur + rfd->rset->keycontrol->key_size;
289
290     if (mrfd->pos_cur < info->pos_buf || nc > info->pos_border)
291     {
292         if (nc > info->pos_end)
293             return 0;
294         r_flush(rfd, 0);
295         info->pos_buf = mrfd->pos_cur;
296         r_reread(rfd);
297     }
298     memcpy(buf, info->buf_mem + (mrfd->pos_cur - info->pos_buf),
299             rfd->rset->keycontrol->key_size);
300     if (term)
301         *term = rfd->rset->term; 
302         /* FIXME - should we store and return terms ?? */
303     mrfd->pos_cur = nc;
304     mrfd->cur++;
305     return 1;
306 }
307
308 static int r_write(RSFD rfd, const void *buf)
309 {
310     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd->priv;  
311     struct rset_temp_info *info = (struct rset_temp_info *)rfd->rset->priv;
312
313     size_t nc = mrfd->pos_cur + rfd->rset->keycontrol->key_size;
314
315     if (nc > info->pos_buf + info->buf_size)
316     {
317         r_flush(rfd, 1);
318         info->pos_buf = mrfd->pos_cur;
319         if (info->pos_buf < info->pos_end)
320             r_reread(rfd);
321     }
322     info->dirty = 1;
323     memcpy(info->buf_mem + (mrfd->pos_cur - info->pos_buf), buf,
324             rfd->rset->keycontrol->key_size);
325     mrfd->pos_cur = nc;
326     if (nc > info->pos_end)
327         info->pos_border = info->pos_end = nc;
328     info->hits++;
329     return 1;
330 }
331
332 static void r_pos(RSFD rfd, double  *current, double  *total)
333 {
334     /* struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd; */
335     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd->priv;  
336     struct rset_temp_info *info = (struct rset_temp_info *)rfd->rset->priv;
337     
338     *current = (double) mrfd->cur;
339     *total = (double) info->hits;
340 }