Removed the term count stuff from all rsets, and fixed what ever that broke.
[idzebra-moved-to-github.git] / rset / rstemp.c
1 /* $Id: rstemp.c,v 1.43 2004-08-20 14:44:46 heikki Exp $
2    Copyright (C) 1995,1996,1997,1998,1999,2000,2001,2002,2003
3    Index Data Aps
4
5 This file is part of the Zebra server.
6
7 Zebra is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with Zebra; see the file LICENSE.zebra.  If not, write to the
19 Free Software Foundation, 59 Temple Place - Suite 330, Boston, MA
20 02111-1307, USA.
21 */
22
23 #include <fcntl.h>
24 #include <assert.h>
25 #ifdef WIN32
26 #include <io.h>
27 #else
28 #include <unistd.h>
29 #endif
30 #include <string.h>
31 #include <sys/types.h>
32 #include <stdio.h>
33
34 #include <zebrautl.h>
35 #include <rstemp.h>
36
37 static void *r_create(RSET ct, const struct rset_control *sel, void *parms);
38 static RSFD r_open (RSET ct, int flag);
39 static void r_close (RSFD rfd);
40 static void r_delete (RSET ct);
41 static void r_rewind (RSFD rfd);
42 /* static int r_count (RSET ct);*/
43 static int r_read (RSFD rfd, void *buf);
44 static int r_write (RSFD rfd, const void *buf);
45 static void r_pos (RSFD rfd, double *current, double  *total);
46
47 static const struct rset_control control = 
48 {
49     "temp",
50     r_create,
51     r_open,
52     r_close,
53     r_delete,
54     r_rewind,
55     rset_default_forward,
56     r_pos, 
57     r_read,
58     r_write,
59 };
60
61 const struct rset_control *rset_kind_temp = &control;
62
63 struct rset_temp_info {
64     int     fd;
65     char   *fname;
66     size_t  key_size;      /* key size */
67     char   *buf_mem;       /* window buffer */
68     size_t  buf_size;      /* size of window */
69     size_t  pos_end;       /* last position in set */
70     size_t  pos_buf;       /* position of first byte in window */
71     size_t  pos_border;    /* position of last byte+1 in window */
72     int     dirty;         /* window is dirty */
73     zint     hits;          /* no of hits */
74     char   *temp_path;
75     int     (*cmp)(const void *p1, const void *p2);
76     struct rset_temp_rfd *rfd_list;
77 };
78
79 struct rset_temp_rfd {
80     struct rset_temp_info *info;
81     struct rset_temp_rfd *next;
82     zint *countp;
83     void *buf;
84     size_t  pos_cur;       /* current position in set */
85     zint cur; /* number of the current hit */
86 };
87
88 static void *r_create(RSET ct, const struct rset_control *sel, void *parms)
89 {
90     rset_temp_parms *temp_parms = (rset_temp_parms *) parms;
91     struct rset_temp_info *info;
92    
93     info = (struct rset_temp_info *) xmalloc (sizeof(struct rset_temp_info));
94     info->fd = -1;
95     info->fname = NULL;
96     info->key_size = temp_parms->key_size;
97     info->buf_size = 4096;
98     info->buf_mem = (char *) xmalloc (info->buf_size);
99     info->pos_end = 0;
100     info->pos_buf = 0;
101     info->dirty = 0;
102     info->hits = 0;
103     info->cmp = temp_parms->cmp;
104     info->rfd_list = NULL;
105
106     if (!temp_parms->temp_path)
107         info->temp_path = NULL;
108     else
109     {
110         info->temp_path = (char *) xmalloc (strlen(temp_parms->temp_path)+1);
111         strcpy (info->temp_path, temp_parms->temp_path);
112     }
113
114     return info;
115 }
116
117 static RSFD r_open (RSET ct, int flag)
118 {
119     struct rset_temp_info *info = (struct rset_temp_info *) ct->buf;
120     struct rset_temp_rfd *rfd;
121
122     if (info->fd == -1 && info->fname)
123     {
124         if (flag & RSETF_WRITE)
125             info->fd = open (info->fname, O_BINARY|O_RDWR|O_CREAT, 0666);
126         else
127             info->fd = open (info->fname, O_BINARY|O_RDONLY);
128         if (info->fd == -1)
129         {
130             logf (LOG_FATAL|LOG_ERRNO, "open %s", info->fname);
131             exit (1);
132         }
133     }
134     rfd = (struct rset_temp_rfd *) xmalloc (sizeof(*rfd));
135     rfd->next = info->rfd_list;
136     info->rfd_list = rfd;
137     rfd->info = info;
138     r_rewind (rfd);
139
140     *rfd->countp = 0;
141     rfd->buf = xmalloc (info->key_size);
142
143     return rfd;
144 }
145
146 /* r_flush:
147       flush current window to file if file is assocated with set
148  */
149 static void r_flush (RSFD rfd, int mk)
150 {
151     struct rset_temp_info *info = ((struct rset_temp_rfd*) rfd)->info;
152
153     if (!info->fname && mk)
154     {
155 #if HAVE_MKSTEMP
156         char template[1024];
157
158         if (info->temp_path)
159             sprintf (template, "%s/zrsXXXXXX", info->temp_path);
160         else
161             sprintf (template, "zrsXXXXXX");
162
163         info->fd = mkstemp (template);
164
165         if (info->fd == -1)
166         {
167             logf (LOG_FATAL|LOG_ERRNO, "mkstemp %s", template);
168             exit (1);
169         }
170         info->fname = (char *) xmalloc (strlen(template)+1);
171         strcpy (info->fname, template);
172 #else
173         char *s = (char*) tempnam (info->temp_path, "zrs");
174         info->fname = (char *) xmalloc (strlen(s)+1);
175         strcpy (info->fname, s);
176
177         logf (LOG_DEBUG, "creating tempfile %s", info->fname);
178         info->fd = open (info->fname, O_BINARY|O_RDWR|O_CREAT, 0666);
179         if (info->fd == -1)
180         {
181             logf (LOG_FATAL|LOG_ERRNO, "open %s", info->fname);
182             exit (1);
183         }
184 #endif
185     }
186     if (info->fname && info->fd != -1 && info->dirty)
187     {
188         size_t count;
189         int r;
190         
191         if (lseek (info->fd, info->pos_buf, SEEK_SET) == -1)
192         {
193             logf (LOG_FATAL|LOG_ERRNO, "lseek %s", info->fname);
194             exit (1);
195         }
196         count = info->buf_size;
197         if (count > info->pos_end - info->pos_buf)
198             count = info->pos_end - info->pos_buf;
199         if ((r = write (info->fd, info->buf_mem, count)) < (int) count)
200         {
201             if (r == -1)
202                 logf (LOG_FATAL|LOG_ERRNO, "read %s", info->fname);
203             else
204                 logf (LOG_FATAL, "write of %ld but got %ld",
205                       (long) count, (long) r);
206             exit (1);
207         }
208         info->dirty = 0;
209     }
210 }
211
212 static void r_close (RSFD rfd)
213 {
214     struct rset_temp_info *info = ((struct rset_temp_rfd*)rfd)->info;
215     struct rset_temp_rfd **rfdp;
216
217     for (rfdp = &info->rfd_list; *rfdp; rfdp = &(*rfdp)->next)
218         if (*rfdp == rfd)
219         {
220             r_flush (*rfdp, 0);
221             xfree ((*rfdp)->buf);
222
223             *rfdp = (*rfdp)->next;
224             xfree (rfd);
225
226             if (!info->rfd_list && info->fname && info->fd != -1)
227             {
228                 close (info->fd);
229                 info->fd = -1;
230             }
231             return;
232         }
233     logf (LOG_FATAL, "r_close but no rfd match!");
234     assert (0);
235 }
236
237 static void r_delete (RSET ct)
238 {
239     struct rset_temp_info *info = (struct rset_temp_info*) ct->buf;
240
241     if (info->fname)
242         unlink (info->fname);        
243     xfree (info->buf_mem);
244     logf (LOG_DEBUG, "r_delete: set size %ld", (long) info->pos_end);
245     if (info->fname)
246     {
247         logf (LOG_DEBUG, "r_delete: unlink %s", info->fname);
248         unlink (info->fname);
249         xfree (info->fname);
250     }
251     if (info->temp_path)
252         xfree (info->temp_path);
253     xfree (info);
254 }
255
256 /* r_reread:
257       read from file to window if file is assocated with set -
258       indicated by fname
259  */
260 static void r_reread (RSFD rfd)
261 {
262     struct rset_temp_info *info = ((struct rset_temp_rfd*)rfd)->info;
263
264     if (info->fname)
265     {
266         size_t count;
267         int r;
268
269         info->pos_border = ((struct rset_temp_rfd *)rfd)->pos_cur +
270             info->buf_size;
271         if (info->pos_border > info->pos_end)
272             info->pos_border = info->pos_end;
273         count = info->pos_border - info->pos_buf;
274         if (count > 0)
275         {
276             if (lseek (info->fd, info->pos_buf, SEEK_SET) == -1)
277             {
278                 logf (LOG_FATAL|LOG_ERRNO, "lseek %s", info->fname);
279                 exit (1);
280             }
281             if ((r = read (info->fd, info->buf_mem, count)) < (int) count)
282             {
283                 if (r == -1)
284                     logf (LOG_FATAL|LOG_ERRNO, "read %s", info->fname);
285                 else
286                     logf (LOG_FATAL, "read of %ld but got %ld",
287                           (long) count, (long) r);
288                 exit (1);
289             }
290         }
291     }
292     else
293         info->pos_border = info->pos_end;
294 }
295
296 static void r_rewind (RSFD rfd)
297 {
298     struct rset_temp_info *info = ((struct rset_temp_rfd*)rfd)->info;
299
300     r_flush (rfd, 0);
301     ((struct rset_temp_rfd *)rfd)->pos_cur = 0;
302     info->pos_buf = 0;
303     r_reread (rfd);
304     ((struct rset_temp_rfd *)rfd)->cur=0;
305 }
306
307 /*
308 static int r_count (RSET ct)
309 {
310     struct rset_temp_info *info = (struct rset_temp_info *) ct->buf;
311
312     return info->pos_end / info->key_size;
313 }
314 */
315 static int r_read (RSFD rfd, void *buf)
316 {
317     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd;
318     struct rset_temp_info *info = mrfd->info;
319
320     size_t nc = mrfd->pos_cur + info->key_size;
321
322     if (mrfd->pos_cur < info->pos_buf || nc > info->pos_border)
323     {
324         if (nc > info->pos_end)
325             return 0;
326         r_flush (rfd, 0);
327         info->pos_buf = mrfd->pos_cur;
328         r_reread (rfd);
329     }
330     memcpy (buf, info->buf_mem + (mrfd->pos_cur - info->pos_buf),
331             info->key_size);
332     mrfd->pos_cur = nc;
333
334     if (*mrfd->countp == 0 || (*info->cmp)(buf, mrfd->buf) > 1)
335     {
336         memcpy (mrfd->buf, buf, mrfd->info->key_size);
337         (*mrfd->countp)++;
338     }
339     mrfd->cur++;
340     return 1;
341 }
342
343 static int r_write (RSFD rfd, const void *buf)
344 {
345     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd;
346     struct rset_temp_info *info = mrfd->info;
347
348     size_t nc = mrfd->pos_cur + info->key_size;
349
350     if (nc > info->pos_buf + info->buf_size)
351     {
352         r_flush (rfd, 1);
353         info->pos_buf = mrfd->pos_cur;
354         if (info->pos_buf < info->pos_end)
355             r_reread (rfd);
356     }
357     info->dirty = 1;
358     memcpy (info->buf_mem + (mrfd->pos_cur - info->pos_buf), buf,
359             info->key_size);
360     mrfd->pos_cur = nc;
361     if (nc > info->pos_end)
362         info->pos_border = info->pos_end = nc;
363     info->hits++;
364     return 1;
365 }
366
367 static void r_pos (RSFD rfd, double  *current, double  *total)
368 {
369     struct rset_temp_rfd *mrfd = (struct rset_temp_rfd*) rfd;
370     *current=(double) mrfd->cur;
371     *total=(double) mrfd->info->hits;
372 }