C++ compilation.
[idzebra-moved-to-github.git] / index / retrieve.c
1 /*
2  * Copyright (C) 1995-1999, Index Data
3  * All rights reserved.
4  * Sebastian Hammer, Adam Dickmeiss
5  *
6  * $Log: retrieve.c,v $
7  * Revision 1.10  1999-05-26 07:49:13  adam
8  * C++ compilation.
9  *
10  * Revision 1.9  1999/05/20 12:57:18  adam
11  * Implemented TCL filter. Updated recctrl system.
12  *
13  * Revision 1.8  1999/03/09 16:27:49  adam
14  * More work on SDRKit integration.
15  *
16  * Revision 1.7  1999/03/02 16:15:43  quinn
17  * Added "tagsysno" and "tagrank" directives to zebra.cfg.
18  *
19  * Revision 1.6  1999/02/18 15:01:25  adam
20  * Minor changes.
21  *
22  * Revision 1.5  1999/02/17 11:29:56  adam
23  * Fixed in record_fetch. Minor updates to API.
24  *
25  * Revision 1.4  1999/02/02 14:51:07  adam
26  * Updated WIN32 code specific sections. Changed header.
27  *
28  * Revision 1.3  1998/10/28 10:54:40  adam
29  * SDRKit integration.
30  *
31  * Revision 1.2  1998/10/16 08:14:33  adam
32  * Updated record control system.
33  *
34  * Revision 1.1  1998/03/05 08:45:13  adam
35  * New result set model and modular ranking system. Moved towards
36  * descent server API. System information stored as "SGML" records.
37  *
38  */
39
40 #include <stdio.h>
41 #include <assert.h>
42
43 #include <fcntl.h>
44 #ifdef WIN32
45 #include <io.h>
46 #include <process.h>
47 #else
48 #include <unistd.h>
49 #endif
50
51 #include <recctrl.h>
52 #include "zserver.h"
53
54 #ifndef ZEBRASDR
55 #define ZEBRASDR 0
56 #endif
57
58 #if ZEBRASDR
59 #include "zebrasdr.h"
60 #endif
61
62 struct fetch_control {
63     int record_offset;
64     int record_int_pos;
65     char *record_int_buf;
66     int record_int_len;
67     int fd;
68 };
69
70 static int record_ext_read (void *fh, char *buf, size_t count)
71 {
72     struct fetch_control *fc = (struct fetch_control *) fh;
73     return read (fc->fd, buf, count);
74 }
75
76 static off_t record_ext_seek (void *fh, off_t offset)
77 {
78     struct fetch_control *fc = (struct fetch_control *) fh;
79     return lseek (fc->fd, offset + fc->record_offset, SEEK_SET);
80 }
81
82 static off_t record_ext_tell (void *fh)
83 {
84     struct fetch_control *fc = (struct fetch_control *) fh;
85     return lseek (fc->fd, 0, SEEK_CUR) - fc->record_offset;
86 }
87
88 static off_t record_int_seek (void *fh, off_t offset)
89 {
90     struct fetch_control *fc = (struct fetch_control *) fh;
91     return (off_t) (fc->record_int_pos = offset);
92 }
93
94 static off_t record_int_tell (void *fh)
95 {
96     struct fetch_control *fc = (struct fetch_control *) fh;
97     return (off_t) fc->record_int_pos;
98 }
99
100 static int record_int_read (void *fh, char *buf, size_t count)
101 {
102     struct fetch_control *fc = (struct fetch_control *) fh;
103     int l = fc->record_int_len - fc->record_int_pos;
104     if (l <= 0)
105         return 0;
106     l = (l < (int) count) ? l : count;
107     memcpy (buf, fc->record_int_buf + fc->record_int_pos, l);
108     fc->record_int_pos += l;
109     return l;
110 }
111
112 int zebra_record_fetch (ZebraHandle zh, int sysno, int score, ODR stream,
113                         oid_value input_format, Z_RecordComposition *comp,
114                         oid_value *output_format, char **rec_bufp,
115                         int *rec_lenp, char **basenamep)
116 {
117     Record rec;
118     char *fname, *file_type, *basename;
119     RecType rt;
120     struct recRetrieveCtrl retrieveCtrl;
121     char subType[128];
122     struct fetch_control fc;
123     RecordAttr *recordAttr;
124     void *clientData;
125
126     rec = rec_get (zh->records, sysno);
127     if (!rec)
128     {
129         logf (LOG_DEBUG, "rec_get fail on sysno=%d", sysno);
130         return 14;
131     }
132     recordAttr = rec_init_attr (zh->zei, rec);
133
134     file_type = rec->info[recInfo_fileType];
135     fname = rec->info[recInfo_filename];
136     basename = rec->info[recInfo_databaseName];
137     *basenamep = (char *) odr_malloc (stream, strlen(basename)+1);
138     strcpy (*basenamep, basename);
139
140     if (!(rt = recType_byName (zh->recTypes, file_type, subType, &clientData)))
141     {
142         logf (LOG_WARN, "Retrieve: Cannot handle type %s",  file_type);
143         return 14;
144     }
145     logf (LOG_DEBUG, "retrieve localno=%d score=%d", sysno, score);
146     retrieveCtrl.fh = &fc;
147     fc.fd = -1;
148     if (rec->size[recInfo_storeData] > 0)
149     {
150         retrieveCtrl.readf = record_int_read;
151         retrieveCtrl.seekf = record_int_seek;
152         retrieveCtrl.tellf = record_int_tell;
153         fc.record_int_len = rec->size[recInfo_storeData];
154         fc.record_int_buf = rec->info[recInfo_storeData];
155         fc.record_int_pos = 0;
156         logf (LOG_DEBUG, "Internal retrieve. %d bytes", fc.record_int_len);
157     }
158 #if ZEBRASDR
159     else if (*fname == '%')
160     {   
161         ZebraSdrHandle h;
162         int segment = 0, r;
163         char *cp, xname[128];
164         unsigned char *buf;
165
166         logf (LOG_DEBUG, "SDR");
167         strcpy (xname, fname+1);
168         if ((cp = strrchr (xname, '.')))
169         {
170             *cp++ = 0;
171             segment = atoi(cp);
172         }
173         h = zebraSdr_open (xname);
174         if (!h)
175         {
176             logf (LOG_WARN, "sdr open %s", xname);
177             return 0;
178         }
179         if (zebraSdr_segment (h, &segment) < 0)
180         {
181             logf (LOG_WARN, "zebraSdr_segment fail segment=%d",
182                 segment);
183             rec_rm (&rec);
184             return 14;
185         }    
186         r = zebraSdr_read (h, &buf);
187         if (r < 1)
188         {
189             logf (LOG_WARN, "zebraSdr_read fail segment=%d",
190                 segment);
191             rec_rm (&rec);
192             return 14;
193         }
194         zebraSdr_close (h);
195
196         fc.record_int_len = recordAttr->recordSize;
197         fc.record_int_buf = buf + recordAttr->recordOffset;
198         fc.record_int_pos = 0;
199
200         logf (LOG_LOG, "segment = %d len=%d off=%d",
201             segment,
202             recordAttr->recordSize,
203             recordAttr->recordOffset);
204         if (fc.record_int_len > 180)
205         {
206             logf (LOG_LOG, "%.70s", fc.record_int_buf);
207             logf (LOG_LOG, "%.70s", fc.record_int_buf +
208                 (fc.record_int_len - 70));
209         }
210         else
211             logf (LOG_LOG, "%.*s",
212                 fc.record_int_len, fc.record_int_buf);
213
214         /* the following two lines makes rec_rm delete buf */
215         rec->size[recInfo_storeData] = r;
216         rec->info[recInfo_storeData] = buf;
217
218         retrieveCtrl.readf = record_int_read;
219         retrieveCtrl.seekf = record_int_seek;
220         retrieveCtrl.tellf = record_int_tell;
221     }
222 #endif
223     else
224     {
225         if ((fc.fd = open (fname, O_BINARY|O_RDONLY)) == -1)
226         {
227             logf (LOG_WARN|LOG_ERRNO, "Retrieve fail; missing file: %s",
228                   fname);
229             rec_rm (&rec);
230             return 14;
231         }
232         fc.record_offset = recordAttr->recordOffset;
233
234         retrieveCtrl.readf = record_ext_read;
235         retrieveCtrl.seekf = record_ext_seek;
236         retrieveCtrl.tellf = record_ext_tell;
237
238         record_ext_seek (retrieveCtrl.fh, 0);
239     }
240     retrieveCtrl.subType = subType;
241     retrieveCtrl.localno = sysno;
242     retrieveCtrl.score = score;
243     retrieveCtrl.recordSize = recordAttr->recordSize;
244     retrieveCtrl.odr = stream;
245     retrieveCtrl.input_format = retrieveCtrl.output_format = input_format;
246     retrieveCtrl.comp = comp;
247     retrieveCtrl.diagnostic = 0;
248     retrieveCtrl.dh = zh->dh;
249     retrieveCtrl.res = zh->res;
250     (*rt->retrieve)(clientData, &retrieveCtrl);
251     *output_format = retrieveCtrl.output_format;
252     *rec_bufp = (char *) retrieveCtrl.rec_buf;
253     *rec_lenp = retrieveCtrl.rec_len;
254     if (fc.fd != -1)
255         close (fc.fd);
256     rec_rm (&rec);
257
258     return retrieveCtrl.diagnostic;
259 }