grs1: avoid term_len < 0 for .abs operator 'range'
[idzebra-moved-to-github.git] / NEWS
1 --- 2.0.43 2009/11/05
2
3 Fix hits counts for searches when @attr 12=n is in use. This bug
4 was introduced in 2.0.40.
5
6 --- 2.0.42 2009/10/08
7
8 Proximity modifications. The optimized proximity now deals with more
9 cases, ie all prox of the form @prox 0 d 1 1,2,3 k 2 ..
10 That's exlusive==0, any distance, ordered (true), relation (<, =, <=),
11 known unit word.
12
13 Fix bug WRT inconsistent registers, bug #3062.
14
15 Fix install doc rule so it's compatible with Automake 1.11.
16
17 --- 2.0.41 2009/08/24
18
19 Fix typos and other errors in the documentation. Thanks to Galen
20 Charlton.
21
22 Fix DOM filter so that full record ID (z:id) if given is used verbatim
23 rather than truncated until first blank - in other words use memcpy
24 rather than sscanf. For PI fix record attributes parsing which was
25 completely broken.
26
27 --- 2.0.40 2009/07/13
28
29 Fixed problem in result set handling and segment handling.
30
31 --- 2.0.39 2009/07/09
32
33 Improved speed of record fetching by using a different block sizes
34 for recd{A,B}.
35
36 Added zlib-compression of recd-storage (record data). This is enabled
37 by using recordCompression: zlib in zebra.cfg.
38
39 Dictionary delete more agressive (dict_del_string).
40
41 --- 2.0.38 2009/06/19
42
43 Improved estimated hits for AND operation (bug #2907)
44
45 Fixed problem with register area growing after "drop DB". (bug #2913).
46
47 --- 2.0.37 2009/05/18
48
49 Example with marc21 is now installed and part of packages.
50
51 Fixed XSL for OAI example.
52
53 Fixed problem with generic proximity handling.
54
55 Added new ranking handler: rank-2. This is a combination of rank-1 and
56 static rank.. The staticrank is inverse (lowest value comes first, etc..).
57 rank-2 thus substracts that from score. This allows a system to specify
58 a "base" rank (=staticrank).
59
60 --- 2.0.36 2009/02/17
61
62 Added implementation-codes directive for .mar files.
63
64 Avoid error for missing recordId when zebraidx' option -s is in use.
65
66 Fixed problem with some disk blocks not beeing freed correctly when
67 'drop database' is used.
68
69 --- 2.0.34 2008/11/06
70
71 Facets can now be performed on sort registers (:s), not just regular indexes
72 (:w, :p) etc.. The performance appers to be much better than before.
73
74 Added a facility to embed metadata for records generated by the DOM XML
75 filter. The meta data step is triggered by a 'process-meta' section in the
76 retrieve section of the dom config, e.g.
77   <retrieve name="myelementset">
78     <xslt stylesheet="my-usual.xsl"/>
79     <process-meta/>
80   </retrieve>
81 The meta section substitutes metadata for all elements called 'meta' in
82 namespace http://indexdata.com/zebra-2.0 . The meta element must have
83 exactly one attribute, name, which specifies the special
84 element set name which is equivalent to the suffix to zebra:: for
85 non-embedded special retrievals. This allows snippets, facets etc to be
86 included.
87
88 Fixed bug #2202: incorrect sorting order when searching multiple databases.
89
90 --- 2.0.32 2008/06/06
91
92 Fixed OAI example.
93
94 --- 2.0.30 2008/05/14
95
96 Changed service name for Windows. Bug #978.
97
98 Fixed the alwaysmatches including _ALLRECORDS for ICU term indexing. Bug #2139.
99
100 --- 2.0.28 2008/04/03
101
102 Handle right-truncation for ICU normalized terms.
103
104 Updated OAI-PMH example.
105
106 --- 2.0.26 2008/01/28 
107
108 Fixes for searches on Chinese text.
109
110 Fixes for scan using ICU indexing terms.
111
112 --- 2.0.24 2008/01/18 
113
114 Fixed some memory violations for ICU enabled indexing that could be
115 triggered by long phrases.
116
117 Enable ICU on Windows. Thanks to Tumer Garip for makefile patches.
118
119 Fixed bug #2002: Zebra crashes during merge using ICU indexing.
120
121 --- 2.0.22 2007/12/20
122
123 Handle encoding errors for strings passed to ICU. (assert was
124 thrown earlier).
125
126 Added zebraidx command, adelete, which attempts to delete records.
127 It's like 'delete', but does not fail if a record does not exist.
128
129 --- 2.0.20 2007/12/19
130
131 Added experimental support for faceted results. This is implemented
132 as a special retrieval on a result set and is triggered using element
133 set name zebra::facet::f1:t1,f2,t2,.. which will return terms and
134 hit counts for field f1, type t1, field f2, type t2, .. The returned
135 data is packed as XML or SUTRS depending on record syntax.
136
137 Added support for Unicode-based indexing using ICU. This allows
138 locale specific scanning, sorting. The implementation is based on
139 the ICU utility part of YAZ 3.0.16 and later. See the manual as well
140 as the examples/marcxml for an example of the use of ICU.
141
142 --- 2.0.18 2007/09/19
143
144 Fixed bug with scan and staticrank enabled. Bug introduced in 2.0.16.
145
146 --- 2.0.16 2007/09/12
147
148 Scan now returns a displayTerm which closer to the original word/phrase
149 from original record.
150
151 Added snippet support. Element set name zebra::snippet will make
152 Zebra return an XML record with snippets (terms around matching terms).
153
154 Fixed bug #1142: Non-indexed but listed attributes issues diagnostic.
155
156 Fixed bug #1131: Missing value-of data in DOM filter.
157
158 Fixed bug #1049: zebra.cfg lines with leading space are ignored.
159
160 Fixed bug #1128: sortmax not honored.
161
162 Fixed bug #1121: Crash for some searches with customized string.chr.
163
164 --- 2.0.14 2007/05/09
165
166 Zebra uses the YAZ 3 API. Note that this changes the Zebra API
167 as well. The register layout is the same however. 
168
169 Fixed bug #1114: scan within set may use excessive CPU.
170
171 Fixed memory leak that occurred in scan.
172
173 Fixed memory leak that occurred for each deleted record.
174
175 Optimize updates of records where content is almost identical to previous
176 version of record. This makes updating of the internal explain database
177 faster too.
178
179 For RPN queries the index type (w,p,..) may be specified verbatim as
180 structure attribute with string value, e.g. @attr 4=w .
181
182 Changed record update API . It is now handled by function
183 zebra_record_update which does insert/replace/delete/update of records .
184 This function replaces zebra_record_{insert,delete} and
185 zebra_admin_exchange_record. The DOM filter uses this feature and the
186 @type attribute in record element specifies the action
187 insert/replace/delete/update.
188
189 Added support for multi-record updates (Bug #944). Based on patch from
190 Hans-Werner Hilse.
191
192 --- 2.0.12 2007/03/07
193
194 Fixed bug with indexing of attributes for rec.grs-class of filters.
195 If X-Path was enabled xelm a/@b would be ignored.
196
197 Fixed bug in register system where 'no more space' messages was produced
198 even though there was plenty of space.
199
200 Fixed bug #884: Entity declarations in input are lost at retrieval time.
201
202 Implemented new filter 'dom'. See test/xslt/dom-config*xml for examples. 
203 This, like alvis, performs indexing and retrieval using XSLT. But Unlike
204 alvis, it allows multiple XSLT steps to be performed and does ISO2709
205 reading. Bug #843.
206
207 --- 2.0.10 2007/01/24
208
209 Staticrank indexing is now an index register type defined in default.idx
210 via directive 'staticrank'. The 'staticrank' directive for grs is no longer
211 supported (was only implemented for Zebra 2.0.8).
212
213 For searches, allow truncmax value to be controlled with attribute 13.
214 If given, that overrides the value of 'truncmax'.
215
216 For truncations being limited (abort at truncmax terms), zebrasrv returns
217 SearchResponse with resultSetStatus=subset.
218
219 For estimated hit counts, zebrasrv returns SearchResponse with 
220 resultSetStatus=estimate.
221
222 --- 2.0.8 2007/01/15
223
224 For searches, do not truncate more than at most 'truncmax' terms in one
225 single term with right-truncation/regular attribute. By default, 'truncmax',
226 is 10000.
227
228 Bug #781: Easier tracking of result sets. We only do this when mkstemp
229 is available (most moderun Unixes supports this). The PID is included
230 in filename : tempdir/zrs_PID_XXXXXX.
231
232 Added support for specification of staticrank for grs-class of filters.
233 This is enabled by using 'staticrank indexname' in .abs. Contents of
234 indexname (elm ... indexname:w) is then used as value for staticrank.
235
236 Implemented sorting via the ISAMB system. To enable, use sortindex:i in
237 zebra.cfg.
238
239 Added special retrieval support for sort keys. These keys can also be
240 fetched using zebra::index:field:s   
241
242 Added support for specification of approximative limits for whole query.
243 This is specified as attribute type 12. Semantics is the same as
244 estimatehits in zebra.cfg.
245
246 --- 2.0.6 2006/11/28
247
248 Fixed bug #736: Updates gets slower.
249
250 Fixed bug #735: Delete fails to process rest of file after a record that
251 does not exist,
252
253 Added RPM package for Zebra 2.
254
255 Improved indexing speed for large documents.
256
257 Added support for special utility retrieval zebra:: which offers retrieval
258 of fundamental properties for record, such as indexed terms, raw record,
259 and system record ID.
260
261 --- 2.0.4 2006/10/16
262
263 Fixed bug #47: Commit needs to check for roll-back.
264
265 Fixed bug #672: Trailing characters in password are ignored
266
267 Added extra presence check for tcl.h, because some systems have
268 tclConfig.sh installed even though Tcl C headers are missing.
269
270 Optimized melm performance.
271
272 Do not use sync(2) during commit (but rely on sync'd individual files).
273
274 Fixed bug in ISAMB's utility function decode_ptr. With gcc -O3 on some
275 platforms the src argument was not updated. Problem was compiler
276 optimization due to strict aliasing rules.
277
278 --- 2.0.2 2006/09/22
279
280 Bug fixes: #638, #647, #657, #669.
281
282 Implement skip of 0 hit counts in scan. Useful for scan operations
283 limited by a result set.
284
285 Honor position attribute, i.e. allow first-in-field search. To
286 enable this, "firstinfield 1" must be given for an index in
287 default.idx. Enabled in tab/default.idx for w. At this stage
288 first-in field is supported for phrase/and-list/or-list searches
289
290 Common stream reader interface for record filters (struct ZebraRecStream).
291
292 Debian package fix: packages idzebra-2.0 + libidzebra-2.0-modules did
293 not depend properly on sub packages.
294
295 --- 2.0.0 2006/08/14
296
297 New record filter (record type) 'alvis' which uses XSLT transformations
298 to drive both indexing as well as retrieval. See example configuration in the
299 'example/alvis-oai' directory.
300
301 'isamb' is now the default ISAM system. In Zebra 1.3, the default ISAM was
302 'isamc'. The type used can still be configured with the 'isam' setting
303 in 'zebra.cfg'.
304
305 Index structure is now 64-bit based, also on 32 bit systems. 
306 There are no more 2GB register file limits.
307
308 Extended search result tuning. Approximate limit for terms can be enabled
309 and specified with attribute 11. The (approx or exact) hit count is returned
310 as part of the search response as in 1.3 series. The subqueryID of a search
311 term hit count can be specified with attribute 10.
312
313 Zebra uses string attributes for indexing internally. Using set+numeric
314 use attribute can still be used. This is a search-only conversion which
315 inspects '*.att'-set files as indicated using attset-directives in 'zebra.cfg'.
316 'attset' references are no longer required, but when used they deserve
317 as "check" for that the index names used are also present in '*.att'.
318
319 Zebra record filters (record type handlers) may be built as loadable
320 modules (.so's) on Unix. In particular the Zebra 2.0 Debian package uses
321 separate packages for each of them. This also means that zebra programs
322 such as zebraidx is no longer depending on Tcl/other..
323
324 Documentation updates, especially on query structure and syntax, SRU, 
325 XSLT support, alvis filter module, and many added examples.
326
327 Improved logging of the 'zebrasrv' and 'zebraidx' binaries.
328
329 Improved debian package structure.
330
331 --- 1.3.16 2004/08/16