0042d7fcf181396b8bd256db6f0add0f6ba65bc9
[idzebra-moved-to-github.git] / NEWS
1 --- 2.0.28 2008/04/03
2
3 Handle right-truncation for ICU normalized terms.
4
5 Updated OAI-PMH example.
6
7 --- 2.0.26 2008/01/28 
8
9 Fixes for searches on Chinese text.
10
11 Fixes for scan using ICU indexing terms.
12
13 --- 2.0.24 2008/01/18 
14
15 Fixed some memory violations for ICU enabled indexing that could be
16 triggered by long phrases.
17
18 Enable ICU on Windows. Thanks to Tumer Garip for makefile patches.
19
20 Fixed bug #2002: Zebra crashes during merge using ICU indexing.
21
22 --- 2.0.22 2007/12/20
23
24 Handle encoding errors for strings passed to ICU. (assert was
25 thrown earlier).
26
27 Added zebraidx command, adelete, which attempts to delete records.
28 It's like 'delete', but does not fail if a record does not exist.
29
30 --- 2.0.20 2007/12/19
31
32 Added experimental support for faceted results. This is implemented
33 as a special retrieval on a result set and is triggered using element
34 set name zebra::facet::f1:t1,f2,t2,.. which will return terms and
35 hit counts for field f1, type t1, field f2, type t2, .. The returned
36 data is packed as XML or SUTRS depending on record syntax.
37
38 Added support for Unicode-based indexing using ICU. This allows
39 locale specific scanning, sorting. The implementation is based on
40 the ICU utility part of YAZ 3.0.16 and later. See the manual as well
41 as the examples/marcxml for an example of the use of ICU.
42
43 --- 2.0.18 2007/09/19
44
45 Fixed bug with scan and staticrank enabled. Bug introduced in 2.0.16.
46
47 --- 2.0.16 2007/09/12
48
49 Scan now returns a displayTerm which closer to the original word/phrase
50 from original record.
51
52 Added snippet support. Element set name zebra::snippet will make
53 Zebra return an XML record with snippets (terms around matching terms).
54
55 Fixed bug #1142: Non-indexed but listed attributes issues diagnostic.
56
57 Fixed bug #1131: Missing value-of data in DOM filter.
58
59 Fixed bug #1049: zebra.cfg lines with leading space are ignored.
60
61 Fixed bug #1128: sortmax not honored.
62
63 Fixed bug #1121: Crash for some searches with customized string.chr.
64
65 --- 2.0.14 2007/05/09
66
67 Zebra uses the YAZ 3 API. Note that this changes the Zebra API
68 as well. The register layout is the same however. 
69
70 Fixed bug #1114: scan within set may use excessive CPU.
71
72 Fixed memory leak that occurred in scan.
73
74 Fixed memory leak that occurred for each deleted record.
75
76 Optimize updates of records where content is almost identical to previous
77 version of record. This makes updating of the internal explain database
78 faster too.
79
80 For RPN queries the index type (w,p,..) may be specified verbatim as
81 structure attribute with string value, e.g. @attr 4=w .
82
83 Changed record update API . It is now handled by function
84 zebra_record_update which does insert/replace/delete/update of records .
85 This function replaces zebra_record_{insert,delete} and
86 zebra_admin_exchange_record. The DOM filter uses this feature and the
87 @type attribute in record element specifies the action
88 insert/replace/delete/update.
89
90 Added support for multi-record updates (Bug #944). Based on patch from
91 Hans-Werner Hilse.
92
93 --- 2.0.12 2007/03/07
94
95 Fixed bug with indexing of attributes for rec.grs-class of filters.
96 If X-Path was enabled xelm a/@b would be ignored.
97
98 Fixed bug in register system where 'no more space' messages was produced
99 even though there was plenty of space.
100
101 Fixed bug #884: Entity declarations in input are lost at retrieval time.
102
103 Implemented new filter 'dom'. See test/xslt/dom-config*xml for examples. 
104 This, like alvis, performs indexing and retrieval using XSLT. But Unlike
105 alvis, it allows multiple XSLT steps to be performed and does ISO2709
106 reading. Bug #843.
107
108 --- 2.0.10 2007/01/24
109
110 Staticrank indexing is now an index register type defined in default.idx
111 via directive 'staticrank'. The 'staticrank' directive for grs is no longer
112 supported (was only implemented for Zebra 2.0.8).
113
114 For searches, allow truncmax value to be controlled with attribute 13.
115 If given, that overrides the value of 'truncmax'.
116
117 For truncations being limited (abort at truncmax terms), zebrasrv returns
118 SearchResponse with resultSetStatus=subset.
119
120 For estimated hit counts, zebrasrv returns SearchResponse with 
121 resultSetStatus=estimate.
122
123 --- 2.0.8 2007/01/15
124
125 For searches, do not truncate more than at most 'truncmax' terms in one
126 single term with right-truncation/regular attribute. By default, 'truncmax',
127 is 10000.
128
129 Bug #781: Easier tracking of result sets. We only do this when mkstemp
130 is available (most moderun Unixes supports this). The PID is included
131 in filename : tempdir/zrs_PID_XXXXXX.
132
133 Added support for specification of staticrank for grs-class of filters.
134 This is enabled by using 'staticrank indexname' in .abs. Contents of
135 indexname (elm ... indexname:w) is then used as value for staticrank.
136
137 Implemented sorting via the ISAMB system. To enable, use sortindex:i in
138 zebra.cfg.
139
140 Added special retrieval support for sort keys. These keys can also be
141 fetched using zebra::index:field:s   
142
143 Added support for specification of approximative limits for whole query.
144 This is specified as attribute type 12. Semantics is the same as
145 estimatehits in zebra.cfg.
146
147 --- 2.0.6 2006/11/28
148
149 Fixed bug #736: Updates gets slower.
150
151 Fixed bug #735: Delete fails to process rest of file after a record that
152 does not exist,
153
154 Added RPM package for Zebra 2.
155
156 Improved indexing speed for large documents.
157
158 Added support for special utility retrieval zebra:: which offers retrieval
159 of fundamental properties for record, such as indexed terms, raw record,
160 and system record ID.
161
162 --- 2.0.4 2006/10/16
163
164 Fixed bug #47: Commit needs to check for roll-back.
165
166 Fixed bug #672: Trailing characters in password are ignored
167
168 Added extra presence check for tcl.h, because some systems have
169 tclConfig.sh installed even though Tcl C headers are missing.
170
171 Optimized melm performance.
172
173 Do not use sync(2) during commit (but rely on sync'd individual files).
174
175 Fixed bug in ISAMB's utility function decode_ptr. With gcc -O3 on some
176 platforms the src argument was not updated. Problem was compiler
177 optimization due to strict aliasing rules.
178
179 --- 2.0.2 2006/09/22
180
181 Bug fixes: #638, #647, #657, #669.
182
183 Implement skip of 0 hit counts in scan. Useful for scan operations
184 limited by a result set.
185
186 Honor position attribute, i.e. allow first-in-field search. To
187 enable this, "firstinfield 1" must be given for an index in
188 default.idx. Enabled in tab/default.idx for w. At this stage
189 first-in field is supported for phrase/and-list/or-list searches
190
191 Common stream reader interface for record filters (struct ZebraRecStream).
192
193 Debian package fix: packages idzebra-2.0 + libidzebra-2.0-modules did
194 not depend properly on sub packages.
195
196 --- 2.0.0 2006/08/14
197
198 New record filter (record type) 'alvis' which uses XSLT transformations
199 to drive both indexing as well as retrieval. See example configuration in the
200 'example/alvis-oai' directory.
201
202 'isamb' is now the default ISAM system. In Zebra 1.3, the default ISAM was
203 'isamc'. The type used can still be configured with the 'isam' setting
204 in 'zebra.cfg'.
205
206 Index structure is now 64-bit based, also on 32 bit systems. 
207 There are no more 2GB register file limits.
208
209 Extended search result tuning. Approximate limit for terms can be enabled
210 and specified with attribute 11. The (approx or exact) hit count is returned
211 as part of the search response as in 1.3 series. The subqueryID of a search
212 term hit count can be specified with attribute 10.
213
214 Zebra uses string attributes for indexing internally. Using set+numeric
215 use attribute can still be used. This is a search-only conversion which
216 inspects '*.att'-set files as indicated using attset-directives in 'zebra.cfg'.
217 'attset' references are no longer required, but when used they deserve
218 as "check" for that the index names used are also present in '*.att'.
219
220 Zebra record filters (record type handlers) may be built as loadable
221 modules (.so's) on Unix. In particular the Zebra 2.0 Debian package uses
222 separate packages for each of them. This also means that zebra programs
223 such as zebraidx is no longer depending on Tcl/other..
224
225 Documentation updates, especially on query structure and syntax, SRU, 
226 XSLT support, alvis filter module, and many added examples.
227
228 Improved logging of the 'zebrasrv' and 'zebraidx' binaries.
229
230 Improved debian package structure.
231
232 --- 1.3.16 2004/08/16