Version 1.1.
[idzebra-moved-to-github.git] / CHANGELOG
1 --- 1.1 2001/10/25
2
3 Updated for YAZ version 1.8.
4
5 Added support for termsets - a result set of terms matching
6 a given query.
7
8 Added support for raw retrieval. Element Set Name R forces the
9 text filter which returns the record in its original form.
10
11 Added numerical sort - triggered by structure=numeric (4=109).
12
13 Remote record import using Z39.50 Extended Services and Segments.
14
15 Fixed bug where updating a database with user-defined attributes
16 could corrupt the register (bad storeKeys).
17
18 Multi-threaded version.
19
20 Fixed bug regarding proximity.
21
22 Documentation updates.
23
24 Fixed bug in record retrieval module that occured on 64-bit OSF 
25 architectures.
26
27 --- 1.0.1 2000/2/10
28
29 Fixed bug in makefile for WIN32.
30
31 Fixed bug in configure script - used bash-specific features.
32
33 --- 1.0 1999/12/10
34
35 The software was split in two products Zebra (for testing,
36 non-profit use) and the commercial product Z'mbol. Zebra no
37 longer supports INDEX UPDATES, i.e. zebraidx should be invoked only
38 once for each register. Refer to LICENSE.zebra for more info.
39
40 Added support for multiple records in one file for filter grs.sgml.
41
42 Changed record index structure. New layout is incompatible with
43 previous releases. Added setting "recordcompression" to control
44 compression of records. Possible values are "none" (no
45 compression) and bzip2 (compression using libbz2).
46
47 Added XML transfer syntax support for retrieval of structured records.
48 Schema in CompSpec is recognised in retrieval of structured records.
49
50 Changed Tcl record filter so that it attemps to read  <filt>.tflt. If
51 that fails, the filter reads the file <filt>.flt (regx style filter).
52
53 Implemented new Tcl record filter -  use grs.tcl.<filter> to enable it.
54 Zebra's configure script automatically attempts to locate Tcl. For
55 manual Tcl configuration use option --with-tclconfig=<path> to specify
56 where Tcl's library files are located.
57
58 Implemented "compression" of Dictionary and ISAM system. Dictionary
59 format HAS changed.
60
61 Added "tagsysno" directive to zebra.cfg to control under which tag the
62 system ID is placed. Use tagsysno: 0 to disable Zebra's system number
63 entirely.
64
65 Added "tagrank" as above.
66
67 Changed file naming scheme for register files from <name>.mf.<no> to
68 <name>-<no>.mf.
69
70 Implemented "position"-flag for register type (as defined in
71 default.idx). When set to zero no position (or seqence number) is
72 saved in register for each word occurrence, thus saving some register
73 space.
74
75 Implemented database mapping. Using mapdb one can specify a database
76 to be mapped to one or more physical databases. Usage:
77 mapdb <fromdb> <todb> ..
78
79 Added SOIF-filter. Thanks to Peter Valkenburg.
80
81 For the regx-filter "end element -record" may trigger a mark-of-record
82 if outer level is reached.
83
84 Tag sets may be typed in the reference to it. From the .abs-file the
85 "tagset" directive takes a third optional integer type for the tag set
86 referenced. From a .tag-file the "include" directive takes a third
87 optional type as well. The old "type" directive in the tag set itself
88 is still recognized but acts as the default type for the tag set.
89  
90 Zebra supports the specification of arbitrary attributes sets, schemas
91 and tag sets, because of the change in YAZ' OID management system.
92
93 Fixed bug in Sort that caused it NOT to use character mapping as it
94 should.
95
96 Zebra now uses GNU configure to generate Makefile(s).
97
98 Added un-optimised support for left and left/right truncation attributes.
99
100 Added support for relational operators on text when using RPN queries.
101
102 Added support for sort specifications in RPN queries. Type 7 specifies
103 'sort' where value 1=ascending, value 2=descending. The use attribute
104 specifies the field criteria as usual.  The term specifies priority
105 where 0=first, 1=second, ...
106
107 Changed the way use attributes are specified in the recordId
108 specification.
109
110 Maximum number of databases in one Zebra register increased.
111
112 New setting, databasePath, which specifies that first directory during
113 update traversal is the database name (instead of a fixed one).
114
115 New setting, explainDatabase, which specifies that databases are
116 EXPLAIN aware.
117
118 Modified Zebra so that it works with ASN.1 compiled code for YAZ.
119
120 Implemented EXPLAIN database maintenance. Zebra automatically
121 generate - and update CategoryList, TargetInfo, DatabaseInfo,
122 AttributeSetInfo and AttributeDetails records at this stage. The
123 records may be transferred as GRS-1, SUTRS or Explain.
124
125 Fixed register spec so that colon isn't treated as size separator
126 unless followed by [0-9+-] in order to allow DOS drive specifications.
127
128 Fixed two bugs in ISAMC system.
129
130 Changed the way Zebra keeps its maintenance information about attribute
131 sets, available attributes, etc.. Records in "SGML" notation using an
132 EXPLAIN schema is now used when appropriate.
133
134 Bug fix: Index didn't handle update/insert/delete of the same record
135 (i.e. same recordId) in one run (one invocation of zebraidx). Only the
136 first occurence of a record is considered.
137
138 Most searches now return correct number of hits.
139
140 New modular ranking system. Interested programmers are encouraged to
141 inspect rank1.c and improve the algorithm.
142
143 Bug fix: Lock files weren't removed as they should on NT.
144
145 Implemented Z39.50 Sort. Zebra's sort handler uses use attributes to
146 specify a "sort register". Refer to the gils sample records which refer
147 to index type "s" which is specified as "sort" in the default.idx file.
148 Each sort criteria can either be Ascending or Descending and at most
149 three sort elements can be specified.  
150
151 Bug fix: Character mapping didn't work for text files.
152
153 --- 1.0b1 1998/1/29
154
155 Simple ranked searches now return correct number of hits.
156
157 The test option (-s) only makes a read-lock on the index as well
158 as using read-only operations anywhere.
159
160 Moved towards generic character mapping. Configuration file default.idx
161 specifies character map files for register types w, p, u, etc.
162
163 Implemented "begin variant" for the sgml.regx - filter.
164
165 Fixed a few memory leaks.
166
167 Added support for C++, headers uses extern "C" for public definitions.
168
169 Bug fix: The show records facility (-s) only displayed information for
170 the first record in a file (and not for every record in the file).
171
172 Added option "-f <n>" to limit the logging of record operations. After
173 <n> records has been processed no logging is performed (unless errors
174 occur).
175
176 Bug fix: the compressed ISAM system didn't handle update operations
177 correctly.
178
179 Added setting, "maxResultSetSize", to hold the number of records to 
180 save in a result set.
181
182 Bug fix: Complete phrase did't work for search operations.
183
184 Bug fix: temporary result sets weren't deleted.
185
186 Reduced disk space for saved keys (storeKeys = 1).
187
188 Added optional, physical ANY (key replication)
189
190 Implemented proximity operator in search.
191
192 Bug fix: the path name buffers used by file match traversal routines
193 have been extended to support long file names.
194
195 New C(ompressed) ISAM system. To enable it, specify "isam: c" in the
196 configuration file. The resulting register without "storeKeys" is about
197 half the size, and the memory used by zebraidx during phase 2 (merge) is
198 reduced to a minimum.
199
200 Reworked the way Regexp-2 queries with error tolerance are handled and
201 specified. The documentation has been updated accordingly.
202
203 Bug fix: Zebrasrv didn't search correctly when queries contained masking
204 characters. This bug was introduced in 1.0a8.
205
206 Zebrasrv now tag records with the proper database name.
207
208 New settings, memMax and keyTmpDir.
209
210 Changed name of setting lockDir (previously called lockPath) and
211 setTmpDir (previously called tempSetPath).
212
213 Generalized and changed record type specifications. In short, there are:
214        text                plain SUTRS
215        grs.sgml            structured, "SGML-like" syntax
216        grs.regx.<filter>   structured, Regular expression filter
217        grs.marc.<abs>      Reads *MARC records in the ISO2709 format. <abs>
218                            is the name of an abstract syntax file.                           
219 Bug fix: Result sets weren't sorted in operations involving boolean
220 operations with "ranked" operands.
221
222 --- 1.0a8 1996/6/6
223
224 Added national character-handling subsystem.
225
226 Various fixes.
227
228 Small modifications to input filters and profiles.
229
230 Added support for SOIF syntax (with private OID).
231
232 --- 1.0a7 1996/5/16
233
234 Fixed buffer-size problem in indexing.
235
236 Added compression to temporary files for updating.
237
238 Added phrase registers.
239
240 Added dynamic mapping of search attribute to multiple termlists (ANY).
241
242 Scan support in multiple databases/registers.
243
244 Configuration settings are case-insensitive and single dash (-)
245 characters are ignored in comparisons.
246
247 The index processing ignores empty files - warning given.
248
249 New option to zebraidx (-V) displays version information.
250
251 --- 1.0a6 1996/2/24
252
253 Fixed problem in file-update system.
254
255 Fixed problem in shadow system; register was sometimes corrupted after
256 a commit operation.
257
258 --- 1.0a5 1996/2/10
259
260 Fixed problems in the ISAM subsystem. Caused difficulties when updating
261 existing registers.
262
263 Fixed small problem in SUTRS-filter. A newline was sometimes inserted before
264 the rank and record number.
265
266 Fixed bug in the isam subsystem - caused a malfunction when accessing
267 words which occurred more than 10000 times.
268
269 Distribution should now include YAZ (Z39.50 protocol stack) to simplify
270 installation.
271
272 Server can now run under inetd. Use option -i, and -w <directory> to
273 set working directory to desired location.
274
275 New zebraidx command: clean - removes temporary shadow files.
276
277 Fixed bug in ISAM system. Occurred rarely during register updates.
278
279 Logging during index merge phase is improved. The remaining running
280 time is estimated.
281
282 Temporary files generated by zebraidx are removed after each run.
283
284 Bug fix: Dictionary didn't handle 8-bit characters correctly; was obvious
285 when doing scan operations in dictionaries with European characters.
286
287 --- 1.0a4 1996/01/11
288
289 A whole slew of updates, to make the first publicized release. Get the doc
290 and check it out.
291
292 --- 1.0a3 1995/12/06
293
294 Memory-problems in ISAM fixed. More blocktypes added to the default setup
295 to increase performance on larger databases.
296
297 Various minor changes in data management system.
298
299 --- 1.0a2 1995/12/05
300
301 A couple of portability-problems resolved.
302
303 Changed some malloc() to xmalloc().
304
305 --- 1.0a1 1995/11/28
306
307 First release.