Changes about limit, re-search
[pazpar2-moved-to-github.git] / NEWS
1 For search, when limit and or filtering is in place and search
2 is identical to previous search, the result set is re-used and the
3 target is not searched.
4
5 Limits may work perform local filtering as well, by using "local:"
6 for a limitmap.
7
8 --- 1.6.5 2011/11/01
9
10 Updated bytarget command to contain a suggestions element with misspelled
11 words and suggestions to these. pz2.js has been updated to deliver this 
12 onwards as well. Only target that currently delivers this is the solr 
13 client in YAZ 4.2.18. 
14
15 --- 1.6.4 2011/10/28
16
17 New service definition element, xslt, that allows an embedded stylesheet
18 to be defined. This can be referred to from pz:xslt as an alternative to
19 external files.
20
21 New pz:sortmap:field setting for specifying hints on how to make
22 a target natively sort on a field. This is used for command=show in
23 conjunction with sort.
24
25 New pz:url setting for specifying the actual URL for a target. When
26 this is used the target ID is not used as URL anymore and the target ID
27 may be almost any string (not including []).
28
29 command=termlist without name parameter returns all termlists/facets.
30 Previously if name parameter was omitted, only "subject" was returned.
31
32 --- 1.6.3 2011/09/22
33
34 Make termlist sorting stable. Terms with same frequency are now sorted by
35 their display name. This makes a pretty display and improves our
36 regression test because qsort is not a stable sort.
37
38 New sort parameter value 'position'. The 'position' sorts merged records
39 by their original position from the remote target. This is primarily useful
40 for debugging and may be used for targets that already perform some kind
41 of relevance ranking. Note that sort by default is decreasing; so to get
42 records in their original order sort=position:1 must be used.
43
44 --- 1.6.2 2011/09/15
45
46 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
47
48 Facility to change working directory for pazpar2 daemon. Option -wdir
49 sets working directory to dir. This facility is useful if core dumps
50 must be saved. In this case, the current working directory must be
51 writable by the running user, such as "nobody".
52
53 --- 1.6.1 2011/09/14
54
55 New configuration element <icu_chain> for <server>/<service> which
56 allows a named ICU rule (chain) to be defined. The names relevance,
57 sort, mergekey and facet are used for those operations. The definition
58   <icu_chain id="sort" locale="en"> ..  </icu_chain>
59 is identical to
60   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
61 And so on.. for relevance, mergekey and facet as well. The latter
62 style is deprecated. The facet terms are normalized by the facet
63 rule by default. This may be changed on a metadata field basis by
64 defining the new attribute 'facetrule' for the metadata element.
65 For example:
66   <icu_chain id="myrule" locale="en"> ... </icu_chain>
67   <metadata name="author" termlist="yes" facetrule="myrule"/>
68
69 Preserve rorder for merged metadata. Fixes issue as reported by Sven
70 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
71
72 tmarc.xsl: set journal-subpart to 773$ only.
73
74 --- 1.6.0 2011/09/12
75
76 Modify the behavior for the limit parameter (first defined in 1.5.7).
77 Mapping of limit searches are now defined by the new configuration item
78 pz:limitmap. Fix a dead-lock problem with the limit parameter.
79
80 Extend tmarc.xsl to extract 773$g data (OpenURL).
81
82 --- 1.5.7 2011/08/19
83
84 ICU default maps remove backquote (`).
85
86 Command 'search' takes limit parameter (optional).  The limit parameter
87 allows a search to be limited one or more facets and the corresponding
88 values. This is for server side filtering.
89
90 Configure tweak: Use -lm for log(3) if needed
91
92 --- 1.5.6 2011/04/15
93
94 Fix a problem with skiparticle sortkey that could be completely
95 ignored (and reduced to "").
96
97 Fix dependency problem in pazpar2 RPM package (did not require
98 libyaz4 as it should).
99
100 --- 1.5.5 2011/03/28
101
102 Fix memory leak that occurred for command=termlist&name=xtargets .
103
104 Pazpar2 may save HTTP requests. Enabled by option -R.
105
106 --- 1.5.4 2011/03/08
107
108 Experimental support for DTIC DADS target. New dads-pz2.xsl.
109
110 Support for query_syntax (overrides the default for SRU | Z39.50) 
111
112 Support for extraArgs (ZOOM "extraArgs" option) for targets
113
114 New commands: status-server and status-session
115
116 --- 1.5.3 2011/02/18
117
118 Fix for threaded runs: Client now have a copy of the database URL, 
119 which can used after the database has been release from the client. 
120 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
121
122 tmarc.xsl: Add journal-title-abbrev and full text. 
123
124 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
125
126 Fix for cmd=record before search.
127
128 Session Logging clean up.
129
130 Fix wrong termlist factor when maxrecs is different from 100.
131
132 --- 1.5.2 2011/01/18
133
134 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
135 Term factor is default enabled but can be diseabled by
136 pz:termlist_term_factor=0
137
138 --- 1.5.1 2011/01/06
139
140 Add scaling of facet count. Currently always enabled, needs fixing.
141 Allow user-defined info for target suffix. This has no meaning in
142 Pazpar2 except to distinguish targets from each other. The suffix
143 data begins with #. For example z3950.indexdata.com/gils#Mydata
144
145 Added exact-match recordfilter; format name=value
146
147 --- 1.5.0 2010/10/05
148
149 SOLR support. Pazpar2 may operate as web service client for SOLR.
150
151 --- 1.4.4 2010/08/17
152
153 Fix for show command and block=1 (dead lock). Bug was introduced in
154 1.4.0.
155
156 --- 1.4.3 2010/07/02
157
158 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
159 tested on CentOS 5.5 only.
160
161 --- 1.4.2 2010/06/18
162
163 Fix problem with result sets being removed from a client session
164 if the connection for it was resused by another session. Bug #3489.
165
166 New iphone UI for Pazpar2 (www/iphone).
167
168 --- 1.4.1 2010/05/21
169
170 Fixes for threaded operation.
171
172 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
173
174 New example services in etc/services in source. In the Debian packages
175 these are located in /etc/pazpar2/services-available
176
177 Threaded mode operational on Windows. Requires Windows 7 or Windows
178 Server 2008.
179
180 Default value of setting pz:max_connections is 0 which means that there
181 is no limit on number of connections.
182
183 --- 1.4.0 2010/03/29
184
185 Pazpar2 may operate in threaded mode. Enabled by element threads in
186 the configuration. See pazpar2_conf for details.
187
188 New setting setting: pz:max_connections. Setting pz:max_connections is
189 a limit of number of sockets to a host. When this limit is reached,
190 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
191 The client will be marked Client_Error when it can not be searched
192 (other clients in a session may work). If pz:max_connections is not set
193 for a target, a value of 30 will be used. Note: the pz:max_connections
194 will only work in threaded mode.
195
196 pz2.js: JSON support for show.
197
198 Debian package: Enable default service, default.xml, before starting
199 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
200
201 --- 1.3.0 2010/01/25
202
203 Debian version depends on on libyaz4. Note that Pazpar2 will still
204 compile from source with YAZ 3.
205
206 Split services into separate files. The example configuration file
207 pazpar2.cfg.dist now includes a default service default.xml (part of
208 etc). And default.xml includes settings/edu.xml. The default.xml file,
209 not to be confused with settings/defaults.xml, is a template for jsdemo
210 and other services. The Debian package installs /etc/pazpar2/server.xml
211 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
212 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
213 The default.xml (from etc) is installed in /etc/pazpar2/services-available
214 and a symlink to it is created from services-enabled. The default.xml
215 service is unnamed and, thus, will be used by jsdemo and test1.
216
217 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
218 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
219
220 --- 1.2.4 2010/01/15
221
222 Support for additional fields in cf.xsl and pazpar2.conf.dist:
223 publisher, available, due, location (=locallocation), callno
224 (=callnumber), thumburl and score.
225
226 Describe pz:xslt and the auto setting.
227
228 Move mergekey definition away from the normalization stylesheets and
229 define a mergekey common for all target types in pazpar2.cfg.
230
231 Code update: Use the Odr_int type for hit counts. This is part of
232 YAZ 3.0.47 and later and so configure checks for that.
233
234 --- 1.2.3 2009/11/24
235
236 Metadata attribute 'skiparticle' also works for ICU based
237 normalization. (was only working for the non-ICU/ASCII before).
238
239 Command bytarget with argument settings=1 will show settings per
240 target.. This is to be able to verify correct settings and be able to
241 test that they are correct. The database settings array size is now
242 also stored..  Problems with database settings array is that if not
243 careful it will be too small (smaller than dictionary per-service
244 in settings).
245
246 Make record list sorting stable by comparing mergekey for records if
247 relevance/title or other sorting criteria all match. This is merely to
248 ensure that our regressions tests works (reproducible output).
249
250 Relevance calculation changes: use a different denominator (length) for
251 per-field relevance scoring.. Instead of length of all ranked fields we
252 now use length of individual fields (as if they were individual "free"
253 text fields). This will ensure that documents with a long field with no
254 match (say description) will not "hurt" a title match.
255
256 Diagnostic member was not set on connection error. Fixed
257
258 --- 1.2.2 2009/10/13
259
260 Command search takes two optional parameters, startecs and maxrecs,
261 that specifies the start offset (0, 1, ...) and maximum number of records
262 to fetch for each target.
263
264 XSLTs + MARC maps are cached within a session so we don't re-parse
265 them over and over again. Even for a session with a single search
266 there's much to be gained because many targets use the same
267 transformation.
268
269 The metadata attribute 'mergekey' now takes one of three values 'no',
270 'required', 'optional' .  And the resulting mergekey from metadata
271 is now ordered in the same way as metadata in the service definition.
272 Older Pazpar2 version use the order in which metadata appeared in a
273 record instance.
274
275 The search argument 'filter' now offers a new operator ~ which does a 
276 substring match. The = operator works as before: string match for
277 anything but pz:id, or target match for pz:id.
278
279 New setting pz:recordfilter. The value of this setting takes the
280 form name[~value]. This setting makes Pazpar2 ignore all retrieved
281 records that do not have the metadata element name with value substring
282 (if given).
283
284 Pazpar2 allows YAZ log level to be set (option -v).
285
286 --- 1.2.1 2009/10/05
287
288 For WS responses Pazpar2 creates XML header. Exception: raw record.
289
290 Setting XML files are now stored in etc/settings instead of etc. This
291 reflects the layout with the Debian package layout.
292
293 Settings may be posted for command=settings. The POSTed settings must
294 have root element 'settings' like regular setting files. In order to be
295 recognized, the POST request must use Content-Type=text/xml.
296
297 A service may be posted for command=init. This service will be used
298 during the session. The service may have its own target settings,
299 ICU config, timeout, etc. In order to be recognized, the POST request
300 must use Content-Type=text/xml.
301
302 Timeout values may be given per-service. That's element 'timeout' 
303 which takes three attribute values (a subset may be given): 'session',
304 'z3950_operation', 'z3950_session'. Option -T is no longer supported
305 - used to specify session timeout.
306
307 Option -t tests the Pazpar2 configuration and returns exit code
308 (0=success, non-zero=failure). In previous version of Pazpar2, -t
309 specified local settings.
310
311 In version 1.2.0 the configuration file - after include processing -
312 was dumped to stdout. Now, the configuration is only dumped to the
313 yaz log file if option -d is given.
314
315 --- 1.2.0 2009/09/10
316
317 Configuration may now have multiple server areas. This means that a
318 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
319 yet supported - on a server basis. Configuration may also have multiple
320 services .. That is repeating service elements inside a server. Each
321 has an attribute 'id' which serves as service ID. This ID in turn may
322 be used in a Pazpar2 session, by specifying parameter service=ID for
323 command init. There can be at most one unnamed service inside a server
324 which can be referred to by not specifying an service ID for command
325 init (backwards compatible). In order to partition multiple servers and
326 services a new include directive has been added. This takes an attribute
327 'src' which specifies one or more sub-files. For example to include
328 service files, one might use:
329   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
330 It is the intention that that completely makes the settings directive
331 redundant.
332
333 Fix problem where the record command would wait forever if there were
334 no targets to wait for (activeclients == 0).
335
336 --- 1.1.1 2009/08/28
337
338 One result set is created per session (last search) rather than for
339 each connection which happen to be shared (bug #3009).
340
341 marc21 stylesheets changed for efficiency.
342
343 --- 1.1.0 2009/08/19
344
345 Session timeout may be specified on the command-line as option -T.
346
347 Pazpar2 may now be operated in a no-merged mode for records.. All records
348 will be considered unique. This mode is enabled if no mergekey is
349 generated by the normalization stylesheet (pz:xslt). 
350
351 Pazpar2 caches original records from each target and the 'record' command
352 with offset returns the original record if 'syntax' and 'esn' are NOT
353 specified. This speeds up retrieval of original records but also means
354 that Pazpar2 uses more memory. The cached records will be freed when the
355 session terminates or a new search is executed.
356
357 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
358 library part of YAZ is used.
359
360 Added SRU client support.
361
362 Automatically computes pz:nativesyntax if not provided. Works for XML and
363 MARC.
364
365 --- 1.0.13 2008/11/24
366
367 Command bytarget returns name of target (if defined).
368
369 --- 1.0.12 2008/11/04
370
371 Fixed bug #2021.. location now holds all brief elements.
372
373 --- 1.0.11 2008/10/15
374
375 Fixed check for application/x-www-form-urlencoded parameters.
376
377 --- 1.0.10 2008/10/14
378
379 Fixes for IE in pz2.js.
380
381 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
382
383 --- 1.0.9 2008/05/23
384
385 Changed the JS library pz2.js to use POST for long URL (+ params).
386
387 Added installation instructions for Windows. Note: NT services is
388 NOT available until we make a new release of YAZ.
389
390 Preserve order of repeated metadata fields (they were reversed before).
391
392 More MARC21 information extracted for metadata.
393
394 --- 1.0.8 2008/04/22
395
396 Fixed bug #1162: HTML entities are not escaped properly.
397
398 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
399
400 --- 1.0.7 2008/04/14
401
402 Marc21 stylesheet updated to reflect multiple full text fields
403
404 --- 1.0.6 2008/03/12
405
406 Fixed bug in pz2.js WRT DOMElement attributes on IE.
407
408 Fixed bug 2100: Database wildcards not working
409
410 --- 1.0.5 2007/11/09
411
412 Added support for retrieval of records in binary.
413
414 Fixed bug 1794: Pazpar2 does not return valid XML.
415
416 Deal with ICU not returning sortkey (resulted in SEGV before).
417
418 --- 1.0.4 2007/09/28
419
420 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
421 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
422
423 Improved diagnostics when Pazpar2 HTTP decoding fails.
424
425 Pazpar2 requests may be POSTed as using Content-Type
426 application/x-www-form-urlencoded.
427
428 Pazpar2 honors LF in HTTP headers.
429
430 Handle targets that handle negative hit counts (should not happen, but it
431 does).
432
433 --- 1.0.3 2007/09/19
434
435 ICU is used for tokenization and normalization of the following: mergekey,
436 sorting, relevance terms.
437
438 Debian package now enables ICU tokenization and normalization by default.
439
440 --- 1.0.2 2007/08/22
441
442 Exposed user setting values (i.e. non-pz: names) to the record systems in two
443 ways: Either as parameters to the normalization stylesheets (which would allow the
444 programmer to postprocess or use the values in any way) or after the normalization
445 step, in which case values are made part of the normalized record (and available for
446 sorting, termlists, display, or other interface-related use.
447
448 Implemented sorting by year.
449
450 Option -d dumps records to the current log file instead of stderr.
451
452 Fixes for compilation on cygwin.
453
454 Z39.50 client code uses pz:elements. pz:elements was recognized in
455 earlier Pazpar2 versions but it was not used for anything.
456
457 icu_chain_test is using fgets instead of getline - fixes compilation
458 on MacOSX .
459
460 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
461 query conversions fail (rather than _any_). This means targets that do
462 not support some fields are ignored in a search.
463
464 --- 1.0.1 2007/07/03
465
466 Improved handling of socket timeout for Z39.50 connections. 
467
468 Misc documentation updates and spell fixes.
469
470 Debian package pazpar2 creates log rotate entry.
471
472 Debian package pazpar2-apache2 reloads Apache2.
473
474 jsdemo included in distribution. It illustrates the use of the js/pz2.js
475 JavaScript library.
476
477 --- 1.0.0 2007/06/20
478
479 First public release.
480