Update NEWS WRT pz:present_chunk
[pazpar2-moved-to-github.git] / NEWS
1 Setting pz:xslt may embed local XSLT as an alternative to referring
2 to filenames.
3 Value is not CDATA but XML nodes embedded, so escaping is not necessary
4 but a root element *must* be present. For example:
5 <settings target="target="z3950.indexdata.com/marc">
6      <set name="pz:xslt">
7        <xsl:stylesheet
8           version="1.0"
9         ..
10        </xsl:stylesheet>
11      </set>
12     </settings>
13
14 Metadata field rank may given by XML internal document (pz:xslt
15 result). If rank is not given, the rank from service description is
16 used - as before.
17
18 New setting, pz:present_chunk, that specifies numer of records to fetch
19 at a time.
20
21 --- 1.6.12 2012/03/14
22
23 Revert the format change in termlist response, that could break 
24 some clients / UIs since they were expecting an (empty) element 
25 if no facet values was found. 
26
27 --- 1.6.11 2012/03/07
28
29 Revert the behavior of returning errors when unable to block 
30 on termlist, bytarget and search, when unable to block due to 
31 other block. The client will now receive a regular response, 
32 but it will be logged in the server. A parameter (report) is
33 added to change behavior to return error response or WARNING 
34 status message. Consider this "API" as private, as it is mostly 
35 untested and could be changed in future releases. 
36
37 Fix spell error in pz2.js fix in 1.6.10.
38
39 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
40 Can solve the missing marc21.xsl updates in some cases. 
41
42 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
43 substring (contribtion from Sven Porst)
44
45 marc21.xsl: fix 1-based substring call
46
47 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
48
49 Add test_termlist_block to test suite
50
51 --- 1.6.10 2012/02/23
52
53 Fix SEGV for invalid PQFs and SRU/SOLR targets
54 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
55
56 Fix pz2.js: "null object" due to change in in bytarget result XML.
57
58 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
59 Added this normalization to the other subject-long fields (d6xx), 
60 where it was missing.
61
62 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
63 Still differences around medium and holdings. marc21.xsl is not 
64 longer active used by Index Data, and should be considered unsupported.
65 Use tmarc.xsl instead. 
66
67 --- 1.6.9 2012/01/19
68
69 Fix SEGV that could occur for failed connections.
70
71 --- 1.6.8 2012/01/17
72
73 Fix bug for command sort that could return no results for active clients
74 (from previous search). This bug was present in 1.6.6-1.6.7.
75
76 Fix bug in results that could include results that should have been
77 filtered out. This bug was present in 1.6.6-1.6.7.
78
79 --- 1.6.7 2011/12/23
80
81 Fix bug introduced in 1.6.6 where a connection re-use could stall
82 incoming requests.
83
84 Local filtering may now specify a local metadata field, eg.
85  pz:limitmap:somefield[t]=local:otherfield
86
87 --- 1.6.6 2011/11/25
88
89 For search, when limit and or filtering is in place and search
90 is identical to previous search, the result set is re-used and the
91 target is not searched.
92
93 Limits may work perform local filtering as well, by using "local:"
94 for a limitmap.
95
96 --- 1.6.5 2011/11/01
97
98 Updated bytarget command to contain a suggestions element with misspelled
99 words and suggestions to these. pz2.js has been updated to deliver this 
100 onwards as well. Only target that currently delivers this is the solr 
101 client in YAZ 4.2.18. 
102
103 --- 1.6.4 2011/10/28
104
105 New service definition element, xslt, that allows an embedded stylesheet
106 to be defined. This can be referred to from pz:xslt as an alternative to
107 external files.
108
109 New pz:sortmap:field setting for specifying hints on how to make
110 a target natively sort on a field. This is used for command=show in
111 conjunction with sort.
112
113 New pz:url setting for specifying the actual URL for a target. When
114 this is used the target ID is not used as URL anymore and the target ID
115 may be almost any string (not including []).
116
117 command=termlist without name parameter returns all termlists/facets.
118 Previously if name parameter was omitted, only "subject" was returned.
119
120 --- 1.6.3 2011/09/22
121
122 Make termlist sorting stable. Terms with same frequency are now sorted by
123 their display name. This makes a pretty display and improves our
124 regression test because qsort is not a stable sort.
125
126 New sort parameter value 'position'. The 'position' sorts merged records
127 by their original position from the remote target. This is primarily useful
128 for debugging and may be used for targets that already perform some kind
129 of relevance ranking. Note that sort by default is decreasing; so to get
130 records in their original order sort=position:1 must be used.
131
132 --- 1.6.2 2011/09/15
133
134 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
135
136 Facility to change working directory for pazpar2 daemon. Option -wdir
137 sets working directory to dir. This facility is useful if core dumps
138 must be saved. In this case, the current working directory must be
139 writable by the running user, such as "nobody".
140
141 --- 1.6.1 2011/09/14
142
143 New configuration element <icu_chain> for <server>/<service> which
144 allows a named ICU rule (chain) to be defined. The names relevance,
145 sort, mergekey and facet are used for those operations. The definition
146   <icu_chain id="sort" locale="en"> ..  </icu_chain>
147 is identical to
148   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
149 And so on.. for relevance, mergekey and facet as well. The latter
150 style is deprecated. The facet terms are normalized by the facet
151 rule by default. This may be changed on a metadata field basis by
152 defining the new attribute 'facetrule' for the metadata element.
153 For example:
154   <icu_chain id="myrule" locale="en"> ... </icu_chain>
155   <metadata name="author" termlist="yes" facetrule="myrule"/>
156
157 Preserve rorder for merged metadata. Fixes issue as reported by Sven
158 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
159
160 tmarc.xsl: set journal-subpart to 773$ only.
161
162 --- 1.6.0 2011/09/12
163
164 Modify the behavior for the limit parameter (first defined in 1.5.7).
165 Mapping of limit searches are now defined by the new configuration item
166 pz:limitmap. Fix a dead-lock problem with the limit parameter.
167
168 Extend tmarc.xsl to extract 773$g data (OpenURL).
169
170 --- 1.5.7 2011/08/19
171
172 ICU default maps remove backquote (`).
173
174 Command 'search' takes limit parameter (optional).  The limit parameter
175 allows a search to be limited one or more facets and the corresponding
176 values. This is for server side filtering.
177
178 Configure tweak: Use -lm for log(3) if needed
179
180 --- 1.5.6 2011/04/15
181
182 Fix a problem with skiparticle sortkey that could be completely
183 ignored (and reduced to "").
184
185 Fix dependency problem in pazpar2 RPM package (did not require
186 libyaz4 as it should).
187
188 --- 1.5.5 2011/03/28
189
190 Fix memory leak that occurred for command=termlist&name=xtargets .
191
192 Pazpar2 may save HTTP requests. Enabled by option -R.
193
194 --- 1.5.4 2011/03/08
195
196 Experimental support for DTIC DADS target. New dads-pz2.xsl.
197
198 Support for query_syntax (overrides the default for SRU | Z39.50) 
199
200 Support for extraArgs (ZOOM "extraArgs" option) for targets
201
202 New commands: status-server and status-session
203
204 --- 1.5.3 2011/02/18
205
206 Fix for threaded runs: Client now have a copy of the database URL, 
207 which can used after the database has been release from the client. 
208 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
209
210 tmarc.xsl: Add journal-title-abbrev and full text. 
211
212 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
213
214 Fix for cmd=record before search.
215
216 Session Logging clean up.
217
218 Fix wrong termlist factor when maxrecs is different from 100.
219
220 --- 1.5.2 2011/01/18
221
222 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
223 Term factor is default enabled but can be diseabled by
224 pz:termlist_term_factor=0
225
226 --- 1.5.1 2011/01/06
227
228 Add scaling of facet count. Currently always enabled, needs fixing.
229 Allow user-defined info for target suffix. This has no meaning in
230 Pazpar2 except to distinguish targets from each other. The suffix
231 data begins with #. For example z3950.indexdata.com/gils#Mydata
232
233 Added exact-match recordfilter; format name=value
234
235 --- 1.5.0 2010/10/05
236
237 SOLR support. Pazpar2 may operate as web service client for SOLR.
238
239 --- 1.4.4 2010/08/17
240
241 Fix for show command and block=1 (dead lock). Bug was introduced in
242 1.4.0.
243
244 --- 1.4.3 2010/07/02
245
246 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
247 tested on CentOS 5.5 only.
248
249 --- 1.4.2 2010/06/18
250
251 Fix problem with result sets being removed from a client session
252 if the connection for it was resused by another session. Bug #3489.
253
254 New iphone UI for Pazpar2 (www/iphone).
255
256 --- 1.4.1 2010/05/21
257
258 Fixes for threaded operation.
259
260 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
261
262 New example services in etc/services in source. In the Debian packages
263 these are located in /etc/pazpar2/services-available
264
265 Threaded mode operational on Windows. Requires Windows 7 or Windows
266 Server 2008.
267
268 Default value of setting pz:max_connections is 0 which means that there
269 is no limit on number of connections.
270
271 --- 1.4.0 2010/03/29
272
273 Pazpar2 may operate in threaded mode. Enabled by element threads in
274 the configuration. See pazpar2_conf for details.
275
276 New setting setting: pz:max_connections. Setting pz:max_connections is
277 a limit of number of sockets to a host. When this limit is reached,
278 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
279 The client will be marked Client_Error when it can not be searched
280 (other clients in a session may work). If pz:max_connections is not set
281 for a target, a value of 30 will be used. Note: the pz:max_connections
282 will only work in threaded mode.
283
284 pz2.js: JSON support for show.
285
286 Debian package: Enable default service, default.xml, before starting
287 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
288
289 --- 1.3.0 2010/01/25
290
291 Debian version depends on on libyaz4. Note that Pazpar2 will still
292 compile from source with YAZ 3.
293
294 Split services into separate files. The example configuration file
295 pazpar2.cfg.dist now includes a default service default.xml (part of
296 etc). And default.xml includes settings/edu.xml. The default.xml file,
297 not to be confused with settings/defaults.xml, is a template for jsdemo
298 and other services. The Debian package installs /etc/pazpar2/server.xml
299 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
300 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
301 The default.xml (from etc) is installed in /etc/pazpar2/services-available
302 and a symlink to it is created from services-enabled. The default.xml
303 service is unnamed and, thus, will be used by jsdemo and test1.
304
305 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
306 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
307
308 --- 1.2.4 2010/01/15
309
310 Support for additional fields in cf.xsl and pazpar2.conf.dist:
311 publisher, available, due, location (=locallocation), callno
312 (=callnumber), thumburl and score.
313
314 Describe pz:xslt and the auto setting.
315
316 Move mergekey definition away from the normalization stylesheets and
317 define a mergekey common for all target types in pazpar2.cfg.
318
319 Code update: Use the Odr_int type for hit counts. This is part of
320 YAZ 3.0.47 and later and so configure checks for that.
321
322 --- 1.2.3 2009/11/24
323
324 Metadata attribute 'skiparticle' also works for ICU based
325 normalization. (was only working for the non-ICU/ASCII before).
326
327 Command bytarget with argument settings=1 will show settings per
328 target.. This is to be able to verify correct settings and be able to
329 test that they are correct. The database settings array size is now
330 also stored..  Problems with database settings array is that if not
331 careful it will be too small (smaller than dictionary per-service
332 in settings).
333
334 Make record list sorting stable by comparing mergekey for records if
335 relevance/title or other sorting criteria all match. This is merely to
336 ensure that our regressions tests works (reproducible output).
337
338 Relevance calculation changes: use a different denominator (length) for
339 per-field relevance scoring.. Instead of length of all ranked fields we
340 now use length of individual fields (as if they were individual "free"
341 text fields). This will ensure that documents with a long field with no
342 match (say description) will not "hurt" a title match.
343
344 Diagnostic member was not set on connection error. Fixed
345
346 --- 1.2.2 2009/10/13
347
348 Command search takes two optional parameters, startecs and maxrecs,
349 that specifies the start offset (0, 1, ...) and maximum number of records
350 to fetch for each target.
351
352 XSLTs + MARC maps are cached within a session so we don't re-parse
353 them over and over again. Even for a session with a single search
354 there's much to be gained because many targets use the same
355 transformation.
356
357 The metadata attribute 'mergekey' now takes one of three values 'no',
358 'required', 'optional' .  And the resulting mergekey from metadata
359 is now ordered in the same way as metadata in the service definition.
360 Older Pazpar2 version use the order in which metadata appeared in a
361 record instance.
362
363 The search argument 'filter' now offers a new operator ~ which does a 
364 substring match. The = operator works as before: string match for
365 anything but pz:id, or target match for pz:id.
366
367 New setting pz:recordfilter. The value of this setting takes the
368 form name[~value]. This setting makes Pazpar2 ignore all retrieved
369 records that do not have the metadata element name with value substring
370 (if given).
371
372 Pazpar2 allows YAZ log level to be set (option -v).
373
374 --- 1.2.1 2009/10/05
375
376 For WS responses Pazpar2 creates XML header. Exception: raw record.
377
378 Setting XML files are now stored in etc/settings instead of etc. This
379 reflects the layout with the Debian package layout.
380
381 Settings may be posted for command=settings. The POSTed settings must
382 have root element 'settings' like regular setting files. In order to be
383 recognized, the POST request must use Content-Type=text/xml.
384
385 A service may be posted for command=init. This service will be used
386 during the session. The service may have its own target settings,
387 ICU config, timeout, etc. In order to be recognized, the POST request
388 must use Content-Type=text/xml.
389
390 Timeout values may be given per-service. That's element 'timeout' 
391 which takes three attribute values (a subset may be given): 'session',
392 'z3950_operation', 'z3950_session'. Option -T is no longer supported
393 - used to specify session timeout.
394
395 Option -t tests the Pazpar2 configuration and returns exit code
396 (0=success, non-zero=failure). In previous version of Pazpar2, -t
397 specified local settings.
398
399 In version 1.2.0 the configuration file - after include processing -
400 was dumped to stdout. Now, the configuration is only dumped to the
401 yaz log file if option -d is given.
402
403 --- 1.2.0 2009/09/10
404
405 Configuration may now have multiple server areas. This means that a
406 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
407 yet supported - on a server basis. Configuration may also have multiple
408 services .. That is repeating service elements inside a server. Each
409 has an attribute 'id' which serves as service ID. This ID in turn may
410 be used in a Pazpar2 session, by specifying parameter service=ID for
411 command init. There can be at most one unnamed service inside a server
412 which can be referred to by not specifying an service ID for command
413 init (backwards compatible). In order to partition multiple servers and
414 services a new include directive has been added. This takes an attribute
415 'src' which specifies one or more sub-files. For example to include
416 service files, one might use:
417   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
418 It is the intention that that completely makes the settings directive
419 redundant.
420
421 Fix problem where the record command would wait forever if there were
422 no targets to wait for (activeclients == 0).
423
424 --- 1.1.1 2009/08/28
425
426 One result set is created per session (last search) rather than for
427 each connection which happen to be shared (bug #3009).
428
429 marc21 stylesheets changed for efficiency.
430
431 --- 1.1.0 2009/08/19
432
433 Session timeout may be specified on the command-line as option -T.
434
435 Pazpar2 may now be operated in a no-merged mode for records.. All records
436 will be considered unique. This mode is enabled if no mergekey is
437 generated by the normalization stylesheet (pz:xslt). 
438
439 Pazpar2 caches original records from each target and the 'record' command
440 with offset returns the original record if 'syntax' and 'esn' are NOT
441 specified. This speeds up retrieval of original records but also means
442 that Pazpar2 uses more memory. The cached records will be freed when the
443 session terminates or a new search is executed.
444
445 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
446 library part of YAZ is used.
447
448 Added SRU client support.
449
450 Automatically computes pz:nativesyntax if not provided. Works for XML and
451 MARC.
452
453 --- 1.0.13 2008/11/24
454
455 Command bytarget returns name of target (if defined).
456
457 --- 1.0.12 2008/11/04
458
459 Fixed bug #2021.. location now holds all brief elements.
460
461 --- 1.0.11 2008/10/15
462
463 Fixed check for application/x-www-form-urlencoded parameters.
464
465 --- 1.0.10 2008/10/14
466
467 Fixes for IE in pz2.js.
468
469 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
470
471 --- 1.0.9 2008/05/23
472
473 Changed the JS library pz2.js to use POST for long URL (+ params).
474
475 Added installation instructions for Windows. Note: NT services is
476 NOT available until we make a new release of YAZ.
477
478 Preserve order of repeated metadata fields (they were reversed before).
479
480 More MARC21 information extracted for metadata.
481
482 --- 1.0.8 2008/04/22
483
484 Fixed bug #1162: HTML entities are not escaped properly.
485
486 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
487
488 --- 1.0.7 2008/04/14
489
490 Marc21 stylesheet updated to reflect multiple full text fields
491
492 --- 1.0.6 2008/03/12
493
494 Fixed bug in pz2.js WRT DOMElement attributes on IE.
495
496 Fixed bug 2100: Database wildcards not working
497
498 --- 1.0.5 2007/11/09
499
500 Added support for retrieval of records in binary.
501
502 Fixed bug 1794: Pazpar2 does not return valid XML.
503
504 Deal with ICU not returning sortkey (resulted in SEGV before).
505
506 --- 1.0.4 2007/09/28
507
508 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
509 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
510
511 Improved diagnostics when Pazpar2 HTTP decoding fails.
512
513 Pazpar2 requests may be POSTed as using Content-Type
514 application/x-www-form-urlencoded.
515
516 Pazpar2 honors LF in HTTP headers.
517
518 Handle targets that handle negative hit counts (should not happen, but it
519 does).
520
521 --- 1.0.3 2007/09/19
522
523 ICU is used for tokenization and normalization of the following: mergekey,
524 sorting, relevance terms.
525
526 Debian package now enables ICU tokenization and normalization by default.
527
528 --- 1.0.2 2007/08/22
529
530 Exposed user setting values (i.e. non-pz: names) to the record systems in two
531 ways: Either as parameters to the normalization stylesheets (which would allow the
532 programmer to postprocess or use the values in any way) or after the normalization
533 step, in which case values are made part of the normalized record (and available for
534 sorting, termlists, display, or other interface-related use.
535
536 Implemented sorting by year.
537
538 Option -d dumps records to the current log file instead of stderr.
539
540 Fixes for compilation on cygwin.
541
542 Z39.50 client code uses pz:elements. pz:elements was recognized in
543 earlier Pazpar2 versions but it was not used for anything.
544
545 icu_chain_test is using fgets instead of getline - fixes compilation
546 on MacOSX .
547
548 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
549 query conversions fail (rather than _any_). This means targets that do
550 not support some fields are ignored in a search.
551
552 --- 1.0.1 2007/07/03
553
554 Improved handling of socket timeout for Z39.50 connections. 
555
556 Misc documentation updates and spell fixes.
557
558 Debian package pazpar2 creates log rotate entry.
559
560 Debian package pazpar2-apache2 reloads Apache2.
561
562 jsdemo included in distribution. It illustrates the use of the js/pz2.js
563 JavaScript library.
564
565 --- 1.0.0 2007/06/20
566
567 First public release.
568