Update NEWS
[pazpar2-moved-to-github.git] / NEWS
1 Setting pz:xslt may embed local XSLT as an alternative to referring
2 to filenames.
3 Value is not CDATA but XML nodes embedded, so escaping is not necessary
4 but a root element *must* be present. For example:
5 <settings target="target="z3950.indexdata.com/marc">
6      <set name="pz:xslt">
7        <xsl:stylesheet
8           version="1.0"
9         ..
10        </xsl:stylesheet>
11      </set>
12     </settings>
13
14 Metadata field rank may given by XML internal document (pz:xslt
15 result). If rank is not given, the rank from service description is
16 used - as before.
17
18 --- 1.6.12 2012/03/14
19
20 Revert the format change in termlist response, that could break 
21 some clients / UIs since they were expecting an (empty) element 
22 if no facet values was found. 
23
24 --- 1.6.11 2012/03/07
25
26 Revert the behavior of returning errors when unable to block 
27 on termlist, bytarget and search, when unable to block due to 
28 other block. The client will now receive a regular response, 
29 but it will be logged in the server. A parameter (report) is
30 added to change behavior to return error response or WARNING 
31 status message. Consider this "API" as private, as it is mostly 
32 untested and could be changed in future releases. 
33
34 Fix spell error in pz2.js fix in 1.6.10.
35
36 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
37 Can solve the missing marc21.xsl updates in some cases. 
38
39 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
40 substring (contribtion from Sven Porst)
41
42 marc21.xsl: fix 1-based substring call
43
44 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
45
46 Add test_termlist_block to test suite
47
48 --- 1.6.10 2012/02/23
49
50 Fix SEGV for invalid PQFs and SRU/SOLR targets
51 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
52
53 Fix pz2.js: "null object" due to change in in bytarget result XML.
54
55 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
56 Added this normalization to the other subject-long fields (d6xx), 
57 where it was missing.
58
59 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
60 Still differences around medium and holdings. marc21.xsl is not 
61 longer active used by Index Data, and should be considered unsupported.
62 Use tmarc.xsl instead. 
63
64 --- 1.6.9 2012/01/19
65
66 Fix SEGV that could occur for failed connections.
67
68 --- 1.6.8 2012/01/17
69
70 Fix bug for command sort that could return no results for active clients
71 (from previous search). This bug was present in 1.6.6-1.6.7.
72
73 Fix bug in results that could include results that should have been
74 filtered out. This bug was present in 1.6.6-1.6.7.
75
76 --- 1.6.7 2011/12/23
77
78 Fix bug introduced in 1.6.6 where a connection re-use could stall
79 incoming requests.
80
81 Local filtering may now specify a local metadata field, eg.
82  pz:limitmap:somefield[t]=local:otherfield
83
84 --- 1.6.6 2011/11/25
85
86 For search, when limit and or filtering is in place and search
87 is identical to previous search, the result set is re-used and the
88 target is not searched.
89
90 Limits may work perform local filtering as well, by using "local:"
91 for a limitmap.
92
93 --- 1.6.5 2011/11/01
94
95 Updated bytarget command to contain a suggestions element with misspelled
96 words and suggestions to these. pz2.js has been updated to deliver this 
97 onwards as well. Only target that currently delivers this is the solr 
98 client in YAZ 4.2.18. 
99
100 --- 1.6.4 2011/10/28
101
102 New service definition element, xslt, that allows an embedded stylesheet
103 to be defined. This can be referred to from pz:xslt as an alternative to
104 external files.
105
106 New pz:sortmap:field setting for specifying hints on how to make
107 a target natively sort on a field. This is used for command=show in
108 conjunction with sort.
109
110 New pz:url setting for specifying the actual URL for a target. When
111 this is used the target ID is not used as URL anymore and the target ID
112 may be almost any string (not including []).
113
114 command=termlist without name parameter returns all termlists/facets.
115 Previously if name parameter was omitted, only "subject" was returned.
116
117 --- 1.6.3 2011/09/22
118
119 Make termlist sorting stable. Terms with same frequency are now sorted by
120 their display name. This makes a pretty display and improves our
121 regression test because qsort is not a stable sort.
122
123 New sort parameter value 'position'. The 'position' sorts merged records
124 by their original position from the remote target. This is primarily useful
125 for debugging and may be used for targets that already perform some kind
126 of relevance ranking. Note that sort by default is decreasing; so to get
127 records in their original order sort=position:1 must be used.
128
129 --- 1.6.2 2011/09/15
130
131 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
132
133 Facility to change working directory for pazpar2 daemon. Option -wdir
134 sets working directory to dir. This facility is useful if core dumps
135 must be saved. In this case, the current working directory must be
136 writable by the running user, such as "nobody".
137
138 --- 1.6.1 2011/09/14
139
140 New configuration element <icu_chain> for <server>/<service> which
141 allows a named ICU rule (chain) to be defined. The names relevance,
142 sort, mergekey and facet are used for those operations. The definition
143   <icu_chain id="sort" locale="en"> ..  </icu_chain>
144 is identical to
145   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
146 And so on.. for relevance, mergekey and facet as well. The latter
147 style is deprecated. The facet terms are normalized by the facet
148 rule by default. This may be changed on a metadata field basis by
149 defining the new attribute 'facetrule' for the metadata element.
150 For example:
151   <icu_chain id="myrule" locale="en"> ... </icu_chain>
152   <metadata name="author" termlist="yes" facetrule="myrule"/>
153
154 Preserve rorder for merged metadata. Fixes issue as reported by Sven
155 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
156
157 tmarc.xsl: set journal-subpart to 773$ only.
158
159 --- 1.6.0 2011/09/12
160
161 Modify the behavior for the limit parameter (first defined in 1.5.7).
162 Mapping of limit searches are now defined by the new configuration item
163 pz:limitmap. Fix a dead-lock problem with the limit parameter.
164
165 Extend tmarc.xsl to extract 773$g data (OpenURL).
166
167 --- 1.5.7 2011/08/19
168
169 ICU default maps remove backquote (`).
170
171 Command 'search' takes limit parameter (optional).  The limit parameter
172 allows a search to be limited one or more facets and the corresponding
173 values. This is for server side filtering.
174
175 Configure tweak: Use -lm for log(3) if needed
176
177 --- 1.5.6 2011/04/15
178
179 Fix a problem with skiparticle sortkey that could be completely
180 ignored (and reduced to "").
181
182 Fix dependency problem in pazpar2 RPM package (did not require
183 libyaz4 as it should).
184
185 --- 1.5.5 2011/03/28
186
187 Fix memory leak that occurred for command=termlist&name=xtargets .
188
189 Pazpar2 may save HTTP requests. Enabled by option -R.
190
191 --- 1.5.4 2011/03/08
192
193 Experimental support for DTIC DADS target. New dads-pz2.xsl.
194
195 Support for query_syntax (overrides the default for SRU | Z39.50) 
196
197 Support for extraArgs (ZOOM "extraArgs" option) for targets
198
199 New commands: status-server and status-session
200
201 --- 1.5.3 2011/02/18
202
203 Fix for threaded runs: Client now have a copy of the database URL, 
204 which can used after the database has been release from the client. 
205 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
206
207 tmarc.xsl: Add journal-title-abbrev and full text. 
208
209 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
210
211 Fix for cmd=record before search.
212
213 Session Logging clean up.
214
215 Fix wrong termlist factor when maxrecs is different from 100.
216
217 --- 1.5.2 2011/01/18
218
219 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
220 Term factor is default enabled but can be diseabled by
221 pz:termlist_term_factor=0
222
223 --- 1.5.1 2011/01/06
224
225 Add scaling of facet count. Currently always enabled, needs fixing.
226 Allow user-defined info for target suffix. This has no meaning in
227 Pazpar2 except to distinguish targets from each other. The suffix
228 data begins with #. For example z3950.indexdata.com/gils#Mydata
229
230 Added exact-match recordfilter; format name=value
231
232 --- 1.5.0 2010/10/05
233
234 SOLR support. Pazpar2 may operate as web service client for SOLR.
235
236 --- 1.4.4 2010/08/17
237
238 Fix for show command and block=1 (dead lock). Bug was introduced in
239 1.4.0.
240
241 --- 1.4.3 2010/07/02
242
243 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
244 tested on CentOS 5.5 only.
245
246 --- 1.4.2 2010/06/18
247
248 Fix problem with result sets being removed from a client session
249 if the connection for it was resused by another session. Bug #3489.
250
251 New iphone UI for Pazpar2 (www/iphone).
252
253 --- 1.4.1 2010/05/21
254
255 Fixes for threaded operation.
256
257 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
258
259 New example services in etc/services in source. In the Debian packages
260 these are located in /etc/pazpar2/services-available
261
262 Threaded mode operational on Windows. Requires Windows 7 or Windows
263 Server 2008.
264
265 Default value of setting pz:max_connections is 0 which means that there
266 is no limit on number of connections.
267
268 --- 1.4.0 2010/03/29
269
270 Pazpar2 may operate in threaded mode. Enabled by element threads in
271 the configuration. See pazpar2_conf for details.
272
273 New setting setting: pz:max_connections. Setting pz:max_connections is
274 a limit of number of sockets to a host. When this limit is reached,
275 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
276 The client will be marked Client_Error when it can not be searched
277 (other clients in a session may work). If pz:max_connections is not set
278 for a target, a value of 30 will be used. Note: the pz:max_connections
279 will only work in threaded mode.
280
281 pz2.js: JSON support for show.
282
283 Debian package: Enable default service, default.xml, before starting
284 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
285
286 --- 1.3.0 2010/01/25
287
288 Debian version depends on on libyaz4. Note that Pazpar2 will still
289 compile from source with YAZ 3.
290
291 Split services into separate files. The example configuration file
292 pazpar2.cfg.dist now includes a default service default.xml (part of
293 etc). And default.xml includes settings/edu.xml. The default.xml file,
294 not to be confused with settings/defaults.xml, is a template for jsdemo
295 and other services. The Debian package installs /etc/pazpar2/server.xml
296 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
297 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
298 The default.xml (from etc) is installed in /etc/pazpar2/services-available
299 and a symlink to it is created from services-enabled. The default.xml
300 service is unnamed and, thus, will be used by jsdemo and test1.
301
302 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
303 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
304
305 --- 1.2.4 2010/01/15
306
307 Support for additional fields in cf.xsl and pazpar2.conf.dist:
308 publisher, available, due, location (=locallocation), callno
309 (=callnumber), thumburl and score.
310
311 Describe pz:xslt and the auto setting.
312
313 Move mergekey definition away from the normalization stylesheets and
314 define a mergekey common for all target types in pazpar2.cfg.
315
316 Code update: Use the Odr_int type for hit counts. This is part of
317 YAZ 3.0.47 and later and so configure checks for that.
318
319 --- 1.2.3 2009/11/24
320
321 Metadata attribute 'skiparticle' also works for ICU based
322 normalization. (was only working for the non-ICU/ASCII before).
323
324 Command bytarget with argument settings=1 will show settings per
325 target.. This is to be able to verify correct settings and be able to
326 test that they are correct. The database settings array size is now
327 also stored..  Problems with database settings array is that if not
328 careful it will be too small (smaller than dictionary per-service
329 in settings).
330
331 Make record list sorting stable by comparing mergekey for records if
332 relevance/title or other sorting criteria all match. This is merely to
333 ensure that our regressions tests works (reproducible output).
334
335 Relevance calculation changes: use a different denominator (length) for
336 per-field relevance scoring.. Instead of length of all ranked fields we
337 now use length of individual fields (as if they were individual "free"
338 text fields). This will ensure that documents with a long field with no
339 match (say description) will not "hurt" a title match.
340
341 Diagnostic member was not set on connection error. Fixed
342
343 --- 1.2.2 2009/10/13
344
345 Command search takes two optional parameters, startecs and maxrecs,
346 that specifies the start offset (0, 1, ...) and maximum number of records
347 to fetch for each target.
348
349 XSLTs + MARC maps are cached within a session so we don't re-parse
350 them over and over again. Even for a session with a single search
351 there's much to be gained because many targets use the same
352 transformation.
353
354 The metadata attribute 'mergekey' now takes one of three values 'no',
355 'required', 'optional' .  And the resulting mergekey from metadata
356 is now ordered in the same way as metadata in the service definition.
357 Older Pazpar2 version use the order in which metadata appeared in a
358 record instance.
359
360 The search argument 'filter' now offers a new operator ~ which does a 
361 substring match. The = operator works as before: string match for
362 anything but pz:id, or target match for pz:id.
363
364 New setting pz:recordfilter. The value of this setting takes the
365 form name[~value]. This setting makes Pazpar2 ignore all retrieved
366 records that do not have the metadata element name with value substring
367 (if given).
368
369 Pazpar2 allows YAZ log level to be set (option -v).
370
371 --- 1.2.1 2009/10/05
372
373 For WS responses Pazpar2 creates XML header. Exception: raw record.
374
375 Setting XML files are now stored in etc/settings instead of etc. This
376 reflects the layout with the Debian package layout.
377
378 Settings may be posted for command=settings. The POSTed settings must
379 have root element 'settings' like regular setting files. In order to be
380 recognized, the POST request must use Content-Type=text/xml.
381
382 A service may be posted for command=init. This service will be used
383 during the session. The service may have its own target settings,
384 ICU config, timeout, etc. In order to be recognized, the POST request
385 must use Content-Type=text/xml.
386
387 Timeout values may be given per-service. That's element 'timeout' 
388 which takes three attribute values (a subset may be given): 'session',
389 'z3950_operation', 'z3950_session'. Option -T is no longer supported
390 - used to specify session timeout.
391
392 Option -t tests the Pazpar2 configuration and returns exit code
393 (0=success, non-zero=failure). In previous version of Pazpar2, -t
394 specified local settings.
395
396 In version 1.2.0 the configuration file - after include processing -
397 was dumped to stdout. Now, the configuration is only dumped to the
398 yaz log file if option -d is given.
399
400 --- 1.2.0 2009/09/10
401
402 Configuration may now have multiple server areas. This means that a
403 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
404 yet supported - on a server basis. Configuration may also have multiple
405 services .. That is repeating service elements inside a server. Each
406 has an attribute 'id' which serves as service ID. This ID in turn may
407 be used in a Pazpar2 session, by specifying parameter service=ID for
408 command init. There can be at most one unnamed service inside a server
409 which can be referred to by not specifying an service ID for command
410 init (backwards compatible). In order to partition multiple servers and
411 services a new include directive has been added. This takes an attribute
412 'src' which specifies one or more sub-files. For example to include
413 service files, one might use:
414   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
415 It is the intention that that completely makes the settings directive
416 redundant.
417
418 Fix problem where the record command would wait forever if there were
419 no targets to wait for (activeclients == 0).
420
421 --- 1.1.1 2009/08/28
422
423 One result set is created per session (last search) rather than for
424 each connection which happen to be shared (bug #3009).
425
426 marc21 stylesheets changed for efficiency.
427
428 --- 1.1.0 2009/08/19
429
430 Session timeout may be specified on the command-line as option -T.
431
432 Pazpar2 may now be operated in a no-merged mode for records.. All records
433 will be considered unique. This mode is enabled if no mergekey is
434 generated by the normalization stylesheet (pz:xslt). 
435
436 Pazpar2 caches original records from each target and the 'record' command
437 with offset returns the original record if 'syntax' and 'esn' are NOT
438 specified. This speeds up retrieval of original records but also means
439 that Pazpar2 uses more memory. The cached records will be freed when the
440 session terminates or a new search is executed.
441
442 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
443 library part of YAZ is used.
444
445 Added SRU client support.
446
447 Automatically computes pz:nativesyntax if not provided. Works for XML and
448 MARC.
449
450 --- 1.0.13 2008/11/24
451
452 Command bytarget returns name of target (if defined).
453
454 --- 1.0.12 2008/11/04
455
456 Fixed bug #2021.. location now holds all brief elements.
457
458 --- 1.0.11 2008/10/15
459
460 Fixed check for application/x-www-form-urlencoded parameters.
461
462 --- 1.0.10 2008/10/14
463
464 Fixes for IE in pz2.js.
465
466 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
467
468 --- 1.0.9 2008/05/23
469
470 Changed the JS library pz2.js to use POST for long URL (+ params).
471
472 Added installation instructions for Windows. Note: NT services is
473 NOT available until we make a new release of YAZ.
474
475 Preserve order of repeated metadata fields (they were reversed before).
476
477 More MARC21 information extracted for metadata.
478
479 --- 1.0.8 2008/04/22
480
481 Fixed bug #1162: HTML entities are not escaped properly.
482
483 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
484
485 --- 1.0.7 2008/04/14
486
487 Marc21 stylesheet updated to reflect multiple full text fields
488
489 --- 1.0.6 2008/03/12
490
491 Fixed bug in pz2.js WRT DOMElement attributes on IE.
492
493 Fixed bug 2100: Database wildcards not working
494
495 --- 1.0.5 2007/11/09
496
497 Added support for retrieval of records in binary.
498
499 Fixed bug 1794: Pazpar2 does not return valid XML.
500
501 Deal with ICU not returning sortkey (resulted in SEGV before).
502
503 --- 1.0.4 2007/09/28
504
505 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
506 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
507
508 Improved diagnostics when Pazpar2 HTTP decoding fails.
509
510 Pazpar2 requests may be POSTed as using Content-Type
511 application/x-www-form-urlencoded.
512
513 Pazpar2 honors LF in HTTP headers.
514
515 Handle targets that handle negative hit counts (should not happen, but it
516 does).
517
518 --- 1.0.3 2007/09/19
519
520 ICU is used for tokenization and normalization of the following: mergekey,
521 sorting, relevance terms.
522
523 Debian package now enables ICU tokenization and normalization by default.
524
525 --- 1.0.2 2007/08/22
526
527 Exposed user setting values (i.e. non-pz: names) to the record systems in two
528 ways: Either as parameters to the normalization stylesheets (which would allow the
529 programmer to postprocess or use the values in any way) or after the normalization
530 step, in which case values are made part of the normalized record (and available for
531 sorting, termlists, display, or other interface-related use.
532
533 Implemented sorting by year.
534
535 Option -d dumps records to the current log file instead of stderr.
536
537 Fixes for compilation on cygwin.
538
539 Z39.50 client code uses pz:elements. pz:elements was recognized in
540 earlier Pazpar2 versions but it was not used for anything.
541
542 icu_chain_test is using fgets instead of getline - fixes compilation
543 on MacOSX .
544
545 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
546 query conversions fail (rather than _any_). This means targets that do
547 not support some fields are ignored in a search.
548
549 --- 1.0.1 2007/07/03
550
551 Improved handling of socket timeout for Z39.50 connections. 
552
553 Misc documentation updates and spell fixes.
554
555 Debian package pazpar2 creates log rotate entry.
556
557 Debian package pazpar2-apache2 reloads Apache2.
558
559 jsdemo included in distribution. It illustrates the use of the js/pz2.js
560 JavaScript library.
561
562 --- 1.0.0 2007/06/20
563
564 First public release.
565