186603f3a6811699d601e3a985da251380b06708
[pazpar2-moved-to-github.git] / NEWS
1 --- 1.6.18 2012/09/17
2
3 Rank algorithm configurable by 'rank' element inside service. So far
4 only, attribute 'cluster' is recognized. If cluster="yes", multiple
5 records inside a cluster boosts higher than single records. This
6 is default behavior and existing behavior. cluster="no" takes the
7 average score of each record in a cluster.
8
9 --- 1.6.17 2012/09/05
10
11 Fix bad re-use of connections (connections with changing proxy should not
12 be reused).
13
14 --- 1.6.16 2012/08/22
15
16 Fix a bug introduce in 1.6.15 around the position sorting. It resetted the 
17 resultset and sorting when the sort order is position. However this will be done on
18 every client poll, which will make pazpar2 continuing reset and fetching. 
19 It should only be done on FIRST request where the sort order change. 
20
21 Fix an issue on suggestion option: Also disable suggestions on empty string. 
22
23 Clean up in turbo marc stylesheet. 
24
25 Remove the hardcoded size of termlists.
26
27 --- 1.6.15 2012/06/27
28
29 New facility: ccldirective may be given in service definition. Allows
30 CCL parsing to be customized a bit, such as defining names of operators
31 and, or, not.
32
33 New facility: raw record by checksum, rather than offset. The record
34 command optionally takes checksum which identifies certain record from
35 a database.
36
37 New facility: per field ranking. Rank may be given as M [F N] where
38 M is default rank and N is rank for CCL terms from field F.
39
40 --- 1.6.14 2012/06/04
41
42 Fix for IE7/8 in pz.js
43
44 Applied patch from Giannis Kosmas on keepAlive, which also adds keepAlive to init response. 
45
46 Lower log level some places.
47
48 Remove some invalid test results. 
49
50 --- 1.6.13 2012/05/23
51
52 Introducing a version=2 parameter for show, termlist and bytarget commands.
53 This enables pazpar2 to return approximation on hit and count count when 
54 doing record filtering using the limit parameter on search and a 
55 limitmap with a value of "local:"
56
57 Setting pz:xslt may embed local XSLT as an alternative to referring
58 to filenames.
59 Value is not CDATA but XML nodes embedded, so escaping is not necessary
60 but a root element *must* be present. For example:
61 <settings target="target="z3950.indexdata.com/marc">
62      <set name="pz:xslt">
63        <xsl:stylesheet
64           version="1.0"
65         ..
66        </xsl:stylesheet>
67      </set>
68     </settings>
69
70 Metadata field rank may given by XML internal document (pz:xslt
71 result). If rank is not given, the rank from service description is
72 used - as before.
73
74 Metadata field can now configured a default limitmap and facetmap. 
75 Setting limitmap to "local:" would work for all kind of targets, but would
76 prob. not be the optimal solution. But at least better than the default behavior 
77 of pazpar2 where no filtering is done. 
78
79 A service definition can now also contains <set/> that defines service-wide
80 settings. These will override server-wide sets and will be overridded by 
81 settings.
82
83 New setting, pz:present_chunk, that specifies number of records to fetch
84 at a time. Zero will disable chunkation; will fetch max_records at once.
85
86 --- 1.6.12 2012/03/14
87
88 Revert the format change in termlist response, that could break 
89 some clients / UIs since they were expecting an (empty) element 
90 if no facet values was found. 
91
92 --- 1.6.11 2012/03/07
93
94 Revert the behavior of returning errors when unable to block 
95 on termlist, bytarget and search, when unable to block due to 
96 other block. The client will now receive a regular response, 
97 but it will be logged in the server. A parameter (report) is
98 added to change behavior to return error response or WARNING 
99 status message. Consider this "API" as private, as it is mostly 
100 untested and could be changed in future releases. 
101
102 Fix spell error in pz2.js fix in 1.6.10.
103
104 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
105 Can solve the missing marc21.xsl updates in some cases. 
106
107 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
108 substring (contribtion from Sven Porst)
109
110 marc21.xsl: fix 1-based substring call
111
112 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
113
114 Add test_termlist_block to test suite
115
116 --- 1.6.10 2012/02/23
117
118 Fix SEGV for invalid PQFs and SRU/SOLR targets
119 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
120
121 Fix pz2.js: "null object" due to change in in bytarget result XML.
122
123 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
124 Added this normalization to the other subject-long fields (d6xx), 
125 where it was missing.
126
127 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
128 Still differences around medium and holdings. marc21.xsl is not 
129 longer active used by Index Data, and should be considered unsupported.
130 Use tmarc.xsl instead. 
131
132 --- 1.6.9 2012/01/19
133
134 Fix SEGV that could occur for failed connections.
135
136 --- 1.6.8 2012/01/17
137
138 Fix bug for command sort that could return no results for active clients
139 (from previous search). This bug was present in 1.6.6-1.6.7.
140
141 Fix bug in results that could include results that should have been
142 filtered out. This bug was present in 1.6.6-1.6.7.
143
144 --- 1.6.7 2011/12/23
145
146 Fix bug introduced in 1.6.6 where a connection re-use could stall
147 incoming requests.
148
149 Local filtering may now specify a local metadata field, eg.
150  pz:limitmap:somefield[t]=local:otherfield
151
152 --- 1.6.6 2011/11/25
153
154 For search, when limit and or filtering is in place and search
155 is identical to previous search, the result set is re-used and the
156 target is not searched.
157
158 Limits may work perform local filtering as well, by using "local:"
159 for a limitmap.
160
161 --- 1.6.5 2011/11/01
162
163 Updated bytarget command to contain a suggestions element with misspelled
164 words and suggestions to these. pz2.js has been updated to deliver this 
165 onwards as well. Only target that currently delivers this is the solr 
166 client in YAZ 4.2.18. 
167
168 --- 1.6.4 2011/10/28
169
170 New service definition element, xslt, that allows an embedded stylesheet
171 to be defined. This can be referred to from pz:xslt as an alternative to
172 external files.
173
174 New pz:sortmap:field setting for specifying hints on how to make
175 a target natively sort on a field. This is used for command=show in
176 conjunction with sort.
177
178 New pz:url setting for specifying the actual URL for a target. When
179 this is used the target ID is not used as URL anymore and the target ID
180 may be almost any string (not including []).
181
182 command=termlist without name parameter returns all termlists/facets.
183 Previously if name parameter was omitted, only "subject" was returned.
184
185 --- 1.6.3 2011/09/22
186
187 Make termlist sorting stable. Terms with same frequency are now sorted by
188 their display name. This makes a pretty display and improves our
189 regression test because qsort is not a stable sort.
190
191 New sort parameter value 'position'. The 'position' sorts merged records
192 by their original position from the remote target. This is primarily useful
193 for debugging and may be used for targets that already perform some kind
194 of relevance ranking. Note that sort by default is decreasing; so to get
195 records in their original order sort=position:1 must be used.
196
197 --- 1.6.2 2011/09/15
198
199 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
200
201 Facility to change working directory for pazpar2 daemon. Option -wdir
202 sets working directory to dir. This facility is useful if core dumps
203 must be saved. In this case, the current working directory must be
204 writable by the running user, such as "nobody".
205
206 --- 1.6.1 2011/09/14
207
208 New configuration element <icu_chain> for <server>/<service> which
209 allows a named ICU rule (chain) to be defined. The names relevance,
210 sort, mergekey and facet are used for those operations. The definition
211   <icu_chain id="sort" locale="en"> ..  </icu_chain>
212 is identical to
213   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
214 And so on.. for relevance, mergekey and facet as well. The latter
215 style is deprecated. The facet terms are normalized by the facet
216 rule by default. This may be changed on a metadata field basis by
217 defining the new attribute 'facetrule' for the metadata element.
218 For example:
219   <icu_chain id="myrule" locale="en"> ... </icu_chain>
220   <metadata name="author" termlist="yes" facetrule="myrule"/>
221
222 Preserve rorder for merged metadata. Fixes issue as reported by Sven
223 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
224
225 tmarc.xsl: set journal-subpart to 773$ only.
226
227 --- 1.6.0 2011/09/12
228
229 Modify the behavior for the limit parameter (first defined in 1.5.7).
230 Mapping of limit searches are now defined by the new configuration item
231 pz:limitmap. Fix a dead-lock problem with the limit parameter.
232
233 Extend tmarc.xsl to extract 773$g data (OpenURL).
234
235 --- 1.5.7 2011/08/19
236
237 ICU default maps remove backquote (`).
238
239 Command 'search' takes limit parameter (optional).  The limit parameter
240 allows a search to be limited one or more facets and the corresponding
241 values. This is for server side filtering.
242
243 Configure tweak: Use -lm for log(3) if needed
244
245 --- 1.5.6 2011/04/15
246
247 Fix a problem with skiparticle sortkey that could be completely
248 ignored (and reduced to "").
249
250 Fix dependency problem in pazpar2 RPM package (did not require
251 libyaz4 as it should).
252
253 --- 1.5.5 2011/03/28
254
255 Fix memory leak that occurred for command=termlist&name=xtargets .
256
257 Pazpar2 may save HTTP requests. Enabled by option -R.
258
259 --- 1.5.4 2011/03/08
260
261 Experimental support for DTIC DADS target. New dads-pz2.xsl.
262
263 Support for query_syntax (overrides the default for SRU | Z39.50) 
264
265 Support for extraArgs (ZOOM "extraArgs" option) for targets
266
267 New commands: status-server and status-session
268
269 --- 1.5.3 2011/02/18
270
271 Fix for threaded runs: Client now have a copy of the database URL, 
272 which can used after the database has been release from the client. 
273 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
274
275 tmarc.xsl: Add journal-title-abbrev and full text. 
276
277 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
278
279 Fix for cmd=record before search.
280
281 Session Logging clean up.
282
283 Fix wrong termlist factor when maxrecs is different from 100.
284
285 --- 1.5.2 2011/01/18
286
287 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
288 Term factor is default enabled but can be diseabled by
289 pz:termlist_term_factor=0
290
291 --- 1.5.1 2011/01/06
292
293 Add scaling of facet count. Currently always enabled, needs fixing.
294 Allow user-defined info for target suffix. This has no meaning in
295 Pazpar2 except to distinguish targets from each other. The suffix
296 data begins with #. For example z3950.indexdata.com/gils#Mydata
297
298 Added exact-match recordfilter; format name=value
299
300 --- 1.5.0 2010/10/05
301
302 SOLR support. Pazpar2 may operate as web service client for SOLR.
303
304 --- 1.4.4 2010/08/17
305
306 Fix for show command and block=1 (dead lock). Bug was introduced in
307 1.4.0.
308
309 --- 1.4.3 2010/07/02
310
311 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
312 tested on CentOS 5.5 only.
313
314 --- 1.4.2 2010/06/18
315
316 Fix problem with result sets being removed from a client session
317 if the connection for it was resused by another session. Bug #3489.
318
319 New iphone UI for Pazpar2 (www/iphone).
320
321 --- 1.4.1 2010/05/21
322
323 Fixes for threaded operation.
324
325 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
326
327 New example services in etc/services in source. In the Debian packages
328 these are located in /etc/pazpar2/services-available
329
330 Threaded mode operational on Windows. Requires Windows 7 or Windows
331 Server 2008.
332
333 Default value of setting pz:max_connections is 0 which means that there
334 is no limit on number of connections.
335
336 --- 1.4.0 2010/03/29
337
338 Pazpar2 may operate in threaded mode. Enabled by element threads in
339 the configuration. See pazpar2_conf for details.
340
341 New setting setting: pz:max_connections. Setting pz:max_connections is
342 a limit of number of sockets to a host. When this limit is reached,
343 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
344 The client will be marked Client_Error when it can not be searched
345 (other clients in a session may work). If pz:max_connections is not set
346 for a target, a value of 30 will be used. Note: the pz:max_connections
347 will only work in threaded mode.
348
349 pz2.js: JSON support for show.
350
351 Debian package: Enable default service, default.xml, before starting
352 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
353
354 --- 1.3.0 2010/01/25
355
356 Debian version depends on on libyaz4. Note that Pazpar2 will still
357 compile from source with YAZ 3.
358
359 Split services into separate files. The example configuration file
360 pazpar2.cfg.dist now includes a default service default.xml (part of
361 etc). And default.xml includes settings/edu.xml. The default.xml file,
362 not to be confused with settings/defaults.xml, is a template for jsdemo
363 and other services. The Debian package installs /etc/pazpar2/server.xml
364 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
365 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
366 The default.xml (from etc) is installed in /etc/pazpar2/services-available
367 and a symlink to it is created from services-enabled. The default.xml
368 service is unnamed and, thus, will be used by jsdemo and test1.
369
370 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
371 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
372
373 --- 1.2.4 2010/01/15
374
375 Support for additional fields in cf.xsl and pazpar2.conf.dist:
376 publisher, available, due, location (=locallocation), callno
377 (=callnumber), thumburl and score.
378
379 Describe pz:xslt and the auto setting.
380
381 Move mergekey definition away from the normalization stylesheets and
382 define a mergekey common for all target types in pazpar2.cfg.
383
384 Code update: Use the Odr_int type for hit counts. This is part of
385 YAZ 3.0.47 and later and so configure checks for that.
386
387 --- 1.2.3 2009/11/24
388
389 Metadata attribute 'skiparticle' also works for ICU based
390 normalization. (was only working for the non-ICU/ASCII before).
391
392 Command bytarget with argument settings=1 will show settings per
393 target.. This is to be able to verify correct settings and be able to
394 test that they are correct. The database settings array size is now
395 also stored..  Problems with database settings array is that if not
396 careful it will be too small (smaller than dictionary per-service
397 in settings).
398
399 Make record list sorting stable by comparing mergekey for records if
400 relevance/title or other sorting criteria all match. This is merely to
401 ensure that our regressions tests works (reproducible output).
402
403 Relevance calculation changes: use a different denominator (length) for
404 per-field relevance scoring.. Instead of length of all ranked fields we
405 now use length of individual fields (as if they were individual "free"
406 text fields). This will ensure that documents with a long field with no
407 match (say description) will not "hurt" a title match.
408
409 Diagnostic member was not set on connection error. Fixed
410
411 --- 1.2.2 2009/10/13
412
413 Command search takes two optional parameters, startecs and maxrecs,
414 that specifies the start offset (0, 1, ...) and maximum number of records
415 to fetch for each target.
416
417 XSLTs + MARC maps are cached within a session so we don't re-parse
418 them over and over again. Even for a session with a single search
419 there's much to be gained because many targets use the same
420 transformation.
421
422 The metadata attribute 'mergekey' now takes one of three values 'no',
423 'required', 'optional' .  And the resulting mergekey from metadata
424 is now ordered in the same way as metadata in the service definition.
425 Older Pazpar2 version use the order in which metadata appeared in a
426 record instance.
427
428 The search argument 'filter' now offers a new operator ~ which does a 
429 substring match. The = operator works as before: string match for
430 anything but pz:id, or target match for pz:id.
431
432 New setting pz:recordfilter. The value of this setting takes the
433 form name[~value]. This setting makes Pazpar2 ignore all retrieved
434 records that do not have the metadata element name with value substring
435 (if given).
436
437 Pazpar2 allows YAZ log level to be set (option -v).
438
439 --- 1.2.1 2009/10/05
440
441 For WS responses Pazpar2 creates XML header. Exception: raw record.
442
443 Setting XML files are now stored in etc/settings instead of etc. This
444 reflects the layout with the Debian package layout.
445
446 Settings may be posted for command=settings. The POSTed settings must
447 have root element 'settings' like regular setting files. In order to be
448 recognized, the POST request must use Content-Type=text/xml.
449
450 A service may be posted for command=init. This service will be used
451 during the session. The service may have its own target settings,
452 ICU config, timeout, etc. In order to be recognized, the POST request
453 must use Content-Type=text/xml.
454
455 Timeout values may be given per-service. That's element 'timeout' 
456 which takes three attribute values (a subset may be given): 'session',
457 'z3950_operation', 'z3950_session'. Option -T is no longer supported
458 - used to specify session timeout.
459
460 Option -t tests the Pazpar2 configuration and returns exit code
461 (0=success, non-zero=failure). In previous version of Pazpar2, -t
462 specified local settings.
463
464 In version 1.2.0 the configuration file - after include processing -
465 was dumped to stdout. Now, the configuration is only dumped to the
466 yaz log file if option -d is given.
467
468 --- 1.2.0 2009/09/10
469
470 Configuration may now have multiple server areas. This means that a
471 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
472 yet supported - on a server basis. Configuration may also have multiple
473 services .. That is repeating service elements inside a server. Each
474 has an attribute 'id' which serves as service ID. This ID in turn may
475 be used in a Pazpar2 session, by specifying parameter service=ID for
476 command init. There can be at most one unnamed service inside a server
477 which can be referred to by not specifying an service ID for command
478 init (backwards compatible). In order to partition multiple servers and
479 services a new include directive has been added. This takes an attribute
480 'src' which specifies one or more sub-files. For example to include
481 service files, one might use:
482   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
483 It is the intention that that completely makes the settings directive
484 redundant.
485
486 Fix problem where the record command would wait forever if there were
487 no targets to wait for (activeclients == 0).
488
489 --- 1.1.1 2009/08/28
490
491 One result set is created per session (last search) rather than for
492 each connection which happen to be shared (bug #3009).
493
494 marc21 stylesheets changed for efficiency.
495
496 --- 1.1.0 2009/08/19
497
498 Session timeout may be specified on the command-line as option -T.
499
500 Pazpar2 may now be operated in a no-merged mode for records.. All records
501 will be considered unique. This mode is enabled if no mergekey is
502 generated by the normalization stylesheet (pz:xslt). 
503
504 Pazpar2 caches original records from each target and the 'record' command
505 with offset returns the original record if 'syntax' and 'esn' are NOT
506 specified. This speeds up retrieval of original records but also means
507 that Pazpar2 uses more memory. The cached records will be freed when the
508 session terminates or a new search is executed.
509
510 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
511 library part of YAZ is used.
512
513 Added SRU client support.
514
515 Automatically computes pz:nativesyntax if not provided. Works for XML and
516 MARC.
517
518 --- 1.0.13 2008/11/24
519
520 Command bytarget returns name of target (if defined).
521
522 --- 1.0.12 2008/11/04
523
524 Fixed bug #2021.. location now holds all brief elements.
525
526 --- 1.0.11 2008/10/15
527
528 Fixed check for application/x-www-form-urlencoded parameters.
529
530 --- 1.0.10 2008/10/14
531
532 Fixes for IE in pz2.js.
533
534 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
535
536 --- 1.0.9 2008/05/23
537
538 Changed the JS library pz2.js to use POST for long URL (+ params).
539
540 Added installation instructions for Windows. Note: NT services is
541 NOT available until we make a new release of YAZ.
542
543 Preserve order of repeated metadata fields (they were reversed before).
544
545 More MARC21 information extracted for metadata.
546
547 --- 1.0.8 2008/04/22
548
549 Fixed bug #1162: HTML entities are not escaped properly.
550
551 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
552
553 --- 1.0.7 2008/04/14
554
555 Marc21 stylesheet updated to reflect multiple full text fields
556
557 --- 1.0.6 2008/03/12
558
559 Fixed bug in pz2.js WRT DOMElement attributes on IE.
560
561 Fixed bug 2100: Database wildcards not working
562
563 --- 1.0.5 2007/11/09
564
565 Added support for retrieval of records in binary.
566
567 Fixed bug 1794: Pazpar2 does not return valid XML.
568
569 Deal with ICU not returning sortkey (resulted in SEGV before).
570
571 --- 1.0.4 2007/09/28
572
573 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
574 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
575
576 Improved diagnostics when Pazpar2 HTTP decoding fails.
577
578 Pazpar2 requests may be POSTed as using Content-Type
579 application/x-www-form-urlencoded.
580
581 Pazpar2 honors LF in HTTP headers.
582
583 Handle targets that handle negative hit counts (should not happen, but it
584 does).
585
586 --- 1.0.3 2007/09/19
587
588 ICU is used for tokenization and normalization of the following: mergekey,
589 sorting, relevance terms.
590
591 Debian package now enables ICU tokenization and normalization by default.
592
593 --- 1.0.2 2007/08/22
594
595 Exposed user setting values (i.e. non-pz: names) to the record systems in two
596 ways: Either as parameters to the normalization stylesheets (which would allow the
597 programmer to postprocess or use the values in any way) or after the normalization
598 step, in which case values are made part of the normalized record (and available for
599 sorting, termlists, display, or other interface-related use.
600
601 Implemented sorting by year.
602
603 Option -d dumps records to the current log file instead of stderr.
604
605 Fixes for compilation on cygwin.
606
607 Z39.50 client code uses pz:elements. pz:elements was recognized in
608 earlier Pazpar2 versions but it was not used for anything.
609
610 icu_chain_test is using fgets instead of getline - fixes compilation
611 on MacOSX .
612
613 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
614 query conversions fail (rather than _any_). This means targets that do
615 not support some fields are ignored in a search.
616
617 --- 1.0.1 2007/07/03
618
619 Improved handling of socket timeout for Z39.50 connections. 
620
621 Misc documentation updates and spell fixes.
622
623 Debian package pazpar2 creates log rotate entry.
624
625 Debian package pazpar2-apache2 reloads Apache2.
626
627 jsdemo included in distribution. It illustrates the use of the js/pz2.js
628 JavaScript library.
629
630 --- 1.0.0 2007/06/20
631
632 First public release.
633