Version 1.6.19
[pazpar2-moved-to-github.git] / NEWS
1 --- 1.6.19 2012/09/18
2
3 Rank algorithm skips strings that gets normalized to empty string.
4 For example, & and ! could map to the empty string. The weight for
5 those terms is now 0 (as if they were not part of the query).
6
7 Rank algorithm does not use CCL from limitmap; only from the query
8 parameter (user query).
9
10 Obey -w dir.
11
12 --- 1.6.18 2012/09/17
13
14 Rank algorithm configurable by 'rank' element inside service. So far
15 only, attribute 'cluster' is recognized. If cluster="yes", multiple
16 records inside a cluster boosts higher than single records. This
17 is default behavior and existing behavior. cluster="no" takes the
18 average score of each record in a cluster.
19
20 --- 1.6.17 2012/09/05
21
22 Fix bad re-use of connections (connections with changing proxy should not
23 be reused).
24
25 --- 1.6.16 2012/08/22
26
27 Fix a bug introduce in 1.6.15 around the position sorting. It resetted the 
28 resultset and sorting when the sort order is position. However this will be done on
29 every client poll, which will make pazpar2 continuing reset and fetching. 
30 It should only be done on FIRST request where the sort order change. 
31
32 Fix an issue on suggestion option: Also disable suggestions on empty string. 
33
34 Clean up in turbo marc stylesheet. 
35
36 Remove the hardcoded size of termlists.
37
38 --- 1.6.15 2012/06/27
39
40 New facility: ccldirective may be given in service definition. Allows
41 CCL parsing to be customized a bit, such as defining names of operators
42 and, or, not.
43
44 New facility: raw record by checksum, rather than offset. The record
45 command optionally takes checksum which identifies certain record from
46 a database.
47
48 New facility: per field ranking. Rank may be given as M [F N] where
49 M is default rank and N is rank for CCL terms from field F.
50
51 --- 1.6.14 2012/06/04
52
53 Fix for IE7/8 in pz.js
54
55 Applied patch from Giannis Kosmas on keepAlive, which also adds keepAlive to init response. 
56
57 Lower log level some places.
58
59 Remove some invalid test results. 
60
61 --- 1.6.13 2012/05/23
62
63 Introducing a version=2 parameter for show, termlist and bytarget commands.
64 This enables pazpar2 to return approximation on hit and count count when 
65 doing record filtering using the limit parameter on search and a 
66 limitmap with a value of "local:"
67
68 Setting pz:xslt may embed local XSLT as an alternative to referring
69 to filenames.
70 Value is not CDATA but XML nodes embedded, so escaping is not necessary
71 but a root element *must* be present. For example:
72 <settings target="target="z3950.indexdata.com/marc">
73      <set name="pz:xslt">
74        <xsl:stylesheet
75           version="1.0"
76         ..
77        </xsl:stylesheet>
78      </set>
79     </settings>
80
81 Metadata field rank may given by XML internal document (pz:xslt
82 result). If rank is not given, the rank from service description is
83 used - as before.
84
85 Metadata field can now configured a default limitmap and facetmap. 
86 Setting limitmap to "local:" would work for all kind of targets, but would
87 prob. not be the optimal solution. But at least better than the default behavior 
88 of pazpar2 where no filtering is done. 
89
90 A service definition can now also contains <set/> that defines service-wide
91 settings. These will override server-wide sets and will be overridded by 
92 settings.
93
94 New setting, pz:present_chunk, that specifies number of records to fetch
95 at a time. Zero will disable chunkation; will fetch max_records at once.
96
97 --- 1.6.12 2012/03/14
98
99 Revert the format change in termlist response, that could break 
100 some clients / UIs since they were expecting an (empty) element 
101 if no facet values was found. 
102
103 --- 1.6.11 2012/03/07
104
105 Revert the behavior of returning errors when unable to block 
106 on termlist, bytarget and search, when unable to block due to 
107 other block. The client will now receive a regular response, 
108 but it will be logged in the server. A parameter (report) is
109 added to change behavior to return error response or WARNING 
110 status message. Consider this "API" as private, as it is mostly 
111 untested and could be changed in future releases. 
112
113 Fix spell error in pz2.js fix in 1.6.10.
114
115 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
116 Can solve the missing marc21.xsl updates in some cases. 
117
118 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
119 substring (contribtion from Sven Porst)
120
121 marc21.xsl: fix 1-based substring call
122
123 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
124
125 Add test_termlist_block to test suite
126
127 --- 1.6.10 2012/02/23
128
129 Fix SEGV for invalid PQFs and SRU/SOLR targets
130 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
131
132 Fix pz2.js: "null object" due to change in in bytarget result XML.
133
134 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
135 Added this normalization to the other subject-long fields (d6xx), 
136 where it was missing.
137
138 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
139 Still differences around medium and holdings. marc21.xsl is not 
140 longer active used by Index Data, and should be considered unsupported.
141 Use tmarc.xsl instead. 
142
143 --- 1.6.9 2012/01/19
144
145 Fix SEGV that could occur for failed connections.
146
147 --- 1.6.8 2012/01/17
148
149 Fix bug for command sort that could return no results for active clients
150 (from previous search). This bug was present in 1.6.6-1.6.7.
151
152 Fix bug in results that could include results that should have been
153 filtered out. This bug was present in 1.6.6-1.6.7.
154
155 --- 1.6.7 2011/12/23
156
157 Fix bug introduced in 1.6.6 where a connection re-use could stall
158 incoming requests.
159
160 Local filtering may now specify a local metadata field, eg.
161  pz:limitmap:somefield[t]=local:otherfield
162
163 --- 1.6.6 2011/11/25
164
165 For search, when limit and or filtering is in place and search
166 is identical to previous search, the result set is re-used and the
167 target is not searched.
168
169 Limits may work perform local filtering as well, by using "local:"
170 for a limitmap.
171
172 --- 1.6.5 2011/11/01
173
174 Updated bytarget command to contain a suggestions element with misspelled
175 words and suggestions to these. pz2.js has been updated to deliver this 
176 onwards as well. Only target that currently delivers this is the solr 
177 client in YAZ 4.2.18. 
178
179 --- 1.6.4 2011/10/28
180
181 New service definition element, xslt, that allows an embedded stylesheet
182 to be defined. This can be referred to from pz:xslt as an alternative to
183 external files.
184
185 New pz:sortmap:field setting for specifying hints on how to make
186 a target natively sort on a field. This is used for command=show in
187 conjunction with sort.
188
189 New pz:url setting for specifying the actual URL for a target. When
190 this is used the target ID is not used as URL anymore and the target ID
191 may be almost any string (not including []).
192
193 command=termlist without name parameter returns all termlists/facets.
194 Previously if name parameter was omitted, only "subject" was returned.
195
196 --- 1.6.3 2011/09/22
197
198 Make termlist sorting stable. Terms with same frequency are now sorted by
199 their display name. This makes a pretty display and improves our
200 regression test because qsort is not a stable sort.
201
202 New sort parameter value 'position'. The 'position' sorts merged records
203 by their original position from the remote target. This is primarily useful
204 for debugging and may be used for targets that already perform some kind
205 of relevance ranking. Note that sort by default is decreasing; so to get
206 records in their original order sort=position:1 must be used.
207
208 --- 1.6.2 2011/09/15
209
210 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
211
212 Facility to change working directory for pazpar2 daemon. Option -wdir
213 sets working directory to dir. This facility is useful if core dumps
214 must be saved. In this case, the current working directory must be
215 writable by the running user, such as "nobody".
216
217 --- 1.6.1 2011/09/14
218
219 New configuration element <icu_chain> for <server>/<service> which
220 allows a named ICU rule (chain) to be defined. The names relevance,
221 sort, mergekey and facet are used for those operations. The definition
222   <icu_chain id="sort" locale="en"> ..  </icu_chain>
223 is identical to
224   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
225 And so on.. for relevance, mergekey and facet as well. The latter
226 style is deprecated. The facet terms are normalized by the facet
227 rule by default. This may be changed on a metadata field basis by
228 defining the new attribute 'facetrule' for the metadata element.
229 For example:
230   <icu_chain id="myrule" locale="en"> ... </icu_chain>
231   <metadata name="author" termlist="yes" facetrule="myrule"/>
232
233 Preserve rorder for merged metadata. Fixes issue as reported by Sven
234 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
235
236 tmarc.xsl: set journal-subpart to 773$ only.
237
238 --- 1.6.0 2011/09/12
239
240 Modify the behavior for the limit parameter (first defined in 1.5.7).
241 Mapping of limit searches are now defined by the new configuration item
242 pz:limitmap. Fix a dead-lock problem with the limit parameter.
243
244 Extend tmarc.xsl to extract 773$g data (OpenURL).
245
246 --- 1.5.7 2011/08/19
247
248 ICU default maps remove backquote (`).
249
250 Command 'search' takes limit parameter (optional).  The limit parameter
251 allows a search to be limited one or more facets and the corresponding
252 values. This is for server side filtering.
253
254 Configure tweak: Use -lm for log(3) if needed
255
256 --- 1.5.6 2011/04/15
257
258 Fix a problem with skiparticle sortkey that could be completely
259 ignored (and reduced to "").
260
261 Fix dependency problem in pazpar2 RPM package (did not require
262 libyaz4 as it should).
263
264 --- 1.5.5 2011/03/28
265
266 Fix memory leak that occurred for command=termlist&name=xtargets .
267
268 Pazpar2 may save HTTP requests. Enabled by option -R.
269
270 --- 1.5.4 2011/03/08
271
272 Experimental support for DTIC DADS target. New dads-pz2.xsl.
273
274 Support for query_syntax (overrides the default for SRU | Z39.50) 
275
276 Support for extraArgs (ZOOM "extraArgs" option) for targets
277
278 New commands: status-server and status-session
279
280 --- 1.5.3 2011/02/18
281
282 Fix for threaded runs: Client now have a copy of the database URL, 
283 which can used after the database has been release from the client. 
284 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
285
286 tmarc.xsl: Add journal-title-abbrev and full text. 
287
288 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
289
290 Fix for cmd=record before search.
291
292 Session Logging clean up.
293
294 Fix wrong termlist factor when maxrecs is different from 100.
295
296 --- 1.5.2 2011/01/18
297
298 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
299 Term factor is default enabled but can be diseabled by
300 pz:termlist_term_factor=0
301
302 --- 1.5.1 2011/01/06
303
304 Add scaling of facet count. Currently always enabled, needs fixing.
305 Allow user-defined info for target suffix. This has no meaning in
306 Pazpar2 except to distinguish targets from each other. The suffix
307 data begins with #. For example z3950.indexdata.com/gils#Mydata
308
309 Added exact-match recordfilter; format name=value
310
311 --- 1.5.0 2010/10/05
312
313 SOLR support. Pazpar2 may operate as web service client for SOLR.
314
315 --- 1.4.4 2010/08/17
316
317 Fix for show command and block=1 (dead lock). Bug was introduced in
318 1.4.0.
319
320 --- 1.4.3 2010/07/02
321
322 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
323 tested on CentOS 5.5 only.
324
325 --- 1.4.2 2010/06/18
326
327 Fix problem with result sets being removed from a client session
328 if the connection for it was resused by another session. Bug #3489.
329
330 New iphone UI for Pazpar2 (www/iphone).
331
332 --- 1.4.1 2010/05/21
333
334 Fixes for threaded operation.
335
336 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
337
338 New example services in etc/services in source. In the Debian packages
339 these are located in /etc/pazpar2/services-available
340
341 Threaded mode operational on Windows. Requires Windows 7 or Windows
342 Server 2008.
343
344 Default value of setting pz:max_connections is 0 which means that there
345 is no limit on number of connections.
346
347 --- 1.4.0 2010/03/29
348
349 Pazpar2 may operate in threaded mode. Enabled by element threads in
350 the configuration. See pazpar2_conf for details.
351
352 New setting setting: pz:max_connections. Setting pz:max_connections is
353 a limit of number of sockets to a host. When this limit is reached,
354 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
355 The client will be marked Client_Error when it can not be searched
356 (other clients in a session may work). If pz:max_connections is not set
357 for a target, a value of 30 will be used. Note: the pz:max_connections
358 will only work in threaded mode.
359
360 pz2.js: JSON support for show.
361
362 Debian package: Enable default service, default.xml, before starting
363 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
364
365 --- 1.3.0 2010/01/25
366
367 Debian version depends on on libyaz4. Note that Pazpar2 will still
368 compile from source with YAZ 3.
369
370 Split services into separate files. The example configuration file
371 pazpar2.cfg.dist now includes a default service default.xml (part of
372 etc). And default.xml includes settings/edu.xml. The default.xml file,
373 not to be confused with settings/defaults.xml, is a template for jsdemo
374 and other services. The Debian package installs /etc/pazpar2/server.xml
375 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
376 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
377 The default.xml (from etc) is installed in /etc/pazpar2/services-available
378 and a symlink to it is created from services-enabled. The default.xml
379 service is unnamed and, thus, will be used by jsdemo and test1.
380
381 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
382 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
383
384 --- 1.2.4 2010/01/15
385
386 Support for additional fields in cf.xsl and pazpar2.conf.dist:
387 publisher, available, due, location (=locallocation), callno
388 (=callnumber), thumburl and score.
389
390 Describe pz:xslt and the auto setting.
391
392 Move mergekey definition away from the normalization stylesheets and
393 define a mergekey common for all target types in pazpar2.cfg.
394
395 Code update: Use the Odr_int type for hit counts. This is part of
396 YAZ 3.0.47 and later and so configure checks for that.
397
398 --- 1.2.3 2009/11/24
399
400 Metadata attribute 'skiparticle' also works for ICU based
401 normalization. (was only working for the non-ICU/ASCII before).
402
403 Command bytarget with argument settings=1 will show settings per
404 target.. This is to be able to verify correct settings and be able to
405 test that they are correct. The database settings array size is now
406 also stored..  Problems with database settings array is that if not
407 careful it will be too small (smaller than dictionary per-service
408 in settings).
409
410 Make record list sorting stable by comparing mergekey for records if
411 relevance/title or other sorting criteria all match. This is merely to
412 ensure that our regressions tests works (reproducible output).
413
414 Relevance calculation changes: use a different denominator (length) for
415 per-field relevance scoring.. Instead of length of all ranked fields we
416 now use length of individual fields (as if they were individual "free"
417 text fields). This will ensure that documents with a long field with no
418 match (say description) will not "hurt" a title match.
419
420 Diagnostic member was not set on connection error. Fixed
421
422 --- 1.2.2 2009/10/13
423
424 Command search takes two optional parameters, startecs and maxrecs,
425 that specifies the start offset (0, 1, ...) and maximum number of records
426 to fetch for each target.
427
428 XSLTs + MARC maps are cached within a session so we don't re-parse
429 them over and over again. Even for a session with a single search
430 there's much to be gained because many targets use the same
431 transformation.
432
433 The metadata attribute 'mergekey' now takes one of three values 'no',
434 'required', 'optional' .  And the resulting mergekey from metadata
435 is now ordered in the same way as metadata in the service definition.
436 Older Pazpar2 version use the order in which metadata appeared in a
437 record instance.
438
439 The search argument 'filter' now offers a new operator ~ which does a 
440 substring match. The = operator works as before: string match for
441 anything but pz:id, or target match for pz:id.
442
443 New setting pz:recordfilter. The value of this setting takes the
444 form name[~value]. This setting makes Pazpar2 ignore all retrieved
445 records that do not have the metadata element name with value substring
446 (if given).
447
448 Pazpar2 allows YAZ log level to be set (option -v).
449
450 --- 1.2.1 2009/10/05
451
452 For WS responses Pazpar2 creates XML header. Exception: raw record.
453
454 Setting XML files are now stored in etc/settings instead of etc. This
455 reflects the layout with the Debian package layout.
456
457 Settings may be posted for command=settings. The POSTed settings must
458 have root element 'settings' like regular setting files. In order to be
459 recognized, the POST request must use Content-Type=text/xml.
460
461 A service may be posted for command=init. This service will be used
462 during the session. The service may have its own target settings,
463 ICU config, timeout, etc. In order to be recognized, the POST request
464 must use Content-Type=text/xml.
465
466 Timeout values may be given per-service. That's element 'timeout' 
467 which takes three attribute values (a subset may be given): 'session',
468 'z3950_operation', 'z3950_session'. Option -T is no longer supported
469 - used to specify session timeout.
470
471 Option -t tests the Pazpar2 configuration and returns exit code
472 (0=success, non-zero=failure). In previous version of Pazpar2, -t
473 specified local settings.
474
475 In version 1.2.0 the configuration file - after include processing -
476 was dumped to stdout. Now, the configuration is only dumped to the
477 yaz log file if option -d is given.
478
479 --- 1.2.0 2009/09/10
480
481 Configuration may now have multiple server areas. This means that a
482 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
483 yet supported - on a server basis. Configuration may also have multiple
484 services .. That is repeating service elements inside a server. Each
485 has an attribute 'id' which serves as service ID. This ID in turn may
486 be used in a Pazpar2 session, by specifying parameter service=ID for
487 command init. There can be at most one unnamed service inside a server
488 which can be referred to by not specifying an service ID for command
489 init (backwards compatible). In order to partition multiple servers and
490 services a new include directive has been added. This takes an attribute
491 'src' which specifies one or more sub-files. For example to include
492 service files, one might use:
493   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
494 It is the intention that that completely makes the settings directive
495 redundant.
496
497 Fix problem where the record command would wait forever if there were
498 no targets to wait for (activeclients == 0).
499
500 --- 1.1.1 2009/08/28
501
502 One result set is created per session (last search) rather than for
503 each connection which happen to be shared (bug #3009).
504
505 marc21 stylesheets changed for efficiency.
506
507 --- 1.1.0 2009/08/19
508
509 Session timeout may be specified on the command-line as option -T.
510
511 Pazpar2 may now be operated in a no-merged mode for records.. All records
512 will be considered unique. This mode is enabled if no mergekey is
513 generated by the normalization stylesheet (pz:xslt). 
514
515 Pazpar2 caches original records from each target and the 'record' command
516 with offset returns the original record if 'syntax' and 'esn' are NOT
517 specified. This speeds up retrieval of original records but also means
518 that Pazpar2 uses more memory. The cached records will be freed when the
519 session terminates or a new search is executed.
520
521 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
522 library part of YAZ is used.
523
524 Added SRU client support.
525
526 Automatically computes pz:nativesyntax if not provided. Works for XML and
527 MARC.
528
529 --- 1.0.13 2008/11/24
530
531 Command bytarget returns name of target (if defined).
532
533 --- 1.0.12 2008/11/04
534
535 Fixed bug #2021.. location now holds all brief elements.
536
537 --- 1.0.11 2008/10/15
538
539 Fixed check for application/x-www-form-urlencoded parameters.
540
541 --- 1.0.10 2008/10/14
542
543 Fixes for IE in pz2.js.
544
545 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
546
547 --- 1.0.9 2008/05/23
548
549 Changed the JS library pz2.js to use POST for long URL (+ params).
550
551 Added installation instructions for Windows. Note: NT services is
552 NOT available until we make a new release of YAZ.
553
554 Preserve order of repeated metadata fields (they were reversed before).
555
556 More MARC21 information extracted for metadata.
557
558 --- 1.0.8 2008/04/22
559
560 Fixed bug #1162: HTML entities are not escaped properly.
561
562 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
563
564 --- 1.0.7 2008/04/14
565
566 Marc21 stylesheet updated to reflect multiple full text fields
567
568 --- 1.0.6 2008/03/12
569
570 Fixed bug in pz2.js WRT DOMElement attributes on IE.
571
572 Fixed bug 2100: Database wildcards not working
573
574 --- 1.0.5 2007/11/09
575
576 Added support for retrieval of records in binary.
577
578 Fixed bug 1794: Pazpar2 does not return valid XML.
579
580 Deal with ICU not returning sortkey (resulted in SEGV before).
581
582 --- 1.0.4 2007/09/28
583
584 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
585 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
586
587 Improved diagnostics when Pazpar2 HTTP decoding fails.
588
589 Pazpar2 requests may be POSTed as using Content-Type
590 application/x-www-form-urlencoded.
591
592 Pazpar2 honors LF in HTTP headers.
593
594 Handle targets that handle negative hit counts (should not happen, but it
595 does).
596
597 --- 1.0.3 2007/09/19
598
599 ICU is used for tokenization and normalization of the following: mergekey,
600 sorting, relevance terms.
601
602 Debian package now enables ICU tokenization and normalization by default.
603
604 --- 1.0.2 2007/08/22
605
606 Exposed user setting values (i.e. non-pz: names) to the record systems in two
607 ways: Either as parameters to the normalization stylesheets (which would allow the
608 programmer to postprocess or use the values in any way) or after the normalization
609 step, in which case values are made part of the normalized record (and available for
610 sorting, termlists, display, or other interface-related use.
611
612 Implemented sorting by year.
613
614 Option -d dumps records to the current log file instead of stderr.
615
616 Fixes for compilation on cygwin.
617
618 Z39.50 client code uses pz:elements. pz:elements was recognized in
619 earlier Pazpar2 versions but it was not used for anything.
620
621 icu_chain_test is using fgets instead of getline - fixes compilation
622 on MacOSX .
623
624 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
625 query conversions fail (rather than _any_). This means targets that do
626 not support some fields are ignored in a search.
627
628 --- 1.0.1 2007/07/03
629
630 Improved handling of socket timeout for Z39.50 connections. 
631
632 Misc documentation updates and spell fixes.
633
634 Debian package pazpar2 creates log rotate entry.
635
636 Debian package pazpar2-apache2 reloads Apache2.
637
638 jsdemo included in distribution. It illustrates the use of the js/pz2.js
639 JavaScript library.
640
641 --- 1.0.0 2007/06/20
642
643 First public release.
644