Update NEWS
[pazpar2-moved-to-github.git] / NEWS
1 --- 1.6.20 2012/09/21
2
3 Rank algorithm details may be printed as part of show reseponse in
4 element <relevance_info>.. This is only printed if <rank debug="yes"/>
5 is used in service.
6
7 Record as returned by show/record command have a minimal indentation
8 which makes things human-readable.
9
10 New configuration of default sorting criteria (sort-default) in 
11 service definition. If no criteria is defined it will be as before
12 'relevance'. 
13
14 Search command now supports sort parameter just as the show command. 
15 If no parameter is give, it will use the service sort-default value.
16
17 --- 1.6.19 2012/09/18
18
19 Rank algorithm skips strings that gets normalized to empty string.
20 For example, & and ! could map to the empty string. The weight for
21 those terms is now 0 (as if they were not part of the query).
22
23 Rank algorithm does not use CCL from limitmap; only from the query
24 parameter (user query).
25
26 Obey -w dir.
27
28 --- 1.6.18 2012/09/17
29
30 Rank algorithm configurable by 'rank' element inside service. So far
31 only, attribute 'cluster' is recognized. If cluster="yes", multiple
32 records inside a cluster boosts higher than single records. This
33 is default behavior and existing behavior. cluster="no" takes the
34 average score of each record in a cluster.
35
36 --- 1.6.17 2012/09/05
37
38 Fix bad re-use of connections (connections with changing proxy should not
39 be reused).
40
41 --- 1.6.16 2012/08/22
42
43 Fix a bug introduce in 1.6.15 around the position sorting. It resetted the 
44 resultset and sorting when the sort order is position. However this will be done on
45 every client poll, which will make pazpar2 continuing reset and fetching. 
46 It should only be done on FIRST request where the sort order change. 
47
48 Fix an issue on suggestion option: Also disable suggestions on empty string. 
49
50 Clean up in turbo marc stylesheet. 
51
52 Remove the hardcoded size of termlists.
53
54 --- 1.6.15 2012/06/27
55
56 New facility: ccldirective may be given in service definition. Allows
57 CCL parsing to be customized a bit, such as defining names of operators
58 and, or, not.
59
60 New facility: raw record by checksum, rather than offset. The record
61 command optionally takes checksum which identifies certain record from
62 a database.
63
64 New facility: per field ranking. Rank may be given as M [F N] where
65 M is default rank and N is rank for CCL terms from field F.
66
67 --- 1.6.14 2012/06/04
68
69 Fix for IE7/8 in pz.js
70
71 Applied patch from Giannis Kosmas on keepAlive, which also adds keepAlive to init response. 
72
73 Lower log level some places.
74
75 Remove some invalid test results. 
76
77 --- 1.6.13 2012/05/23
78
79 Introducing a version=2 parameter for show, termlist and bytarget commands.
80 This enables pazpar2 to return approximation on hit and count count when 
81 doing record filtering using the limit parameter on search and a 
82 limitmap with a value of "local:"
83
84 Setting pz:xslt may embed local XSLT as an alternative to referring
85 to filenames.
86 Value is not CDATA but XML nodes embedded, so escaping is not necessary
87 but a root element *must* be present. For example:
88 <settings target="target="z3950.indexdata.com/marc">
89      <set name="pz:xslt">
90        <xsl:stylesheet
91           version="1.0"
92         ..
93        </xsl:stylesheet>
94      </set>
95     </settings>
96
97 Metadata field rank may given by XML internal document (pz:xslt
98 result). If rank is not given, the rank from service description is
99 used - as before.
100
101 Metadata field can now configured a default limitmap and facetmap. 
102 Setting limitmap to "local:" would work for all kind of targets, but would
103 prob. not be the optimal solution. But at least better than the default behavior 
104 of pazpar2 where no filtering is done. 
105
106 A service definition can now also contains <set/> that defines service-wide
107 settings. These will override server-wide sets and will be overridded by 
108 settings.
109
110 New setting, pz:present_chunk, that specifies number of records to fetch
111 at a time. Zero will disable chunkation; will fetch max_records at once.
112
113 --- 1.6.12 2012/03/14
114
115 Revert the format change in termlist response, that could break 
116 some clients / UIs since they were expecting an (empty) element 
117 if no facet values was found. 
118
119 --- 1.6.11 2012/03/07
120
121 Revert the behavior of returning errors when unable to block 
122 on termlist, bytarget and search, when unable to block due to 
123 other block. The client will now receive a regular response, 
124 but it will be logged in the server. A parameter (report) is
125 added to change behavior to return error response or WARNING 
126 status message. Consider this "API" as private, as it is mostly 
127 untested and could be changed in future releases. 
128
129 Fix spell error in pz2.js fix in 1.6.10.
130
131 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
132 Can solve the missing marc21.xsl updates in some cases. 
133
134 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
135 substring (contribtion from Sven Porst)
136
137 marc21.xsl: fix 1-based substring call
138
139 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
140
141 Add test_termlist_block to test suite
142
143 --- 1.6.10 2012/02/23
144
145 Fix SEGV for invalid PQFs and SRU/SOLR targets
146 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
147
148 Fix pz2.js: "null object" due to change in in bytarget result XML.
149
150 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
151 Added this normalization to the other subject-long fields (d6xx), 
152 where it was missing.
153
154 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
155 Still differences around medium and holdings. marc21.xsl is not 
156 longer active used by Index Data, and should be considered unsupported.
157 Use tmarc.xsl instead. 
158
159 --- 1.6.9 2012/01/19
160
161 Fix SEGV that could occur for failed connections.
162
163 --- 1.6.8 2012/01/17
164
165 Fix bug for command sort that could return no results for active clients
166 (from previous search). This bug was present in 1.6.6-1.6.7.
167
168 Fix bug in results that could include results that should have been
169 filtered out. This bug was present in 1.6.6-1.6.7.
170
171 --- 1.6.7 2011/12/23
172
173 Fix bug introduced in 1.6.6 where a connection re-use could stall
174 incoming requests.
175
176 Local filtering may now specify a local metadata field, eg.
177  pz:limitmap:somefield[t]=local:otherfield
178
179 --- 1.6.6 2011/11/25
180
181 For search, when limit and or filtering is in place and search
182 is identical to previous search, the result set is re-used and the
183 target is not searched.
184
185 Limits may work perform local filtering as well, by using "local:"
186 for a limitmap.
187
188 --- 1.6.5 2011/11/01
189
190 Updated bytarget command to contain a suggestions element with misspelled
191 words and suggestions to these. pz2.js has been updated to deliver this 
192 onwards as well. Only target that currently delivers this is the solr 
193 client in YAZ 4.2.18. 
194
195 --- 1.6.4 2011/10/28
196
197 New service definition element, xslt, that allows an embedded stylesheet
198 to be defined. This can be referred to from pz:xslt as an alternative to
199 external files.
200
201 New pz:sortmap:field setting for specifying hints on how to make
202 a target natively sort on a field. This is used for command=show in
203 conjunction with sort.
204
205 New pz:url setting for specifying the actual URL for a target. When
206 this is used the target ID is not used as URL anymore and the target ID
207 may be almost any string (not including []).
208
209 command=termlist without name parameter returns all termlists/facets.
210 Previously if name parameter was omitted, only "subject" was returned.
211
212 --- 1.6.3 2011/09/22
213
214 Make termlist sorting stable. Terms with same frequency are now sorted by
215 their display name. This makes a pretty display and improves our
216 regression test because qsort is not a stable sort.
217
218 New sort parameter value 'position'. The 'position' sorts merged records
219 by their original position from the remote target. This is primarily useful
220 for debugging and may be used for targets that already perform some kind
221 of relevance ranking. Note that sort by default is decreasing; so to get
222 records in their original order sort=position:1 must be used.
223
224 --- 1.6.2 2011/09/15
225
226 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
227
228 Facility to change working directory for pazpar2 daemon. Option -wdir
229 sets working directory to dir. This facility is useful if core dumps
230 must be saved. In this case, the current working directory must be
231 writable by the running user, such as "nobody".
232
233 --- 1.6.1 2011/09/14
234
235 New configuration element <icu_chain> for <server>/<service> which
236 allows a named ICU rule (chain) to be defined. The names relevance,
237 sort, mergekey and facet are used for those operations. The definition
238   <icu_chain id="sort" locale="en"> ..  </icu_chain>
239 is identical to
240   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
241 And so on.. for relevance, mergekey and facet as well. The latter
242 style is deprecated. The facet terms are normalized by the facet
243 rule by default. This may be changed on a metadata field basis by
244 defining the new attribute 'facetrule' for the metadata element.
245 For example:
246   <icu_chain id="myrule" locale="en"> ... </icu_chain>
247   <metadata name="author" termlist="yes" facetrule="myrule"/>
248
249 Preserve rorder for merged metadata. Fixes issue as reported by Sven
250 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
251
252 tmarc.xsl: set journal-subpart to 773$ only.
253
254 --- 1.6.0 2011/09/12
255
256 Modify the behavior for the limit parameter (first defined in 1.5.7).
257 Mapping of limit searches are now defined by the new configuration item
258 pz:limitmap. Fix a dead-lock problem with the limit parameter.
259
260 Extend tmarc.xsl to extract 773$g data (OpenURL).
261
262 --- 1.5.7 2011/08/19
263
264 ICU default maps remove backquote (`).
265
266 Command 'search' takes limit parameter (optional).  The limit parameter
267 allows a search to be limited one or more facets and the corresponding
268 values. This is for server side filtering.
269
270 Configure tweak: Use -lm for log(3) if needed
271
272 --- 1.5.6 2011/04/15
273
274 Fix a problem with skiparticle sortkey that could be completely
275 ignored (and reduced to "").
276
277 Fix dependency problem in pazpar2 RPM package (did not require
278 libyaz4 as it should).
279
280 --- 1.5.5 2011/03/28
281
282 Fix memory leak that occurred for command=termlist&name=xtargets .
283
284 Pazpar2 may save HTTP requests. Enabled by option -R.
285
286 --- 1.5.4 2011/03/08
287
288 Experimental support for DTIC DADS target. New dads-pz2.xsl.
289
290 Support for query_syntax (overrides the default for SRU | Z39.50) 
291
292 Support for extraArgs (ZOOM "extraArgs" option) for targets
293
294 New commands: status-server and status-session
295
296 --- 1.5.3 2011/02/18
297
298 Fix for threaded runs: Client now have a copy of the database URL, 
299 which can used after the database has been release from the client. 
300 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
301
302 tmarc.xsl: Add journal-title-abbrev and full text. 
303
304 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
305
306 Fix for cmd=record before search.
307
308 Session Logging clean up.
309
310 Fix wrong termlist factor when maxrecs is different from 100.
311
312 --- 1.5.2 2011/01/18
313
314 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
315 Term factor is default enabled but can be diseabled by
316 pz:termlist_term_factor=0
317
318 --- 1.5.1 2011/01/06
319
320 Add scaling of facet count. Currently always enabled, needs fixing.
321 Allow user-defined info for target suffix. This has no meaning in
322 Pazpar2 except to distinguish targets from each other. The suffix
323 data begins with #. For example z3950.indexdata.com/gils#Mydata
324
325 Added exact-match recordfilter; format name=value
326
327 --- 1.5.0 2010/10/05
328
329 SOLR support. Pazpar2 may operate as web service client for SOLR.
330
331 --- 1.4.4 2010/08/17
332
333 Fix for show command and block=1 (dead lock). Bug was introduced in
334 1.4.0.
335
336 --- 1.4.3 2010/07/02
337
338 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
339 tested on CentOS 5.5 only.
340
341 --- 1.4.2 2010/06/18
342
343 Fix problem with result sets being removed from a client session
344 if the connection for it was resused by another session. Bug #3489.
345
346 New iphone UI for Pazpar2 (www/iphone).
347
348 --- 1.4.1 2010/05/21
349
350 Fixes for threaded operation.
351
352 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
353
354 New example services in etc/services in source. In the Debian packages
355 these are located in /etc/pazpar2/services-available
356
357 Threaded mode operational on Windows. Requires Windows 7 or Windows
358 Server 2008.
359
360 Default value of setting pz:max_connections is 0 which means that there
361 is no limit on number of connections.
362
363 --- 1.4.0 2010/03/29
364
365 Pazpar2 may operate in threaded mode. Enabled by element threads in
366 the configuration. See pazpar2_conf for details.
367
368 New setting setting: pz:max_connections. Setting pz:max_connections is
369 a limit of number of sockets to a host. When this limit is reached,
370 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
371 The client will be marked Client_Error when it can not be searched
372 (other clients in a session may work). If pz:max_connections is not set
373 for a target, a value of 30 will be used. Note: the pz:max_connections
374 will only work in threaded mode.
375
376 pz2.js: JSON support for show.
377
378 Debian package: Enable default service, default.xml, before starting
379 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
380
381 --- 1.3.0 2010/01/25
382
383 Debian version depends on on libyaz4. Note that Pazpar2 will still
384 compile from source with YAZ 3.
385
386 Split services into separate files. The example configuration file
387 pazpar2.cfg.dist now includes a default service default.xml (part of
388 etc). And default.xml includes settings/edu.xml. The default.xml file,
389 not to be confused with settings/defaults.xml, is a template for jsdemo
390 and other services. The Debian package installs /etc/pazpar2/server.xml
391 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
392 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
393 The default.xml (from etc) is installed in /etc/pazpar2/services-available
394 and a symlink to it is created from services-enabled. The default.xml
395 service is unnamed and, thus, will be used by jsdemo and test1.
396
397 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
398 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
399
400 --- 1.2.4 2010/01/15
401
402 Support for additional fields in cf.xsl and pazpar2.conf.dist:
403 publisher, available, due, location (=locallocation), callno
404 (=callnumber), thumburl and score.
405
406 Describe pz:xslt and the auto setting.
407
408 Move mergekey definition away from the normalization stylesheets and
409 define a mergekey common for all target types in pazpar2.cfg.
410
411 Code update: Use the Odr_int type for hit counts. This is part of
412 YAZ 3.0.47 and later and so configure checks for that.
413
414 --- 1.2.3 2009/11/24
415
416 Metadata attribute 'skiparticle' also works for ICU based
417 normalization. (was only working for the non-ICU/ASCII before).
418
419 Command bytarget with argument settings=1 will show settings per
420 target.. This is to be able to verify correct settings and be able to
421 test that they are correct. The database settings array size is now
422 also stored..  Problems with database settings array is that if not
423 careful it will be too small (smaller than dictionary per-service
424 in settings).
425
426 Make record list sorting stable by comparing mergekey for records if
427 relevance/title or other sorting criteria all match. This is merely to
428 ensure that our regressions tests works (reproducible output).
429
430 Relevance calculation changes: use a different denominator (length) for
431 per-field relevance scoring.. Instead of length of all ranked fields we
432 now use length of individual fields (as if they were individual "free"
433 text fields). This will ensure that documents with a long field with no
434 match (say description) will not "hurt" a title match.
435
436 Diagnostic member was not set on connection error. Fixed
437
438 --- 1.2.2 2009/10/13
439
440 Command search takes two optional parameters, startecs and maxrecs,
441 that specifies the start offset (0, 1, ...) and maximum number of records
442 to fetch for each target.
443
444 XSLTs + MARC maps are cached within a session so we don't re-parse
445 them over and over again. Even for a session with a single search
446 there's much to be gained because many targets use the same
447 transformation.
448
449 The metadata attribute 'mergekey' now takes one of three values 'no',
450 'required', 'optional' .  And the resulting mergekey from metadata
451 is now ordered in the same way as metadata in the service definition.
452 Older Pazpar2 version use the order in which metadata appeared in a
453 record instance.
454
455 The search argument 'filter' now offers a new operator ~ which does a 
456 substring match. The = operator works as before: string match for
457 anything but pz:id, or target match for pz:id.
458
459 New setting pz:recordfilter. The value of this setting takes the
460 form name[~value]. This setting makes Pazpar2 ignore all retrieved
461 records that do not have the metadata element name with value substring
462 (if given).
463
464 Pazpar2 allows YAZ log level to be set (option -v).
465
466 --- 1.2.1 2009/10/05
467
468 For WS responses Pazpar2 creates XML header. Exception: raw record.
469
470 Setting XML files are now stored in etc/settings instead of etc. This
471 reflects the layout with the Debian package layout.
472
473 Settings may be posted for command=settings. The POSTed settings must
474 have root element 'settings' like regular setting files. In order to be
475 recognized, the POST request must use Content-Type=text/xml.
476
477 A service may be posted for command=init. This service will be used
478 during the session. The service may have its own target settings,
479 ICU config, timeout, etc. In order to be recognized, the POST request
480 must use Content-Type=text/xml.
481
482 Timeout values may be given per-service. That's element 'timeout' 
483 which takes three attribute values (a subset may be given): 'session',
484 'z3950_operation', 'z3950_session'. Option -T is no longer supported
485 - used to specify session timeout.
486
487 Option -t tests the Pazpar2 configuration and returns exit code
488 (0=success, non-zero=failure). In previous version of Pazpar2, -t
489 specified local settings.
490
491 In version 1.2.0 the configuration file - after include processing -
492 was dumped to stdout. Now, the configuration is only dumped to the
493 yaz log file if option -d is given.
494
495 --- 1.2.0 2009/09/10
496
497 Configuration may now have multiple server areas. This means that a
498 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
499 yet supported - on a server basis. Configuration may also have multiple
500 services .. That is repeating service elements inside a server. Each
501 has an attribute 'id' which serves as service ID. This ID in turn may
502 be used in a Pazpar2 session, by specifying parameter service=ID for
503 command init. There can be at most one unnamed service inside a server
504 which can be referred to by not specifying an service ID for command
505 init (backwards compatible). In order to partition multiple servers and
506 services a new include directive has been added. This takes an attribute
507 'src' which specifies one or more sub-files. For example to include
508 service files, one might use:
509   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
510 It is the intention that that completely makes the settings directive
511 redundant.
512
513 Fix problem where the record command would wait forever if there were
514 no targets to wait for (activeclients == 0).
515
516 --- 1.1.1 2009/08/28
517
518 One result set is created per session (last search) rather than for
519 each connection which happen to be shared (bug #3009).
520
521 marc21 stylesheets changed for efficiency.
522
523 --- 1.1.0 2009/08/19
524
525 Session timeout may be specified on the command-line as option -T.
526
527 Pazpar2 may now be operated in a no-merged mode for records.. All records
528 will be considered unique. This mode is enabled if no mergekey is
529 generated by the normalization stylesheet (pz:xslt). 
530
531 Pazpar2 caches original records from each target and the 'record' command
532 with offset returns the original record if 'syntax' and 'esn' are NOT
533 specified. This speeds up retrieval of original records but also means
534 that Pazpar2 uses more memory. The cached records will be freed when the
535 session terminates or a new search is executed.
536
537 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
538 library part of YAZ is used.
539
540 Added SRU client support.
541
542 Automatically computes pz:nativesyntax if not provided. Works for XML and
543 MARC.
544
545 --- 1.0.13 2008/11/24
546
547 Command bytarget returns name of target (if defined).
548
549 --- 1.0.12 2008/11/04
550
551 Fixed bug #2021.. location now holds all brief elements.
552
553 --- 1.0.11 2008/10/15
554
555 Fixed check for application/x-www-form-urlencoded parameters.
556
557 --- 1.0.10 2008/10/14
558
559 Fixes for IE in pz2.js.
560
561 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
562
563 --- 1.0.9 2008/05/23
564
565 Changed the JS library pz2.js to use POST for long URL (+ params).
566
567 Added installation instructions for Windows. Note: NT services is
568 NOT available until we make a new release of YAZ.
569
570 Preserve order of repeated metadata fields (they were reversed before).
571
572 More MARC21 information extracted for metadata.
573
574 --- 1.0.8 2008/04/22
575
576 Fixed bug #1162: HTML entities are not escaped properly.
577
578 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
579
580 --- 1.0.7 2008/04/14
581
582 Marc21 stylesheet updated to reflect multiple full text fields
583
584 --- 1.0.6 2008/03/12
585
586 Fixed bug in pz2.js WRT DOMElement attributes on IE.
587
588 Fixed bug 2100: Database wildcards not working
589
590 --- 1.0.5 2007/11/09
591
592 Added support for retrieval of records in binary.
593
594 Fixed bug 1794: Pazpar2 does not return valid XML.
595
596 Deal with ICU not returning sortkey (resulted in SEGV before).
597
598 --- 1.0.4 2007/09/28
599
600 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
601 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
602
603 Improved diagnostics when Pazpar2 HTTP decoding fails.
604
605 Pazpar2 requests may be POSTed as using Content-Type
606 application/x-www-form-urlencoded.
607
608 Pazpar2 honors LF in HTTP headers.
609
610 Handle targets that handle negative hit counts (should not happen, but it
611 does).
612
613 --- 1.0.3 2007/09/19
614
615 ICU is used for tokenization and normalization of the following: mergekey,
616 sorting, relevance terms.
617
618 Debian package now enables ICU tokenization and normalization by default.
619
620 --- 1.0.2 2007/08/22
621
622 Exposed user setting values (i.e. non-pz: names) to the record systems in two
623 ways: Either as parameters to the normalization stylesheets (which would allow the
624 programmer to postprocess or use the values in any way) or after the normalization
625 step, in which case values are made part of the normalized record (and available for
626 sorting, termlists, display, or other interface-related use.
627
628 Implemented sorting by year.
629
630 Option -d dumps records to the current log file instead of stderr.
631
632 Fixes for compilation on cygwin.
633
634 Z39.50 client code uses pz:elements. pz:elements was recognized in
635 earlier Pazpar2 versions but it was not used for anything.
636
637 icu_chain_test is using fgets instead of getline - fixes compilation
638 on MacOSX .
639
640 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
641 query conversions fail (rather than _any_). This means targets that do
642 not support some fields are ignored in a search.
643
644 --- 1.0.1 2007/07/03
645
646 Improved handling of socket timeout for Z39.50 connections. 
647
648 Misc documentation updates and spell fixes.
649
650 Debian package pazpar2 creates log rotate entry.
651
652 Debian package pazpar2-apache2 reloads Apache2.
653
654 jsdemo included in distribution. It illustrates the use of the js/pz2.js
655 JavaScript library.
656
657 --- 1.0.0 2007/06/20
658
659 First public release.
660