384bc119ae5e9c61bcc494e6aa6e76b0eb28958d
[pazpar2-moved-to-github.git] / NEWS
1
2 New facility: ccldirective may be given in service definition. Allows
3 CCL parsing to be customized a bit, such as defining names of operators
4 and, or, not.
5
6 New facility: raw record by checksum, rather than offset. The record
7 command optionally takes checksum which identifies certain record from
8 a database.
9
10 New facility: per field ranking. Rank may be given as M [F N] where
11 M is default rank and N is rank for CCL terms from field F.
12
13 --- 1.6.14 2012/06/04
14
15 Fix for IE7/8 in pz.js
16
17 Applied patch from Giannis Kosmas on keepAlive, which also adds keepAlive to init response. 
18
19 Lower log level some places.
20
21 Remove some invalid test results. 
22
23 --- 1.6.13 2012/05/23
24
25 Introducing a version=2 parameter for show, termlist and bytarget commands.
26 This enables pazpar2 to return approximation on hit and count count when 
27 doing record filtering using the limit parameter on search and a 
28 limitmap with a value of "local:"
29
30 Setting pz:xslt may embed local XSLT as an alternative to referring
31 to filenames.
32 Value is not CDATA but XML nodes embedded, so escaping is not necessary
33 but a root element *must* be present. For example:
34 <settings target="target="z3950.indexdata.com/marc">
35      <set name="pz:xslt">
36        <xsl:stylesheet
37           version="1.0"
38         ..
39        </xsl:stylesheet>
40      </set>
41     </settings>
42
43 Metadata field rank may given by XML internal document (pz:xslt
44 result). If rank is not given, the rank from service description is
45 used - as before.
46
47 Metadata field can now configured a default limitmap and facetmap. 
48 Setting limitmap to "local:" would work for all kind of targets, but would
49 prob. not be the optimal solution. But at least better than the default behavior 
50 of pazpar2 where no filtering is done. 
51
52 A service definition can now also contains <set/> that defines service-wide
53 settings. These will override server-wide sets and will be overridded by 
54 settings.
55
56 New setting, pz:present_chunk, that specifies number of records to fetch
57 at a time. Zero will disable chunkation; will fetch max_records at once.
58
59 --- 1.6.12 2012/03/14
60
61 Revert the format change in termlist response, that could break 
62 some clients / UIs since they were expecting an (empty) element 
63 if no facet values was found. 
64
65 --- 1.6.11 2012/03/07
66
67 Revert the behavior of returning errors when unable to block 
68 on termlist, bytarget and search, when unable to block due to 
69 other block. The client will now receive a regular response, 
70 but it will be logged in the server. A parameter (report) is
71 added to change behavior to return error response or WARNING 
72 status message. Consider this "API" as private, as it is mostly 
73 untested and could be changed in future releases. 
74
75 Fix spell error in pz2.js fix in 1.6.10.
76
77 New Marc2TurboMarc.xsl (contribution from Sven Porst). 
78 Can solve the missing marc21.xsl updates in some cases. 
79
80 tmarc.xsl: Simplify the 6xx to subject-long and fix 1-based 
81 substring (contribtion from Sven Porst)
82
83 marc21.xsl: fix 1-based substring call
84
85 tmarc.xsl and marc21.xsl: use 856$a as last option for electronic-text. 
86
87 Add test_termlist_block to test suite
88
89 --- 1.6.10 2012/02/23
90
91 Fix SEGV for invalid PQFs and SRU/SOLR targets
92 Also refactor a bit the code that converts from PQF to SRU/SOLR queries.
93
94 Fix pz2.js: "null object" due to change in in bytarget result XML.
95
96 Fixes in tmarc.xsl: Subject-long shorten for extra commas only. 
97 Added this normalization to the other subject-long fields (d6xx), 
98 where it was missing.
99
100 Fixes in marc21.xsl: Updated with most of the new tmarc.xsl. 
101 Still differences around medium and holdings. marc21.xsl is not 
102 longer active used by Index Data, and should be considered unsupported.
103 Use tmarc.xsl instead. 
104
105 --- 1.6.9 2012/01/19
106
107 Fix SEGV that could occur for failed connections.
108
109 --- 1.6.8 2012/01/17
110
111 Fix bug for command sort that could return no results for active clients
112 (from previous search). This bug was present in 1.6.6-1.6.7.
113
114 Fix bug in results that could include results that should have been
115 filtered out. This bug was present in 1.6.6-1.6.7.
116
117 --- 1.6.7 2011/12/23
118
119 Fix bug introduced in 1.6.6 where a connection re-use could stall
120 incoming requests.
121
122 Local filtering may now specify a local metadata field, eg.
123  pz:limitmap:somefield[t]=local:otherfield
124
125 --- 1.6.6 2011/11/25
126
127 For search, when limit and or filtering is in place and search
128 is identical to previous search, the result set is re-used and the
129 target is not searched.
130
131 Limits may work perform local filtering as well, by using "local:"
132 for a limitmap.
133
134 --- 1.6.5 2011/11/01
135
136 Updated bytarget command to contain a suggestions element with misspelled
137 words and suggestions to these. pz2.js has been updated to deliver this 
138 onwards as well. Only target that currently delivers this is the solr 
139 client in YAZ 4.2.18. 
140
141 --- 1.6.4 2011/10/28
142
143 New service definition element, xslt, that allows an embedded stylesheet
144 to be defined. This can be referred to from pz:xslt as an alternative to
145 external files.
146
147 New pz:sortmap:field setting for specifying hints on how to make
148 a target natively sort on a field. This is used for command=show in
149 conjunction with sort.
150
151 New pz:url setting for specifying the actual URL for a target. When
152 this is used the target ID is not used as URL anymore and the target ID
153 may be almost any string (not including []).
154
155 command=termlist without name parameter returns all termlists/facets.
156 Previously if name parameter was omitted, only "subject" was returned.
157
158 --- 1.6.3 2011/09/22
159
160 Make termlist sorting stable. Terms with same frequency are now sorted by
161 their display name. This makes a pretty display and improves our
162 regression test because qsort is not a stable sort.
163
164 New sort parameter value 'position'. The 'position' sorts merged records
165 by their original position from the remote target. This is primarily useful
166 for debugging and may be used for targets that already perform some kind
167 of relevance ranking. Note that sort by default is decreasing; so to get
168 records in their original order sort=position:1 must be used.
169
170 --- 1.6.2 2011/09/15
171
172 tmarc.xsl: yet another 773$g fix. Was broken in 1.6.1 as well.
173
174 Facility to change working directory for pazpar2 daemon. Option -wdir
175 sets working directory to dir. This facility is useful if core dumps
176 must be saved. In this case, the current working directory must be
177 writable by the running user, such as "nobody".
178
179 --- 1.6.1 2011/09/14
180
181 New configuration element <icu_chain> for <server>/<service> which
182 allows a named ICU rule (chain) to be defined. The names relevance,
183 sort, mergekey and facet are used for those operations. The definition
184   <icu_chain id="sort" locale="en"> ..  </icu_chain>
185 is identical to
186   <sort> <icu_chain locale="en> ... </icu_chain> </sort>
187 And so on.. for relevance, mergekey and facet as well. The latter
188 style is deprecated. The facet terms are normalized by the facet
189 rule by default. This may be changed on a metadata field basis by
190 defining the new attribute 'facetrule' for the metadata element.
191 For example:
192   <icu_chain id="myrule" locale="en"> ... </icu_chain>
193   <metadata name="author" termlist="yes" facetrule="myrule"/>
194
195 Preserve rorder for merged metadata. Fixes issue as reported by Sven
196 Porst: http://lists.indexdata.dk/pipermail/yazlist/2011-July/003230.html
197
198 tmarc.xsl: set journal-subpart to 773$ only.
199
200 --- 1.6.0 2011/09/12
201
202 Modify the behavior for the limit parameter (first defined in 1.5.7).
203 Mapping of limit searches are now defined by the new configuration item
204 pz:limitmap. Fix a dead-lock problem with the limit parameter.
205
206 Extend tmarc.xsl to extract 773$g data (OpenURL).
207
208 --- 1.5.7 2011/08/19
209
210 ICU default maps remove backquote (`).
211
212 Command 'search' takes limit parameter (optional).  The limit parameter
213 allows a search to be limited one or more facets and the corresponding
214 values. This is for server side filtering.
215
216 Configure tweak: Use -lm for log(3) if needed
217
218 --- 1.5.6 2011/04/15
219
220 Fix a problem with skiparticle sortkey that could be completely
221 ignored (and reduced to "").
222
223 Fix dependency problem in pazpar2 RPM package (did not require
224 libyaz4 as it should).
225
226 --- 1.5.5 2011/03/28
227
228 Fix memory leak that occurred for command=termlist&name=xtargets .
229
230 Pazpar2 may save HTTP requests. Enabled by option -R.
231
232 --- 1.5.4 2011/03/08
233
234 Experimental support for DTIC DADS target. New dads-pz2.xsl.
235
236 Support for query_syntax (overrides the default for SRU | Z39.50) 
237
238 Support for extraArgs (ZOOM "extraArgs" option) for targets
239
240 New commands: status-server and status-session
241
242 --- 1.5.3 2011/02/18
243
244 Fix for threaded runs: Client now have a copy of the database URL, 
245 which can used after the database has been release from the client. 
246 This makes the logging in the connection idle timeout of the client nicer (no NOURL) and should be thread-safe.  
247
248 tmarc.xsl: Add journal-title-abbrev and full text. 
249
250 cf.xsl: new fields: isbn, issn, journaltitle, volume, issue
251
252 Fix for cmd=record before search.
253
254 Session Logging clean up.
255
256 Fix wrong termlist factor when maxrecs is different from 100.
257
258 --- 1.5.2 2011/01/18
259
260 Fix missing pz:termlist_term_factor in settings.c messed up pz:preferred.
261 Term factor is default enabled but can be diseabled by
262 pz:termlist_term_factor=0
263
264 --- 1.5.1 2011/01/06
265
266 Add scaling of facet count. Currently always enabled, needs fixing.
267 Allow user-defined info for target suffix. This has no meaning in
268 Pazpar2 except to distinguish targets from each other. The suffix
269 data begins with #. For example z3950.indexdata.com/gils#Mydata
270
271 Added exact-match recordfilter; format name=value
272
273 --- 1.5.0 2010/10/05
274
275 SOLR support. Pazpar2 may operate as web service client for SOLR.
276
277 --- 1.4.4 2010/08/17
278
279 Fix for show command and block=1 (dead lock). Bug was introduced in
280 1.4.0.
281
282 --- 1.4.3 2010/07/02
283
284 New RPM packages: pazpar2, pazpar2-js, pazpar2-doc. These have been
285 tested on CentOS 5.5 only.
286
287 --- 1.4.2 2010/06/18
288
289 Fix problem with result sets being removed from a client session
290 if the connection for it was resused by another session. Bug #3489.
291
292 New iphone UI for Pazpar2 (www/iphone).
293
294 --- 1.4.1 2010/05/21
295
296 Fixes for threaded operation.
297
298 New stylesheets for TurboMARC: tmarc.xsl and opac_turbomarc.xsl.
299
300 New example services in etc/services in source. In the Debian packages
301 these are located in /etc/pazpar2/services-available
302
303 Threaded mode operational on Windows. Requires Windows 7 or Windows
304 Server 2008.
305
306 Default value of setting pz:max_connections is 0 which means that there
307 is no limit on number of connections.
308
309 --- 1.4.0 2010/03/29
310
311 Pazpar2 may operate in threaded mode. Enabled by element threads in
312 the configuration. See pazpar2_conf for details.
313
314 New setting setting: pz:max_connections. Setting pz:max_connections is
315 a limit of number of sockets to a host. When this limit is reached,
316 Pazpar2 will wait up to 5 seconds for a connection to becomes available.
317 The client will be marked Client_Error when it can not be searched
318 (other clients in a session may work). If pz:max_connections is not set
319 for a target, a value of 30 will be used. Note: the pz:max_connections
320 will only work in threaded mode.
321
322 pz2.js: JSON support for show.
323
324 Debian package: Enable default service, default.xml, before starting
325 Pazpar2 only if there is no service already in /etc/pazpar2/services-enabled.
326
327 --- 1.3.0 2010/01/25
328
329 Debian version depends on on libyaz4. Note that Pazpar2 will still
330 compile from source with YAZ 3.
331
332 Split services into separate files. The example configuration file
333 pazpar2.cfg.dist now includes a default service default.xml (part of
334 etc). And default.xml includes settings/edu.xml. The default.xml file,
335 not to be confused with settings/defaults.xml, is a template for jsdemo
336 and other services. The Debian package installs /etc/pazpar2/server.xml
337 which is now the main pazpar2 configuration (used to be called pazpar2.cfg).
338 server.xml includes services from /etc/pazpar2/services-enabled/*.xml .
339 The default.xml (from etc) is installed in /etc/pazpar2/services-available
340 and a symlink to it is created from services-enabled. The default.xml
341 service is unnamed and, thus, will be used by jsdemo and test1.
342
343 New setting pz:negotiation_charset. Patch from Andrei V. Toutoukine. The
344 new setting pz:negotiation_charset specifies character set for Z39.50 Init.  
345
346 --- 1.2.4 2010/01/15
347
348 Support for additional fields in cf.xsl and pazpar2.conf.dist:
349 publisher, available, due, location (=locallocation), callno
350 (=callnumber), thumburl and score.
351
352 Describe pz:xslt and the auto setting.
353
354 Move mergekey definition away from the normalization stylesheets and
355 define a mergekey common for all target types in pazpar2.cfg.
356
357 Code update: Use the Odr_int type for hit counts. This is part of
358 YAZ 3.0.47 and later and so configure checks for that.
359
360 --- 1.2.3 2009/11/24
361
362 Metadata attribute 'skiparticle' also works for ICU based
363 normalization. (was only working for the non-ICU/ASCII before).
364
365 Command bytarget with argument settings=1 will show settings per
366 target.. This is to be able to verify correct settings and be able to
367 test that they are correct. The database settings array size is now
368 also stored..  Problems with database settings array is that if not
369 careful it will be too small (smaller than dictionary per-service
370 in settings).
371
372 Make record list sorting stable by comparing mergekey for records if
373 relevance/title or other sorting criteria all match. This is merely to
374 ensure that our regressions tests works (reproducible output).
375
376 Relevance calculation changes: use a different denominator (length) for
377 per-field relevance scoring.. Instead of length of all ranked fields we
378 now use length of individual fields (as if they were individual "free"
379 text fields). This will ensure that documents with a long field with no
380 match (say description) will not "hurt" a title match.
381
382 Diagnostic member was not set on connection error. Fixed
383
384 --- 1.2.2 2009/10/13
385
386 Command search takes two optional parameters, startecs and maxrecs,
387 that specifies the start offset (0, 1, ...) and maximum number of records
388 to fetch for each target.
389
390 XSLTs + MARC maps are cached within a session so we don't re-parse
391 them over and over again. Even for a session with a single search
392 there's much to be gained because many targets use the same
393 transformation.
394
395 The metadata attribute 'mergekey' now takes one of three values 'no',
396 'required', 'optional' .  And the resulting mergekey from metadata
397 is now ordered in the same way as metadata in the service definition.
398 Older Pazpar2 version use the order in which metadata appeared in a
399 record instance.
400
401 The search argument 'filter' now offers a new operator ~ which does a 
402 substring match. The = operator works as before: string match for
403 anything but pz:id, or target match for pz:id.
404
405 New setting pz:recordfilter. The value of this setting takes the
406 form name[~value]. This setting makes Pazpar2 ignore all retrieved
407 records that do not have the metadata element name with value substring
408 (if given).
409
410 Pazpar2 allows YAZ log level to be set (option -v).
411
412 --- 1.2.1 2009/10/05
413
414 For WS responses Pazpar2 creates XML header. Exception: raw record.
415
416 Setting XML files are now stored in etc/settings instead of etc. This
417 reflects the layout with the Debian package layout.
418
419 Settings may be posted for command=settings. The POSTed settings must
420 have root element 'settings' like regular setting files. In order to be
421 recognized, the POST request must use Content-Type=text/xml.
422
423 A service may be posted for command=init. This service will be used
424 during the session. The service may have its own target settings,
425 ICU config, timeout, etc. In order to be recognized, the POST request
426 must use Content-Type=text/xml.
427
428 Timeout values may be given per-service. That's element 'timeout' 
429 which takes three attribute values (a subset may be given): 'session',
430 'z3950_operation', 'z3950_session'. Option -T is no longer supported
431 - used to specify session timeout.
432
433 Option -t tests the Pazpar2 configuration and returns exit code
434 (0=success, non-zero=failure). In previous version of Pazpar2, -t
435 specified local settings.
436
437 In version 1.2.0 the configuration file - after include processing -
438 was dumped to stdout. Now, the configuration is only dumped to the
439 yaz log file if option -d is given.
440
441 --- 1.2.0 2009/09/10
442
443 Configuration may now have multiple server areas. This means that a
444 Pazpar2 instance may listen on multiple ports. Virtual hosting is not
445 yet supported - on a server basis. Configuration may also have multiple
446 services .. That is repeating service elements inside a server. Each
447 has an attribute 'id' which serves as service ID. This ID in turn may
448 be used in a Pazpar2 session, by specifying parameter service=ID for
449 command init. There can be at most one unnamed service inside a server
450 which can be referred to by not specifying an service ID for command
451 init (backwards compatible). In order to partition multiple servers and
452 services a new include directive has been added. This takes an attribute
453 'src' which specifies one or more sub-files. For example to include
454 service files, one might use:
455   <server >.. <include src=/"etc/pazpar2/conf.d/*.xml"/> .. </server>.
456 It is the intention that that completely makes the settings directive
457 redundant.
458
459 Fix problem where the record command would wait forever if there were
460 no targets to wait for (activeclients == 0).
461
462 --- 1.1.1 2009/08/28
463
464 One result set is created per session (last search) rather than for
465 each connection which happen to be shared (bug #3009).
466
467 marc21 stylesheets changed for efficiency.
468
469 --- 1.1.0 2009/08/19
470
471 Session timeout may be specified on the command-line as option -T.
472
473 Pazpar2 may now be operated in a no-merged mode for records.. All records
474 will be considered unique. This mode is enabled if no mergekey is
475 generated by the normalization stylesheet (pz:xslt). 
476
477 Pazpar2 caches original records from each target and the 'record' command
478 with offset returns the original record if 'syntax' and 'esn' are NOT
479 specified. This speeds up retrieval of original records but also means
480 that Pazpar2 uses more memory. The cached records will be freed when the
481 session terminates or a new search is executed.
482
483 Pazpar2 no longer uses its own ICU wrapper. Instead the ICU wrapper
484 library part of YAZ is used.
485
486 Added SRU client support.
487
488 Automatically computes pz:nativesyntax if not provided. Works for XML and
489 MARC.
490
491 --- 1.0.13 2008/11/24
492
493 Command bytarget returns name of target (if defined).
494
495 --- 1.0.12 2008/11/04
496
497 Fixed bug #2021.. location now holds all brief elements.
498
499 --- 1.0.11 2008/10/15
500
501 Fixed check for application/x-www-form-urlencoded parameters.
502
503 --- 1.0.10 2008/10/14
504
505 Fixes for IE in pz2.js.
506
507 Fixed bug #2021: non-merged, brief meta data NOT included for command=show.
508
509 --- 1.0.9 2008/05/23
510
511 Changed the JS library pz2.js to use POST for long URL (+ params).
512
513 Added installation instructions for Windows. Note: NT services is
514 NOT available until we make a new release of YAZ.
515
516 Preserve order of repeated metadata fields (they were reversed before).
517
518 More MARC21 information extracted for metadata.
519
520 --- 1.0.8 2008/04/22
521
522 Fixed bug #1162: HTML entities are not escaped properly.
523
524 Native Windows port of Pazpar2. Makefile for Visual Studio provided.
525
526 --- 1.0.7 2008/04/14
527
528 Marc21 stylesheet updated to reflect multiple full text fields
529
530 --- 1.0.6 2008/03/12
531
532 Fixed bug in pz2.js WRT DOMElement attributes on IE.
533
534 Fixed bug 2100: Database wildcards not working
535
536 --- 1.0.5 2007/11/09
537
538 Added support for retrieval of records in binary.
539
540 Fixed bug 1794: Pazpar2 does not return valid XML.
541
542 Deal with ICU not returning sortkey (resulted in SEGV before).
543
544 --- 1.0.4 2007/09/28
545
546 JavaScript library pzw2.js throws error if WS response (from Pazpar2 or
547 other) is malformed (non-wellformed XML or missing Pazpar2 OK status).
548
549 Improved diagnostics when Pazpar2 HTTP decoding fails.
550
551 Pazpar2 requests may be POSTed as using Content-Type
552 application/x-www-form-urlencoded.
553
554 Pazpar2 honors LF in HTTP headers.
555
556 Handle targets that handle negative hit counts (should not happen, but it
557 does).
558
559 --- 1.0.3 2007/09/19
560
561 ICU is used for tokenization and normalization of the following: mergekey,
562 sorting, relevance terms.
563
564 Debian package now enables ICU tokenization and normalization by default.
565
566 --- 1.0.2 2007/08/22
567
568 Exposed user setting values (i.e. non-pz: names) to the record systems in two
569 ways: Either as parameters to the normalization stylesheets (which would allow the
570 programmer to postprocess or use the values in any way) or after the normalization
571 step, in which case values are made part of the normalized record (and available for
572 sorting, termlists, display, or other interface-related use.
573
574 Implemented sorting by year.
575
576 Option -d dumps records to the current log file instead of stderr.
577
578 Fixes for compilation on cygwin.
579
580 Z39.50 client code uses pz:elements. pz:elements was recognized in
581 earlier Pazpar2 versions but it was not used for anything.
582
583 icu_chain_test is using fgets instead of getline - fixes compilation
584 on MacOSX .
585
586 Loosen the CCL query parsing so that Pazpar2 only returns error if _all_
587 query conversions fail (rather than _any_). This means targets that do
588 not support some fields are ignored in a search.
589
590 --- 1.0.1 2007/07/03
591
592 Improved handling of socket timeout for Z39.50 connections. 
593
594 Misc documentation updates and spell fixes.
595
596 Debian package pazpar2 creates log rotate entry.
597
598 Debian package pazpar2-apache2 reloads Apache2.
599
600 jsdemo included in distribution. It illustrates the use of the js/pz2.js
601 JavaScript library.
602
603 --- 1.0.0 2007/06/20
604
605 First public release.
606