Further work
[pazpar2-moved-to-github.git] / doc / pazpar2_conf.xml
index f41070c..c90c931 100644 (file)
   <productnumber>&version;</productnumber>
   <info><orgname>Index Data</orgname></info>
  </refentryinfo>
+
  <refmeta>
   <refentrytitle>Pazpar2 conf</refentrytitle>
   <manvolnum>5</manvolnum>
   <refmiscinfo class="manual">File formats and conventions</refmiscinfo>
  </refmeta>
+
  <refnamediv>
   <refname>pazpar2_conf</refname>
   <refpurpose>Pazpar2 Configuration</refpurpose>
  </refnamediv>
+
  <refsynopsisdiv>
   <cmdsynopsis>
    <command>pazpar2.conf</command>
   </cmdsynopsis>
  </refsynopsisdiv>
+
  <refsect1>
   <title>DESCRIPTION</title>
   <para>
@@ -41,7 +41,7 @@
    extraction of data elements from incoming result records, for the
    purposes of merging, sorting, facet analysis, and display.
   </para>
-  
+
   <para>
    The file is specified using the option -f on the Pazpar2 command line.
    There is not presently a way to reload the configuration file without
    in the future.
   </para>
  </refsect1>
+
  <refsect1>
   <title>FORMAT</title>
   <para>
    The configuration file is XML-structured. It must be well-formed XML. All
    elements specific to Pazpar2 should belong to the namespace
-   <literal>http://www.indexdata.com/pazpar2/1.0</literal> 
+   <literal>http://www.indexdata.com/pazpar2/1.0</literal>
    (this is assumed in the
    following examples). The root element is named "<literal>pazpar2</literal>".
    Under the  root element are a number of elements which group categories of
    information. The categories are described below.
   </para>
-  
+
   <refsect2 id="config-threads">
    <title>threads</title>
    <para>
     in main thread).
    </para>
   </refsect2>
+  <refsect2 id="config-sockets">
+   <title>sockets</title>
+   <para>
+    This section is optional and is supported for Pazpar2 version 1.13.0 and
+    later . It is identified by element "<literal>sockets</literal>" which
+    may include one attribute "<literal>max</literal>" which specifies
+    the maximum number of sockets to be used by Pazpar2.
+   </para>
+  </refsect2>
+  <refsect2 id="config-file">
+   <title>file</title>
+   <para>
+    This configuration takes one attribute <literal>path</literal> which
+    specifies a path to search for local files, such as XSLTs  and settings.
+    The path is a colon separated list of directories. Its default value
+    is "<literal>.</literal>" which is equivalent to the location of the
+    main configuration file (where indeed the file element is given).
+   </para>
+  </refsect2>
   <refsect2 id="config-server">
    <title>server</title>
    <para>
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
      <term>proxy</term>
      <listitem>
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
      <term>relevance / sort / mergekey / facet</term>
      <listitem>
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
      <term>settings</term>
      <listitem>
        The settings element requires one attribute 'src' which specifies
        a settings file or a directory . If a directory is given all
        files with suffix <filename>.xml</filename> is read from this
-       directory. Refer to 
+       directory. Refer to
        <xref linkend="target_settings"/> for more information.
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
-     <term>service</term>
+     <term id="service_conf">service</term>
      <listitem>
       <para>
        This nested element controls the behavior of Pazpar2 with
          ranking, merging, and display of data elements. It supports
          the following attributes:
         </para>
-        
+
         <variablelist> <!-- level 3 -->
          <varlistentry>
           <term>name</term>
            <para>
             This is the name of the data element. It is matched
             against the 'type' attribute of the
-            'metadata' element 
+            'metadata' element
             in the normalized record. A warning is produced if
             metadata elements with an unknown name are
-            found in the 
+            found in the
             normalized record. This name is also used to
-            represent 
+            represent
             data elements in the records returned by the
             webservice API, and to name sort lists and browse
             facets.
            </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>type</term>
           <listitem>
            </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>brief</term>
           <listitem>
            </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>sortkey</term>
           <listitem>
             articles), and 'no' (no sorting). The default value is
             'no'.
            </para>
+           <para>
+            When 'skiparticle' is used, some common articles from the
+            English and German languages are ignored. At present the
+            list is: 'the', 'den', 'der', 'die', 'des', 'an', 'a'.
+           </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
-          <term>rank</term>
+          <term id="metadata-rank">rank</term>
           <listitem>
            <para>
             Specifies that this element is to be used to
-            help rank 
+            help rank
             records against the user's query (when ranking is
-            requested). The value is an integer, used as a
-            multiplier against the basic TF*IDF score. A value of
-            1 is the base, higher values give additional
-            weight to 
+            requested).
+            The valus is of the form
+            <literallayout>
+             M [F N]
+            </literallayout>
+            where M is an integer, used as a
+            weight against the basic TF*IDF score. A value of
+            1 is the base, higher values give additional weight to
             elements of this type. The default is '0', which
             excludes this element from the rank calculation.
            </para>
+           <para>
+            F is a CCL field and N is the multipler for terms
+            that matches those part of the CCL field in search.
+            The F+N combo allows the system to use a different
+            multipler for a certain field. For example, a rank value of
+            "<literal>1 au 3</literal>" gives a multipler of 3 for
+            all terms part of the au(thor) terms and 1 for everything else.
+           </para>
+           <para>
+            For Pazpar2 1.6.13 and later, the rank may also defined
+            "per-document", by the normalization stylesheet.
+           </para>
+           <para>
+            The per field rank was introduced in Pazpar2 1.6.15. Earlier
+            releases only allowed a rank value M (simple integer).
+           </para>
+           See <xref linkend="relevance_ranking"/> for more
+           about ranking.
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>termlist</term>
           <listitem>
             termlist, or browse facet. Values are tabulated from
             incoming records, and a highscore of values (with
             their associated frequency) is made available to the
-            client through the webservice API. 
+            client through the webservice API.
             The possible values
             are 'yes' and 'no' (default).
            </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>merge</term>
           <listitem>
             all elements), or 'no' (don't merge; this is the
             default);
            </para>
+           <para>
+            Pazpar 1.6.24 also offers a new value for merge, 'first', which
+            is like 'all' but only takes all from first database that returns
+            the particular metadata field.
+           </para>
           </listitem>
          </varlistentry>
-         
+
          <varlistentry>
           <term>mergekey</term>
           <listitem>
            </para>
           </listitem>
          </varlistentry>
-         
+
+         <varlistentry>
+          <term id="limitcluster">limitcluster</term>
+          <listitem>
+           <para>
+            Allow a limit on merged metadata. The value of this attribute
+            is the name of actual metadata content to be used for matching
+            (most often same name as metadata name).
+           </para>
+           <note>
+            <para>
+             Requires Pazpar2 1.6.23 or later.
+            </para>
+           </note>
+          </listitem>
+         </varlistentry>
+
+         <varlistentry>
+          <term id="metadata_limitmap">limitmap</term>
+          <listitem>
+           <para>
+            Specifies a default limitmap for this field. This is to avoid mass
+            configuring of targets. However it is important to review/do
+            this on a per target since it is usually target-specific.
+            See limitmap for format.
+           </para>
+          </listitem>
+         </varlistentry>
+
+         <varlistentry>
+          <term id="metadata_facetmap">facetmap</term>
+          <listitem>
+           <para>
+            Specifies a default facetmap for this field. This is to avoid mass
+            configuring of targets. However it is important to review/do
+            this on a per target since it is usually target-specific.
+            See facetmap for format.
+           </para>
+          </listitem>
+         </varlistentry>
+
+         <varlistentry>
+          <term id="icurule">icurule</term>
+          <listitem>
+           <para>
+            Specifies the ICU rule set to be used for normalizing
+            metadata text. The "display" part of the rule is kept
+            in the returned metadata record (record+show commands), the
+            end result - normalized text - is used for performing
+            within-cluster merge (unique, longest, etc). If the icurule is
+            omitted, type generic (text) is converted as follows:
+            any of the characters "<literal> ,/.:([</literal>" are
+            chopped of prefix and suffix of text content
+            <emphasis>unless</emphasis> it includes the
+            characters "<literal>://</literal>" (URL).
+           </para>
+           <note>
+            <para>
+             Requires Pazpar2 1.9.0 or later.
+            </para>
+           </note>
+          </listitem>
+         </varlistentry>
+
          <varlistentry>
           <term>setting</term>
           <listitem>
             are allowed. 'no' is the default and doesn't do anything.
             'postproc' copies the value of a setting with the same name
             into the output of the normalization stylesheet(s). 'parameter'
-            makes the value of a setting with the same name available 
+            makes the value of a setting with the same name available
             as a parameter to the normalization stylesheet, so you
             can further process the value inside of the stylesheet, or use
             the value to decide how to deal with other data values.
            </para>
           </listitem>
          </varlistentry>
-         
+
         </variablelist> <!-- attributes to metadata -->
-        
+
        </listitem>
        </varlistentry>
 
          rule set.
          Pazpar2 uses the particular rule sets for particular purposes.
          Rule set 'relevance' is used to normalize
-         terms for relevance ranking. Rule set 'sort' is used to 
+         terms for relevance ranking. Rule set 'sort' is used to
          normalize terms for sorting. Rule set 'mergekey' is used to
          normalize terms for making a mergekey and, finally. Rule set 'facet'
          is normally used to normalize facet terms, unless
          in any order, except the 'index' element which logically
          belongs to the end of the list. The stated tokenization,
          transformation and charmapping instructions are performed
-         in order from top to bottom. 
+         in order from top to bottom.
         </para>
         <variablelist> <!-- Level 2 -->
          <varlistentry>
            <para>
             The attribute 'rule' defines the direction of the
             per-character casemapping, allowed values are "l"
-            (lower), "u" (upper), "t" (title).  
+            (lower), "u" (upper), "t" (title).
            </para>
           </listitem>
          </varlistentry>
             Normalization and transformation of tokens follows
             the rules defined in the 'rule' attribute. For
             possible values we refer to the extensive ICU
-            documentation found at the 
+            documentation found at the
             <ulink url="&url.icu.transform;">ICU
             transformation</ulink> home page. Set filtering
-            principles are explained at the 
+            principles are explained at the
             <ulink url="&url.icu.unicode.set;">ICU set and
             filtering</ulink> page.
            </para>
             'rule' attribute may have the following values:
             "s" (sentence), "l" (line-break), "w" (word), and
             "c" (character), the later probably not being
-            very useful in a pruning Pazpar2 installation. 
+            very useful in a pruning Pazpar2 installation.
            </para>
           </listitem>
          </varlistentry>
         </para>
        </listitem>
        </varlistentry>
-       
+
        <varlistentry>
        <term>relevance</term>
        <listitem>
         </para>
        </listitem>
        </varlistentry>
-       
+
        <varlistentry>
        <term>sort</term>
        <listitem>
         </para>
        </listitem>
        </varlistentry>
-       
+
        <varlistentry>
        <term>mergekey</term>
        <listitem>
         <para>
          Specifies ICU tokenization and transformation rules
-         for tokens that are used in Pazpar2's mergekey. 
+         for tokens that are used in Pazpar2's mergekey.
          The child element of 'mergekey' must be 'icu_chain' and the
          'id' attribute of the icu_chain is ignored. This
          definition is obsolete and should be replaced by the equivalent
         </para>
        </listitem>
        </varlistentry>
-       
+
+       <varlistentry>
+       <term>ccldirective</term>
+       <listitem>
+        <para>
+         Customizes the CCL parsing (interpretation of query parameter
+         in search).
+         The name and value of the CCL directive is gigen by attributes
+         'name' and 'value' respectively. Refer to possible list of names
+         in the
+         <ulink
+             url="http://www.indexdata.com/yaz/doc/tools.html#ccl.directives.table">
+          YAZ manual
+          </ulink>.
+        </para>
+       </listitem>
+       </varlistentry>
+
+       <varlistentry id="service-rank">
+       <term>rank</term>
+       <listitem>
+        <para>
+         Customizes the ranking (relevance) algorithm. Also known as
+         rank tweaks. The rank element
+         accepts the following attributes - all being optional:
+        </para>
+        <variablelist>
+         <varlistentry>
+          <term>cluster</term>
+          <listitem>
+           <para>
+            Attribute 'cluster' is a boolean
+            that controls whether Pazpar2 should boost ranking for merged
+            records. Is 'yes' by default. A value of 'no' will make
+            Pazpar2 average ranking of each record in a cluster.
+           </para>
+          </listitem>
+         </varlistentry>
+         <varlistentry>
+          <term>debug</term>
+          <listitem>
+           <para>
+            Attribute 'debug' is a boolean
+            that controls whether Pazpar2 should include details
+            about ranking for each document in the show command's
+            response. Enable by using value "yes", disable by using
+            value "no" (default).
+           </para>
+          </listitem>
+         </varlistentry>
+         <varlistentry>
+          <term>follow</term>
+          <listitem>
+           <para>
+            Attribute 'follow' is a a floating point number greater than
+            or equal to 0. A positive number will boost weight for terms
+            that occur close to each other (proximity, distance).
+            A value of 1, will double the weight if two terms are in
+            proximity distance of 1 (next to each other). The default
+            value of 'follow' is 0 (order will not affect weight).
+           </para>
+          </listitem>
+         </varlistentry>
+         <varlistentry>
+          <term>lead</term>
+          <listitem>
+           <para>
+            Attribute 'lead' is a floating point number.
+            It controls if term weight should be reduced by position
+            from start in a metadata field. A positive value of 'lead'
+            will reduce weight as it apperas further away from the lead
+            of the field. Default value is 0 (no reduction of weight by
+            position).
+           </para>
+          </listitem>
+         </varlistentry>
+         <varlistentry>
+          <term>length</term>
+          <listitem>
+           <para>
+            Attribute 'length' determines how/if term weight should be
+            divided by lenght of metadata field. A value of "linear"
+            divide by length. A value of "log" will divide by log2(length).
+            A value of "none" will leave term weight as is (no division).
+            Default value is "linear".
+           </para>
+          </listitem>
+         </varlistentry>
+        </variablelist>
+        <para>
+         Refer to <xref linkend="relevance_ranking"/> to see how
+         these tweaks are used in computation of score.
+        </para>
+        <para>
+         Customization of ranking algorithm was introduced with
+         Pazpar2 1.6.18. The semantics of some of the fields changed
+         in versions up to 1.6.22.
+        </para>
+       </listitem>
+       </varlistentry>
+
+       <varlistentry id="sort-default">
+       <term>sort-default</term>
+       <listitem>
+        <para>
+         Specifies the default sort criteria (default 'relevance'),
+         which previous was hard-coded as default criteria in search.
+         This is a fix/work-around to avoid re-searching when using
+         target-based sorting. In order for this to work efficient,
+         the search must also have the sort critera parameter; otherwise
+         pazpar2 will do re-searching on search criteria changes, if
+         changed between search and show command.
+        </para>
+        <para>
+         This configuration was added in pazpar2 1.6.20.
+        </para>
+       </listitem>
+       </varlistentry>
+
+<!--
+       <varlistentry>
+       <term>set</term>
+       <listitem>
+        <para>
+         Specifies a variable that will be inherited by all targets defined in settings
+         <screen>
+          &lt;set name="test" value="en"..&lt;set>
+         </screen>
+        </para>
+       </listitem>
+       </varlistentry>
+-->
        <varlistentry>
        <term>settings</term>
        <listitem>
        </listitem>
        </varlistentry>
 
-       <varlistentry>
+       <varlistentry id="service-timeout">
        <term>timeout</term>
        <listitem>
         <para>
          Specifies timeout parameters for this service.
          The <literal>timeout</literal>
-         element supports the following attributes: 
+         element supports the following attributes:
          <literal>session</literal>, <literal>z3950_operation</literal>,
          <literal>z3950_session</literal> which specifies
          'session timeout', 'Z39.50 operation timeout',
          z3950_operation (30) &lt; session (60) &lt; z3950_session (180) .
          The default values are given in parantheses.
         </para>
+        <para>
+         The Z39.50 operation timeout may be set per database. Refer to
+         <xref linkend="pztimeout"/>.
+        </para>
        </listitem>
        </varlistentry>
       </variablelist>     <!-- Data elements in service directive -->
  <server>
   <listen port="9004"/>
   <service>
+   <rank debug="yes"/>
    <metadata name="title" brief="yes" sortkey="skiparticle"
              merge="longest" rank="6"/>
    <metadata name="isbn" merge="unique"/>
              type="year" merge="range" termlist="yes"/>
    <metadata name="author" brief="yes" termlist="yes"
              merge="longest" rank="2"/>
-   <metadata name="subject" merge="unique" termlist="yes" rank="3"/>
+   <metadata name="subject" merge="unique" termlist="yes" rank="3" limitmap="local:"/>
    <metadata name="url" merge="unique"/>
    <icu_chain id="relevance" locale="el">
     <transform rule="[:Control:] Any-Remove"/>
 </pazpar2>
    ]]>
   </screen>
- </refsect1> 
+ </refsect1>
 
  <refsect1 id="config-include">
   <title>INCLUDE FACILITY</title>
   <para>
    The XML configuration may be partitioned into multiple files by using
    the <literal>include</literal> element which takes a single attribute,
-   <literal>src</literal>. The of the <literal>src</literal> attribute is
+   <literal>src</literal>. The <literal>src</literal> attribute is
    regular Shell like glob-pattern. For example,
    <screen><![CDATA[
    <include src="/etc/pazpar2/conf.d/*.xml"/>
    kinds of attributes, or settings with search targets. This can be done
    through XML files which are read at startup; each file can associate
    one or more settings with one or more targets. The file format is generic
-   in nature, designed to support a wide range of application requirements. The
-   settings can be purely technical things, like, how to perform a title
+   in nature, designed to support a wide range of application requirements.
+   The settings can be purely technical things, like, how to perform a title
    search against a given target, or it can associate arbitrary name=value
    pairs with groups of targets -- for instance, if you would like to
    place all commercial full-text bases in one group for selection
    to drive sorting, facet/termlist generation, or end-user interface display
    logic.
   </para>
-  
+
   <para>
    During startup, Pazpar2 will recursively read a specified directory
    (can be identified in the pazpar2.cfg file or on the command line), and
    process any settings files found therein.
   </para>
-  
+
   <para>
    Clients of the Pazpar2 webservice interface can selectively override
    settings for individual targets within the scope of one session. This
    some search targets in different ways. This, again, can be managed
    using an external database or other lookup mechanism. Setting overrides
    can be performed either using the
-   <link linkend="command-init">init</link> or the 
+   <link linkend="command-init">init</link> or the
    <link linkend="command-settings">settings</link> webservice
    command.
   </para>
-  
+
   <para>
    In fact, every setting that applies to a database (except pz:id, which
    can only be used for filtering targets to use for a search) can be overridden
-   on a per-session basis. This allows the client to override specific CCL fields
-   for searching, etc., to meet the needs of a session or user.
+   on a per-session basis.
+   This allows the client to override specific CCL fields for
+   searching, etc., to meet the needs of a session or user.
   </para>
 
   <para>
     target, name, and value.
    </para>
 
-   <variablelist> 
+   <variablelist>
     <varlistentry>
      <term>target</term>
      <listitem>
     <set name="pz:cclmap:isbn" value="u=7"/>
     <set name="pz:cclmap:issn" value="u=8"/>
     <set name="pz:cclmap:date" value="u=30 r=r"/>
-    
+
     <set name="pz:limitmap:title" value="rpn:@attr 1=4 @attr 6=3"/>
     <set name="pz:limitmap:date" value="ccl:date"/>
 
     The following setting names are reserved by Pazpar2 to control the
     behavior of the client function.
    </para>
-   
+
    <variablelist>
+
     <varlistentry>
-     <term>pz:cclmap:xxx</term>
+     <term>pz:allow</term>
      <listitem>
       <para>
-       This establishes a CCL field definition or other setting, for
-       the purpose of mapping end-user queries. XXX is the field or
-       setting name, and the value of the setting provides parameters
-       (e.g. parameters to send to the server, etc.). Please consult
-       the YAZ manual for a full overview of the many capabilities of
-       the powerful and flexible CCL parser.
-      </para>
-      <para>
-       Note that it is easy to establish a set of default parameters,
-       and then override them individually for a given target.
+       Allows or denies access to the resources it is applied to. Possible
+       values are '0' and '1'.
+       The default is '1' (allow access to this resource).
       </para>
      </listitem>
     </varlistentry>
-    <varlistentry id="requestsyntax">
-     <term>pz:requestsyntax</term>
+
+    <varlistentry>
+     <term>pz:apdulog</term>
      <listitem>
       <para>
-       This specifies the record syntax to use when requesting
-       records from a given server. The value can be a symbolic name like
-       marc21 or xml, or it can be a Z39.50-style dot-separated OID.
+       If the 'pz:apdulog' setting is defined and has other value than 0,
+       then Z39.50 APDUs are written to the log.
       </para>
      </listitem>
     </varlistentry>
+
     <varlistentry>
-     <term>pz:elements</term>
+     <term>pz:authentication</term>
      <listitem>
       <para>
-       The element set name to be used when retrieving records from a
-       server.
+       Sets an authentication string for a given database. For Z39.50,
+       this is carried as part of the Initialize Request. In order to carry
+       the information in the "open" elements, separate
+       username and password with a slash (In Z39.50 it is a VisibleString).
+       In order to carry the information in the idPass  elements, separate
+       username term, password term and,  optionally, a group term with a
+       single blank.
+       If three terms are given, the order is
+       <emphasis>user, group, password</emphasis>.
+       If only two terms are given, the order is
+       <emphasis>user, password</emphasis>.
+      </para>
+      <para>
+       For HTTP based procotols, such as SRU and Apache Solr, the
+       authentication string includes a username term and, optionally,
+       a password term.
+       Each term is separated by a single blank. The
+       authentication information is passed either by HTTP basic
+       authentication or via URL parameters. The mode of operation is
+       determined by <literal>pz:authentication_mode</literal> setting.
       </para>
      </listitem>
     </varlistentry>
+
     <varlistentry>
-     <term>pz:piggyback</term>
+     <term>pz:authentication_mode</term>
      <listitem>
       <para>
-       Piggybacking enables the server to retrieve records from the
-       server as part of the search response in Z39.50. Almost all
-       servers support this (or fail it gracefully), but a few
-       servers will produce undesirable results.
-       Set to '1' to enable piggybacking, '0' to disable it. Default
-       is 1 (piggybacking enabled).
+       Determines how authentication is carried in HTTP based protocols.
+       Value may be "<literal>basic</literal>" or "<literal>url</literal>".
       </para>
      </listitem>
     </varlistentry>
+
     <varlistentry>
-     <term>pz:nativesyntax</term>
+     <term>pz:block_timeout</term>
      <listitem>
       <para>
-       Specifies how Pazpar2 shoule map retrieved records to XML. Currently
-       supported values are <literal>xml</literal>,
-       <literal>iso2709</literal> and <literal>txml</literal>.
+       (Not yet implemented).
+       Specifies the time for which a block should be released anyway.
       </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:cclmap:xxx</term>
+     <listitem>
       <para>
-       The value <literal>iso2709</literal> makes Pazpar2 convert retrieved
-       MARC records to MARCXML. In order to convert to XML, the exact
-       chacater set of the MARC must be known (if not, the resulting
-       XML is probably not well-formed). The character set may be 
-       specified by adding:
-       <literal>;charset=</literal><replaceable>charset</replaceable> to
-       <literal>iso2709</literal>. If omitted, a charset of
-       MARC-8 is assumed. This is correct for most MARC21/USMARC records.
+       This establishes a CCL field definition or other setting, for
+       the purpose of mapping end-user queries. XXX is the field or
+       setting name, and the value of the setting provides parameters
+       (e.g. parameters to send to the server, etc.). Please consult
+       the YAZ manual for a full overview of the many capabilities of
+       the powerful and flexible CCL parser.
       </para>
       <para>
-       The value <literal>txml</literal> is like <literal>iso2709</literal>
-       except that records are converted to TurboMARC instead of MARCXML.
+       Note that it is easy to establish a set of default parameters,
+       and then override them individually for a given target.
       </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:elements</term>
+     <listitem>
       <para>
-       The value <literal>xml</literal> is used if Pazpar2 retrieves
-       records that are already XML (no conversion takes place).
+       The element set name to be used when retrieving records from a
+       server.
       </para>
      </listitem>
     </varlistentry>
 
     <varlistentry>
-     <term>pz:queryencoding</term>
+     <term>pz:extendrecs</term>
      <listitem>
       <para>
-       The encoding of the search terms that a target accepts. Most
-       targets do not honor UTF-8 in which case this needs to be specified.
-       Each term in a query will be converted if this setting is given.
+       If a show command goes to the boundary of a result set for a
+       database - depends on sorting - and pz:extendrecs is set to a positive
+       value. then Pazpar2 wait for show to fetch pz:extendrecs more
+       records. This setting is best used if a database does native
+       sorting, because the result set otherwise may be completely
+       re-sorted during extended fetch.
+       The default value of pz:extendrecs is 0 (no extended fetch).
       </para>
+      <warning>
+       <para>
+       The pz:extendrecs setting appeared in Pazpar2 version 1.6.26.
+       But the bahavior changed with the release of Pazpar2 1.6.29.
+       </para>
+      </warning>
      </listitem>
     </varlistentry>
 
     <varlistentry>
-     <term>pz:negotiation_charset</term>
+     <term>pz:facetmap:<replaceable>name</replaceable></term>
      <listitem>
       <para>
-       Sets character set for Z39.50 negotiation. Most targets do not support
-       this, and some will even close connection if set (crash on server
-       side or similar). If set, you probably want to set it to
-       <literal>UTF-8</literal>.
+       Specifies that for field <replaceable>name</replaceable>, the target
+       supports (native) facets. The value is the name of the
+       field on the target.
       </para>
      </listitem>
     </varlistentry>
 
     <varlistentry>
-     <term id="pzxslt" xreflabel="pz:xslt">pz:xslt</term>
+     <term>pz:facetmap:split:<replaceable>name</replaceable></term>
      <listitem>
       <para>
-       Is a comma separated list of of stylesheet names that specifies
-       how to convert incoming records to the internal representation.
+       Like pz:facetmap, but makes Pazpar2 inspect the term value consisting
+       of two items separated by colon. First item is the raw ID to be
+       sent to database if limitmap on the field
+       <replaceable>name</replaceable> is used. The second item is
+       the display term.
       </para>
       <para>
-       For each name, the embedded stylesheets (XSL) that comes with the
-       service definition are consulted first and takes precedence over
-       external files; see <xref linkend="servicexslt"/>
-       of service definition).
-       If the name does not match an embedded stylesheet it is
-       considered a filename.
+       This facility was added in Pazpar2 version 1.11.0.
       </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:id</term>
+     <listitem>
       <para>
-       The suffix of each file specifies the kind of tranformation.
-       Suffix "<literal>.xsl</literal>" makes an XSL transform. Suffix
-       "<literal>.mmap</literal>" will use the MMAP transform (described below).
-      </para>
-      <para>
-       The special value "<literal>auto</literal>" will use a file
-       which is the <link linkend="requestsyntax">pz:requestsyntax's</link>
-       value followed by
-       <literal>'.xsl'</literal>.
-      </para>
-      <para>
-       When mapping MARC records, XSLT can be bypassed for increased 
-       performance with the alternate "MARC map" format.  Provide the
-       path of a file with extension ".mmap" containing on each line:
-       <programlisting>
-       &lt;field&gt; &lt;subfield&gt; &lt;metadata element&gt;</programlisting>
-       For example:
-       <programlisting>
-       245 a title
-       500 $ description
-        773 * citation
-       </programlisting>
-       To map the field value specify a subfield of '$'.  To store a 
-       concatenation of all subfields, specify a subfield of '*'.
+       This setting can't be 'set' -- it contains the ID (normally
+       ZURL) for a given target, and is useful for filtering --
+       specifically when you want to select one or more specific
+       targets in the search command.
       </para>
      </listitem>
     </varlistentry>
-    <varlistentry>
-     <term>pz:authentication</term>
+
+    <varlistentry id="limitmap">
+     <term>pz:limitmap:<replaceable>name</replaceable></term>
      <listitem>
       <para>
-       Sets an authentication string for a given server. See the section on
-       authorization and authentication for discussion.
+       Specifies attributes for limiting a search to a field - using
+       the limit parameter for search. It can be used to filter locally
+       or remotely (search in a target). In some cases the mapping of
+       a field to a value is identical to an existing cclmap field; in
+       other cases the field must be specified in a different way - for
+       example to match a complete field (rather than parts of a subfield).
       </para>
-     </listitem>
-    </varlistentry>
-    <varlistentry>
-     <term>pz:allow</term>
-     <listitem>
       <para>
-       Allows or denies access to the resources it is applied to. Possible
-       values are '0' and '1'.
-       The default is '1' (allow access to this resource).
-       See the manual section on authorization and authentication for
-       discussion about how to use this setting.
+       The value of limitmap may have one of three forms: referral to
+       an existing CCL field, a raw PQF string or a local limit. Leading string
+       determines type; either <literal>ccl:</literal> for CCL field,
+       <literal>rpn:</literal> for PQF/RPN, or <literal>local:</literal>
+       for filtering in Pazpar2. The local filtering may be followed
+       by a field a metadata field (default is to use the name of the
+       limitmap itself).
       </para>
+      <para>
+       For Pazpar2 version 1.6.23 and later the limitmap may include multiple
+       specifications, separated by <literal>,</literal> (comma).
+       For example:
+       <literal>ccl:title,local:ltitle,rpn:@attr 1=4</literal>.
+      </para>
+      <note>
+       <para>
+       The limitmap facility is supported for Pazpar2 version 1.6.0.
+       Local filtering is supported in Pazpar2 1.6.6.
+       </para>
+      </note>
      </listitem>
     </varlistentry>
+
     <varlistentry>
      <term>pz:maxrecs</term>
      <listitem>
       </para>
      </listitem>
     </varlistentry>
+
     <varlistentry>
-     <term>pz:id</term>
+     <term>pz:memcached</term>
      <listitem>
       <para>
-       This setting can't be 'set' -- it contains the ID (normally
-       ZURL) for a given target, and is useful for filtering --
-       specifically when you want to select one or more specific
-       targets in the search command.
+       If set and non-empty,
+       <ulink url="&url.libmemcached;">libMemcached</ulink> will
+       configured and enabled for the target.
+       The value of this setting is same as the ZOOM option
+       <literal>memcached</literal>, which  in turn is the configuration
+       string passed to the <function>memcached</function> function
+       of <ulink url="&url.libmemcached;">libMemcached</ulink>.
+      </para>
+      <para>
+       This setting is honored in Pazpar2 1.6.39 or later. Pazpar2 must
+       be using YAZ version 5.0.13 or later.
       </para>
      </listitem>
     </varlistentry>
+
     <varlistentry>
-     <term>pz:zproxy</term>
+     <term>pz:redis</term>
      <listitem>
       <para>
-       The 'pz:zproxy' setting has the value syntax 
-       'host.internet.adress:port', it is used to tunnel Z39.50
-       requests through the named Z39.50 proxy.
+       If set and non-empty,
+       <ulink url="&url.redis;">redis</ulink> will
+       configured and enabled for the target.
+       The value of this setting is exactly as the redis option for
+       ZOOM C of YAZ.
+      </para>
+      <para>
+       This setting is honored in Pazpar2 1.6.43 or later. Pazpar2 must
+       be using YAZ version 5.2.0 or later.
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
-     <term>pz:apdulog</term>
+     <term>pz:nativesyntax</term>
      <listitem>
       <para>
-       If the 'pz:apdulog' setting is defined and has other value than 0,
-       then Z39.50 APDUs are written to the log.
+       Specifies how Pazpar2 shoule map retrieved records to XML. Currently
+       supported values are <literal>xml</literal>,
+       <literal>iso2709</literal> and <literal>txml</literal>.
+      </para>
+      <para>
+       The value <literal>iso2709</literal> makes Pazpar2 convert retrieved
+       MARC records to MARCXML. In order to convert to XML, the exact
+       chacater set of the MARC must be known (if not, the resulting
+       XML is probably not well-formed). The character set may be
+       specified by adding:
+       <literal>;</literal><replaceable>charset</replaceable> to
+       <literal>iso2709</literal>. If omitted, a charset of
+       MARC-8 is assumed. This is correct for most MARC21/USMARC records.
+      </para>
+      <para>
+       The value <literal>txml</literal> is like <literal>iso2709</literal>
+       except that records are converted to TurboMARC instead of MARCXML.
+      </para>
+      <para>
+       The value <literal>xml</literal> is used if Pazpar2 retrieves
+       records that are already XML (no conversion takes place).
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
-     <term>pz:sru</term>
+     <term>pz:negotiation_charset</term>
      <listitem>
       <para>
-       This setting enables
-       <ulink url="&url.sru;">SRU</ulink>/<ulink url="&url.solr;">SOLR</ulink>
-       support.
-       It has four possible settings.
-       'get', enables SRU access through GET requests. 'post' enables SRU/POST
-       support, less commonly supported, but useful if very large requests are
-       to be submitted. 'srw' enables the SRW (SRU over SOAP) variation of
-       the protocol.
-      </para>
-      <para>
-       A value of 'solr' anables SOLR client support. This is supported
-       for Pazpar version 1.5.0 and later.
+       Sets character set for Z39.50 negotiation. Most targets do not support
+       this, and some will even close connection if set (crash on server
+       side or similar). If set, you probably want to set it to
+       <literal>UTF-8</literal>.
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
-     <term>pz:sru_version</term>
+     <term>pz:piggyback</term>
      <listitem>
       <para>
-       This allows SRU version to be specified. If unset Pazpar2
-       will the default of YAZ (currently 1.2). Should be set
-       to 1.1 or 1.2. For SOLR, the current supported/tested version is 1.4
+       Piggybacking enables the server to retrieve records from the
+       server as part of the search response in Z39.50. Almost all
+       servers support this (or fail it gracefully), but a few
+       servers will produce undesirable results.
+       Set to '1' to enable piggybacking, '0' to disable it. Default
+       is 1 (piggybacking enabled).
       </para>
      </listitem>
     </varlistentry>
-    
     <varlistentry>
      <term>pz:pqf_prefix</term>
      <listitem>
       <para>
        Allows you to specify an arbitrary PQF query language substring.
-       The provided string is prefixed the user's query after it has been
+       The provided string is prefixed to the user's query after it has been
        normalized to PQF internally in pazpar2.
        This allows you to attach complex 'filters' to queries for a given
        target, sometimes necessary to select sub-catalogs
       </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
      <term>pz:pqf_strftime</term>
      <listitem>
        <literal>@and @attr 1=30 @attr 2=3 %Y %%</literal>
        would search for current year combined with the original PQF (%%).
       </para>
+      <para>
+       This setting can also be used as more general alternative to
+       pz:pqf_prefix -- a way of embedding the submitted query
+       anywhere in the string rather than appending it to prefix.  For
+       example, if it is desired to omit all records satisfying the
+       query <literal>@attr 1=pica.bib 0007</literal> then this
+       subquery can be combined with the submitted query as the second
+       argument of <literal>@andnot</literal> by using the
+       pz:pqf_strftime value <literal>@not %% @attr 1=pica.bib
+       0007</literal>.
+      </para>
      </listitem>
     </varlistentry>
-    
+
     <varlistentry>
-     <term>pz:sort</term>
+     <term>pz:preferred</term>
      <listitem>
       <para>
-       Specifies sort criteria to be applied to the result set.
-       Only works for targets which support the sort service.
+       Specifies that a target is preferred, e.g. possible local, faster
+       target. Using block=preferred on <link linkend="command-show">
+       show command</link> will wait for all these
+       targets to return records before releasing the block.
+       If no target is preferred, the block=preferred will identical to
+       block=1, which release when one target has returned records.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:present_chunk</term>
+     <listitem>
+      <para>
+       Controls the chunk size in present requests. Pazpar2 will
+       make (maxrecs / chunk) request(s). The default is 20.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:queryencoding</term>
+     <listitem>
+      <para>
+       The encoding of the search terms that a target accepts. Most
+       targets do not honor UTF-8 in which case this needs to be specified.
+       Each term in a query will be converted if this setting is given.
       </para>
      </listitem>
     </varlistentry>
       </para>
      </listitem>
     </varlistentry>
-    
-    <varlistentry>
-     <term>pz:preferred</term>
+
+    <varlistentry id="requestsyntax">
+     <term>pz:requestsyntax</term>
      <listitem>
       <para>
-       Specifies that a target is preferred, e.g. possible local, faster
-       target. Using block=pref on show command will wait for all these
-       targets to return records before releasing the block.
-       If no target is preferred, the block=pref will identical to block=1,
-       which release when one target has returned records.     
+       This specifies the record syntax to use when requesting
+       records from a given server. The value can be a symbolic name like
+       marc21 or xml, or it can be a Z39.50-style dot-separated OID.
       </para>
      </listitem>
     </varlistentry>
 
     <varlistentry>
-     <term>pz:block_timeout</term>
+     <term>pz:sort</term>
      <listitem>
       <para>
-       (Not yet implemented).
-       Specifies the time for which a block should be released anyway.      
+       Specifies sort criteria to be applied to the result set.
+       Only works for targets which support the sort service.
       </para>
      </listitem>
     </varlistentry>
 
-    <varlistentry>
-     <term>pz:facetmap:<replaceable>name</replaceable></term>
+    <varlistentry id="pzsortmap">
+     <term>pz:sortmap:<replaceable>field</replaceable></term>
      <listitem>
       <para>
-       Specifies that for field <replaceable>name</replaceable>, the target
-       supports (native) facets. The value is the name of the
-       field on the target.
+       Specifies native sorting for a target where
+       <replaceable>field</replaceable> is a sort criterion (see command
+       show). The value has two components separated by a colon: strategy and
+       native-field. Strategy is one of <literal>z3950</literal>,
+       <literal>type7</literal>, <literal>cql</literal>,
+       <literal>sru11</literal>, or <literal>embed</literal>.
+       The second component, native-field, is the field that is recognized
+       by the target.
       </para>
       <note>
        <para>
-       At this point only SOLR targets have been tested with this
-       facility.
+       Only supported for Pazpar2 1.6.4 and later.
        </para>
       </note>
      </listitem>
     </varlistentry>
 
-    <varlistentry id="limitmap">
-     <term>pz:limitmap:<replaceable>name</replaceable></term>
+    <varlistentry>
+     <term>pz:sru</term>
      <listitem>
       <para>
-       Specifies attributes for limiting a search to a field - using
-       the limit parameter for search. It can be used to filter locally
-       or remotely (search in a target). In some cases the mapping of 
-       a field to a value is identical to an existing cclmap field; in
-       other cases the field must be specified in a different way - for
-       example to match a complete field (rather than parts of a subfield).
+       This setting enables
+       <ulink url="&url.sru;">SRU</ulink>/<ulink url="&url.solr;">Solr</ulink>
+       support.
+       It has four possible settings.
+       'get', enables SRU access through GET requests. 'post' enables SRU/POST
+       support, less commonly supported, but useful if very large requests are
+       to be submitted. 'soap' enables the SRW (SRU over SOAP) variation of
+       the protocol.
       </para>
       <para>
-       The value of limitmap may have one of three forms: referral to
-       an existing CCL field, a raw PQF string or a local limit. Leading string
-       determines type; either <literal>ccl:</literal> for CCL field, 
-       <literal>rpn:</literal> for PQF/RPN, or <literal>local:</literal>
-       for filtering in Pazpar2.
+       A value of 'solr' enables Solr client support. This is supported
+       for Pazpar version 1.5.0 and later.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:sru_version</term>
+     <listitem>
+      <para>
+       This allows SRU version to be specified. If unset Pazpar2
+       will the default of YAZ (currently 1.2). Should be set
+       to 1.1 or 1.2. For Solr, the current supported/tested version
+       is 1.4 and 3.x.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:termlist_term_count</term>
+     <listitem>
+      <para>
+       Specifies number of facet terms to be requested from the target.
+       The default is unspecified e.g. server-decided. Also see pz:facetmap.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:termlist_term_factor</term>
+     <listitem>
+      <para>
+       Specifies whether to use a factor for pazpar2 generated facets (1)
+       or not (0).
+       When mixing locally generated (by the downloaded (pz:maxrecs) samples)
+       facet with native (target-generated) facets, the later will
+       dominated the dominate the facet list since they are generated
+       based on the complete result set.
+       By scaling up the facet count using the ratio between total hit
+       count and the sample size,
+       the total facet count can be approximated and thus better compared
+       with native facets. This is not enabled by default.
+      </para>
+     </listitem>
+    </varlistentry>
+
+
+    <varlistentry id="pztimeout">
+     <term>pz:timeout</term>
+     <listitem>
+      <para>
+       Specifies timeout for operation (eg search, and fetch) for
+       a database. This overrides the z3650_operation timeout
+       that is given for a service. See <xref linkend="service-timeout"/>.
       </para>
       <note>
        <para>
-       The limitmap facility is supported for Pazpar2 version 1.6.0.
-       Local filtering is supported in Pazpar2 1.6.6.
+       The timeout facility is supported for Pazpar2 version 1.8.4 and later.
        </para>
       </note>
      </listitem>
      </listitem>
     </varlistentry>
 
-    <varlistentry id="pzsortmap">
-     <term>pz:sortmap:<replaceable>field</replaceable></term>
+    <varlistentry>
+     <term id="pzxslt" xreflabel="pz:xslt">pz:xslt</term>
      <listitem>
       <para>
-       Specifies native sorting for a target where
-       <replaceable>field</replaceable> is a sort criteria (see command
-       show). The value has to components separated by colon: strategy and
-       native-field. Strategy is one of <literal>z3950</literal>,
-       <literal>type7</literal>, <literal>cql</literal>,
-       <literal>sru11</literal>, or <literal>embed</literal>.
-       The second component, native-field, is the field that is recognized
-       by the target.
+       Is a comma separated list of of stylesheet names that specifies
+       how to convert incoming records to the internal representation.
+      </para>
+      <para>
+       For each name, the embedded stylesheets (XSL) that comes with the
+       service definition are consulted first and takes precedence over
+       external files; see <xref linkend="servicexslt"/>
+       of service definition).
+       If the name does not match an embedded stylesheet it is
+       considered a filename.
+      </para>
+      <para>
+       The suffix of each file specifies the kind of tranformation.
+       Suffix "<literal>.xsl</literal>" makes an XSL transform. Suffix
+       "<literal>.mmap</literal>" will use the MMAP transform (described below).
+      </para>
+      <para>
+       The special value "<literal>auto</literal>" will use a file
+       which is the <link linkend="requestsyntax">pz:requestsyntax's</link>
+       value followed by
+       <literal>'.xsl'</literal>.
+      </para>
+      <para>
+       When mapping MARC records, XSLT can be bypassed for increased
+       performance with the alternate "MARC map" format.  Provide the
+       path of a file with extension ".mmap" containing on each line:
+       <programlisting>
+       &lt;field&gt; &lt;subfield&gt; &lt;metadata element&gt;</programlisting>
+       For example:
+       <programlisting>
+       245 a title
+       500 $ description
+        773 * citation
+       </programlisting>
+       To map the field value specify a subfield of '$'.  To store a
+       concatenation of all subfields, specify a subfield of '*'.
+      </para>
+     </listitem>
+    </varlistentry>
+
+    <varlistentry>
+     <term>pz:zproxy</term>
+     <listitem>
+      <para>
+       The 'pz:zproxy' setting has the value syntax
+       'host.internet.adress:port', it is used to tunnel Z39.50
+       requests through the named Z39.50 proxy.
       </para>
-      <note>
-       <para>
-       Only supported for Pazpar2 1.6.4 and later.
-       </para>
-      </note>
      </listitem>
     </varlistentry>
-    
+
    </variablelist>
-   
   </refsect2>
 
  </refsect1>