Update copyright year + FSF address
[idzebra-moved-to-github.git] / bfile / commit.c
index 216825c..a4dacda 100644 (file)
-/*
- * Copyright (C) 1995, Index Data I/S 
- * All rights reserved.
- * Sebastian Hammer, Adam Dickmeiss
- *
- * $Log: commit.c,v $
- * Revision 1.1  1995-11-30 08:33:13  adam
- * Started work on commit facility.
- *
- */
+/* $Id: commit.c,v 1.28 2006-08-14 10:40:05 adam Exp $
+   Copyright (C) 1995-2006
+   Index Data ApS
+
+This file is part of the Zebra server.
+
+Zebra is free software; you can redistribute it and/or modify it under
+the terms of the GNU General Public License as published by the Free
+Software Foundation; either version 2, or (at your option) any later
+version.
+
+Zebra is distributed in the hope that it will be useful, but WITHOUT ANY
+WARRANTY; without even the implied warranty of MERCHANTABILITY or
+FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
+for more details.
+
+You should have received a copy of the GNU General Public License
+along with this program; if not, write to the Free Software
+Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
+
+*/
+
 
 #include <assert.h>
-#include <fcntl.h>
-#include <unistd.h>
-#include <alexutil.h>
+#include <stdlib.h>
 
-#include <mfile.h>
+#include <idzebra/util.h>
+#include <yaz/xmalloc.h>
+#include "mfile.h"
 #include "cfile.h"
 
-void cf_commit (CFile cf)
-{
-    int i, r, bucket_no;
-    int hash_bytes;
-    struct CFile_ph_bucket *p;
+#define CF_OPTIMIZE_COMMIT 0
 
+void cf_unlink(CFile cf)
+{
     if (cf->bucket_in_memory)
     {
-        logf (LOG_FATAL, "Cannot commit potential dirty cache");
+        yaz_log (YLOG_FATAL, "Cannot unlink potential dirty cache");
         exit (1);
     }
-    p = xmalloc (sizeof(*p));
-    hash_bytes = cf->head.hash_size * sizeof(int);
-    bucket_no = (hash_bytes+sizeof(cf->head))/HASH_BSIZE + 2;
-    if (lseek (cf->hash_fd, bucket_no * HASH_BSIZE, SEEK_SET) < 0)
+    cf->head.state = 0;
+    cf->dirty = 1;
+    mf_unlink (cf->block_mf);
+    mf_unlink (cf->hash_mf);
+}
+
+
+#if CF_OPTIMIZE_COMMIT
+struct map_cache_entity {
+    int from;
+    int to;
+};
+
+struct map_cache {
+    int max;
+    int no;
+
+    struct map_cache_entity *map;
+    char *buf;
+    CFile cf;
+};
+
+static struct map_cache *map_cache_init (CFile cf)
+{
+    int mem_max = 2000000;
+    struct map_cache *m_p;
+
+    m_p = xmalloc (sizeof(*m_p));
+    m_p->cf = cf;
+    m_p->max = mem_max / cf->head.block_size;
+    m_p->buf = xmalloc (mem_max);
+    m_p->no = 0;
+    m_p->map = xmalloc (sizeof(*m_p->map) * m_p->max);
+    return m_p;
+}
+
+static int map_cache_cmp_from (const void *p1, const void *p2)
+{
+    return ((struct map_cache_entity*) p1)->from -
+        ((struct map_cache_entity*) p2)->from;
+}
+
+static int map_cache_cmp_to (const void *p1, const void *p2)
+{
+    return ((struct map_cache_entity*) p1)->to -
+        ((struct map_cache_entity*) p2)->to;
+}
+
+static void map_cache_flush (struct map_cache *m_p)
+{
+    int i;
+
+    qsort (m_p->map, m_p->no, sizeof(*m_p->map), map_cache_cmp_from);
+    assert (m_p->no < 2 || m_p->map[0].from < m_p->map[1].from);
+    for (i = 0; i<m_p->no; i++)
     {
-        logf (LOG_FATAL|LOG_ERRNO, "seek commit");
-        exit (1);
+        if (!mf_read (m_p->cf->block_mf, m_p->map[i].from, 0, 0,
+                      m_p->buf + i * m_p->cf->head.block_size))
+        {
+            yaz_log (YLOG_FATAL, "read commit block at position %d",
+                  m_p->map[i].from);
+            exit (1);
+        }
+        m_p->map[i].from = i;
     }
+    qsort (m_p->map, m_p->no, sizeof(*m_p->map), map_cache_cmp_to);
+    assert (m_p->no < 2 || m_p->map[0].to < m_p->map[1].to);
+    for (i = 0; i<m_p->no; i++)
+    {
+        mf_write (m_p->cf->rmf, m_p->map[i].to, 0, 0,
+                  m_p->buf + m_p->map[i].from * m_p->cf->head.block_size);
+    }    
+    m_p->no = 0;
+}
+
+static void map_cache_del (struct map_cache *m_p)
+{
+    map_cache_flush (m_p);
+    xfree (m_p->map);
+    xfree (m_p->buf);
+    xfree (m_p);
+}
+
+static void map_cache_add (struct map_cache *m_p, int from, int to)
+{
+    int i = m_p->no;
+
+    m_p->map[i].from = from;
+    m_p->map[i].to = to;
+    m_p->no = ++i;
+    if (i == m_p->max)
+        map_cache_flush (m_p);
+}
+
+/* CF_OPTIMIZE_COMMIT */
+#endif
+
+static void cf_commit_hash (CFile cf)
+{ 
+    int i;
+    zint bucket_no;
+    int hash_bytes;
+    struct CFile_ph_bucket *p;
+#if CF_OPTIMIZE_COMMIT
+    struct map_cache *m_p;
+#endif
+
+#if CF_OPTIMIZE_COMMIT
+    m_p = map_cache_init (cf);
+#endif
+
+    p = (struct CFile_ph_bucket *) xmalloc (sizeof(*p));
+    hash_bytes = cf->head.hash_size * sizeof(zint);
+    bucket_no = cf->head.first_bucket;
     for (; bucket_no < cf->head.next_bucket; bucket_no++)
     {
-        r = read (cf->hash_fd, p, HASH_BSIZE);
-        if (r != HASH_BSIZE)
+        if (!mf_read (cf->hash_mf, bucket_no, 0, 0, p))
         {
-            logf (LOG_FATAL, "read commit hash");
+            yaz_log (YLOG_FATAL, "read commit hash");
             exit (1);
         }
         for (i = 0; i<HASH_BUCKET && p->vno[i]; i++)
         {
-            if (lseek (cf->block_fd, p->vno[i]*cf->head.block_size,
-                SEEK_SET) < 0)
+#if CF_OPTIMIZE_COMMIT
+            map_cache_add (m_p, p->vno[i], p->no[i]);
+#else
+            if (!mf_read (cf->block_mf, p->vno[i], 0, 0, cf->iobuf))
             {
-                logf (LOG_FATAL, "lseek commit block");
+                yaz_log (YLOG_FATAL, "read commit block");
                 exit (1);
             }
-            r = read (cf->block_fd, cf->iobuf, cf->head.block_size);
-            if (r != cf->head.block_size)
+            mf_write (cf->rmf, p->no[i], 0, 0, cf->iobuf);
+#endif
+        }
+    }
+#if CF_OPTIMIZE_COMMIT
+    map_cache_del (m_p);
+#endif
+    xfree (p);
+}
+
+static void cf_commit_flat (CFile cf)
+{
+    zint *fp;
+    zint hno;
+    int i;
+    zint vno = 0;
+
+#if CF_OPTIMIZE_COMMIT
+    struct map_cache *m_p;
+#endif
+
+
+#if CF_OPTIMIZE_COMMIT
+    m_p = map_cache_init (cf);
+#endif
+    fp = (zint *) xmalloc (HASH_BSIZE);
+    for (hno = cf->head.next_bucket; hno < cf->head.flat_bucket; hno++)
+    {
+       for (i = 0; i < (int) (HASH_BSIZE/sizeof(zint)); i++)
+           fp[i] = 0;
+        if (!mf_read (cf->hash_mf, hno, 0, 0, fp) &&
+            hno != cf->head.flat_bucket-1)
+        {
+            yaz_log (YLOG_FATAL, "read index block hno=" ZINT_FORMAT
+                 " (" ZINT_FORMAT "-" ZINT_FORMAT ") commit",
+                  hno, cf->head.next_bucket, cf->head.flat_bucket-1);
+        }
+        for (i = 0; i < (int) (HASH_BSIZE/sizeof(zint)); i++)
+        {
+            if (fp[i])
             {
-                logf (LOG_FATAL, "read commit block");
-                exit (1);
+#if CF_OPTIMIZE_COMMIT
+                map_cache_add (m_p, fp[i], vno);
+#else
+                if (!mf_read (cf->block_mf, fp[i], 0, 0, cf->iobuf))
+                {
+                    yaz_log (YLOG_FATAL, "read data block hno=" ZINT_FORMAT " (" ZINT_FORMAT "-" ZINT_FORMAT ") "
+                                     "i=%d commit block at " ZINT_FORMAT " (->" ZINT_FORMAT")",
+                          hno, cf->head.next_bucket, cf->head.flat_bucket-1,
+                          i, fp[i], vno);
+                    exit (1);
+                }
+                mf_write (cf->rmf, vno, 0, 0, cf->iobuf);
+
+#endif
             }
-            mf_write (cf->mf, p->no[i], 0, 0, cf->iobuf);
+            vno++;
         }
     }
-    xfree (p);
+#if CF_OPTIMIZE_COMMIT
+    map_cache_del (m_p);
+#endif
+    xfree (fp);
 }
 
+void cf_commit (CFile cf)
+{
+
+    if (cf->bucket_in_memory)
+    {
+        yaz_log (YLOG_FATAL, "Cannot commit potential dirty cache");
+        exit (1);
+    }
+    if (cf->head.state == 1)
+        cf_commit_hash (cf);
+    else if (cf->head.state == 2)
+        cf_commit_flat (cf);
+}
+
+/*
+ * Local variables:
+ * c-basic-offset: 4
+ * indent-tabs-mode: nil
+ * End:
+ * vim: shiftwidth=4 tabstop=8 expandtab
+ */
+