New command 'stat' for the index program.
[idzebra-moved-to-github.git] / index / recindex.c
index 90efa63..6f06cd5 100644 (file)
@@ -4,7 +4,13 @@
  * Sebastian Hammer, Adam Dickmeiss
  *
  * $Log: recindex.c,v $
- * Revision 1.9  1995-11-30 08:34:33  adam
+ * Revision 1.10  1995-12-06 12:41:24  adam
+ * New command 'stat' for the index program.
+ * Filenames can be read from stdin by specifying '-'.
+ * Bug fix/enhancement of the transformation from terms to regular
+ * expressons in the search engine.
+ *
+ * Revision 1.9  1995/11/30  08:34:33  adam
  * Started work on commit facility.
  * Changed a few malloc/free to xmalloc/xfree.
  *
 #include <assert.h>
 #include <string.h>
 #include <ctype.h>
-#include <assert.h>
-#include <fcntl.h>
-#include <unistd.h>
-
-#include "recindex.h"
-
-#define USE_BF 1
-
-#if USE_BF
-#include <bfile.h>
-
-#define REC_BLOCK_TYPES 2
-#define REC_HEAD_MAGIC "recindx"
-
-struct records_info {
-    int rw;
-
-    char *index_fname;
-    BFile index_BFile;
-
-
-    char *data_fname[REC_BLOCK_TYPES];
-    BFile data_BFile[REC_BLOCK_TYPES];
-
-    char *tmp_buf;
-    int tmp_size;
-
-    struct record_cache_entry *record_cache;
-    int cache_size;
-    int cache_cur;
-    int cache_max;
-
-    struct records_head {
-        char magic[8];
-        int block_size[REC_BLOCK_TYPES];
-        int block_free[REC_BLOCK_TYPES];
-        int block_last[REC_BLOCK_TYPES];
-        int block_used[REC_BLOCK_TYPES];
-        int block_move[REC_BLOCK_TYPES];
-
-        int index_last;
-        int index_free;
-        int no_records;
-
-    } head;
-};
-
-enum recordCacheFlag { recordFlagNop, recordFlagWrite, recordFlagNew,
-                       recordFlagDelete };
-
-struct record_cache_entry {
-    Record rec;
-    enum recordCacheFlag flag;
-};
-
-struct record_index_entry {
-    union {
-        struct {
-            int next;
-            int size;
-        } used;
-        struct {
-            int next;
-        } free;
-    } u;
-};
 
+#include "recindxp.h"
 
 static void rec_write_head (Records p)
 {
@@ -169,6 +110,7 @@ static void rec_release_blocks (Records p, int sysno)
 
     if (read_indx (p, sysno, &entry, sizeof(entry), 1) != 1)
         return ;
+    p->head.total_bytes -= entry.u.used.size;
     freeblock = entry.u.used.next;
     assert (freeblock > 0);
     dst_type = freeblock & 7;
@@ -258,7 +200,7 @@ static void rec_write_single (Records p, Record rec)
         {
             entry.u.used.next = block_free*8 + dst_type;
             entry.u.used.size = size;
-
+            p->head.total_bytes += size;
             write_indx (p, rec->sysno, &entry, sizeof(entry));
         }
         else
@@ -308,6 +250,7 @@ Records rec_open (int rw)
         p->head.index_free = 0;
         p->head.index_last = 1;
         p->head.no_records = 0;
+        p->head.total_bytes = 0;
         for (i = 0; i<REC_BLOCK_TYPES; i++)
         {
             p->head.block_free[i] = 0;
@@ -593,435 +536,6 @@ Record rec_cp (Record rec)
     return n;
 }
 
-/* no BF --------------------------------------------------- */
-#else
-
-struct records_info {
-    int rw;
-    int index_fd;
-    char *index_fname;
-    int data_fd;
-    char *data_fname;
-    struct records_head {
-        char magic[8];
-       int no_records;
-        int index_free;
-        int index_last;
-        int data_size;
-        int data_slack;
-        int data_used;
-    } head;
-    char *tmp_buf;
-    int tmp_size;
-    int cache_size;
-    int cache_cur;
-    int cache_max;
-    struct record_cache_entry *record_cache;
-};
-
-struct record_cache_entry {
-    Record rec;
-    int dirty;
-};
-
-struct record_index_entry {
-    union {
-        struct {
-            int offset;
-            int size;
-        } used;
-        struct {
-            int next;
-        } free;
-    } u;
-};
-
-#define REC_HEAD_MAGIC "rechead"
-
-static void rec_write_head (Records p)
-{
-    int r;
-
-    assert (p);
-    assert (p->index_fd != -1);
-    if (lseek (p->index_fd, (off_t) 0, SEEK_SET) == -1)
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "lseek to 0 in %s", p->index_fname);
-        exit (1);
-    }
-    r = write (p->index_fd, &p->head, sizeof(p->head));    
-    switch (r)
-    {
-    case -1:
-        logf (LOG_FATAL|LOG_ERRNO, "write head of %s", p->index_fname);
-        exit (1);
-    case sizeof(p->head):
-        break;
-    default:
-        logf (LOG_FATAL, "write head of %s. wrote %d", p->index_fname, r);
-        exit (1);
-    }
-}
-
-Records rec_open (int rw)
-{
-    Records p;
-    int r;
-
-    p = xmalloc (sizeof(*p));
-    p->rw = rw;
-    p->tmp_buf = NULL;
-    p->tmp_size = 0;
-    p->data_fname = "recdata";
-    p->data_fd = -1;
-    p->index_fname = "recindex";
-    p->index_fd = open (p->index_fname,
-                        rw ? (O_RDWR|O_CREAT) : O_RDONLY, 0666);
-    if (p->index_fd == -1)
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "open %s", p->index_fname);
-        exit (1);
-    }
-    r = read (p->index_fd, &p->head, sizeof(p->head));
-    switch (r)
-    {
-    case -1:
-        logf (LOG_FATAL|LOG_ERRNO, "read %s", p->index_fname);
-        exit (1);
-    case 0:
-        memcpy (p->head.magic, REC_HEAD_MAGIC, sizeof(p->head.magic));
-        p->head.index_free = 0;
-        p->head.index_last = 1;
-        p->head.no_records = 0;
-        p->head.data_size = 0;
-        p->head.data_slack = 0;
-        p->head.data_used = 0;
-        if (rw)
-            rec_write_head (p);
-        break;
-    case sizeof(p->head):
-        if (memcmp (p->head.magic, REC_HEAD_MAGIC, sizeof(p->head.magic)))
-        {
-            logf (LOG_FATAL, "read %s. bad header", p->index_fname);
-            exit (1);
-        }
-        break;
-    default:
-        logf (LOG_FATAL, "read head of %s. expected %d. got %d",
-             p->index_fname, sizeof(p->head), r);
-        exit (1);
-    }
-    p->data_fd = open (p->data_fname,
-                       rw ? (O_RDWR|O_CREAT) : O_RDONLY, 0666);
-    if (p->data_fd == -1)
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "open %s", p->data_fname);
-        exit (1);
-    }
-    p->cache_max = 10;
-    p->cache_cur = 0;
-    p->record_cache = xmalloc (sizeof(*p->record_cache)*p->cache_max));
-    return p;
-}
-
-static void read_indx (Records p, int sysno, void *buf, int itemsize)
-{
-    int r;
-    off_t pos = (sysno-1)*itemsize + sizeof(p->head);
-
-    if (lseek (p->index_fd, pos, SEEK_SET) == (pos) -1)
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "seek in %s to pos %ld",
-              p->index_fname, (long) pos);
-        exit (1);
-    }
-    r = read (p->index_fd, buf, itemsize);
-    if (r != itemsize)
-    {
-        if (r == -1)
-            logf (LOG_FATAL|LOG_ERRNO, "read in %s at pos %ld",
-                  p->index_fname, (long) pos);
-        else
-            logf (LOG_FATAL, "read in %s at pos %ld",
-                  p->index_fname, (long) pos);
-        exit (1);
-    }
-}
-
-static void rec_write_single (Records p, Record rec)
-{
-    struct record_index_entry entry;
-    int r, i, size = 0, got;
-    char *cptr;
-    off_t pos = (rec->sysno-1)*sizeof(entry) + sizeof(p->head);
-
-    for (i = 0; i < REC_NO_INFO; i++)
-        if (!rec->info[i])
-            size += sizeof(*rec->size);
-        else
-            size += sizeof(*rec->size) + rec->size[i];
-    
-    entry.u.used.offset = p->head.data_size;
-    entry.u.used.size = size;
-    p->head.data_size += size;
-    p->head.data_used += size;
-
-    if (lseek (p->index_fd, pos, SEEK_SET) == (pos) -1)
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "seek in %s to pos %ld",
-              p->index_fname, (long) pos);
-        exit (1);
-    }
-    r = write (p->index_fd, &entry, sizeof(entry));
-    if (r != sizeof(entry))
-    {
-        if (r == -1)
-            logf (LOG_FATAL|LOG_ERRNO, "write of %s at pos %ld",
-                  p->index_fname, (long) pos);
-        else
-            logf (LOG_FATAL, "write of %s at pos %ld",
-                  p->index_fname, (long) pos);
-        exit (1);
-    }
-    if (lseek (p->data_fd, entry.u.used.offset, SEEK_SET) == -1) 
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "lseek in %s to pos %ld",
-              p->data_fname, entry.u.used.offset);
-        exit (1);
-    }
-    if (p->tmp_size < entry.u.used.size) 
-    {
-        xfree (p->tmp_buf);
-        p->tmp_size = entry.u.used.size + 16384;
-        p->tmp_buf = xmalloc (p->tmp_size));
-    }
-    cptr = p->tmp_buf;
-    for (i = 0; i < REC_NO_INFO; i++)
-    {
-        memcpy (cptr, &rec->size[i], sizeof(*rec->size));
-        cptr += sizeof(*rec->size);
-        if (rec->info[i])
-        {
-            memcpy (cptr, rec->info[i], rec->size[i]);
-            cptr += rec->size[i];
-        }
-    }
-    for (got = 0; got < entry.u.used.size; got += r)
-    {
-        r = write (p->data_fd, p->tmp_buf + got, entry.u.used.size - got);
-        if (r <= 0)
-        {
-            logf (LOG_FATAL|LOG_ERRNO, "write of %s", p->data_fname);
-            exit (1);
-        }
-    }
-}
-
-static void rec_cache_flush (Records p)
-{
-    int i;
-    for (i = 0; i<p->cache_cur; i++)
-    {
-        struct record_cache_entry *e = p->record_cache + i;
-        if (e->dirty)
-            rec_write_single (p, e->rec);
-        rec_rm (&e->rec);
-    }
-    p->cache_cur = 0;
-}
-
-static Record *rec_cache_lookup (Records p, int sysno, int dirty)
-{
-    int i;
-    for (i = 0; i<p->cache_cur; i++)
-    {
-        struct record_cache_entry *e = p->record_cache + i;
-        if (e->rec->sysno == sysno)
-        {
-            if (dirty)
-                e->dirty = 1;
-            return &e->rec;
-        }
-    }
-    return NULL;
-}
-
-static void rec_cache_insert (Records p, Record rec, int dirty)
-{
-    struct record_cache_entry *e;
-
-    if (p->cache_cur == p->cache_max)
-        rec_cache_flush (p);
-    assert (p->cache_cur < p->cache_max);
-
-    e = p->record_cache + (p->cache_cur)++;
-    e->dirty = dirty;
-    e->rec = rec_cp (rec);
-}
-
-void rec_close (Records *p)
-{
-    assert (*p);
-
-    rec_cache_flush (*p);
-    xfree ((*p)->record_cache);
-
-    if ((*p)->rw)
-        rec_write_head (*p);
-
-    if ((*p)->index_fd != -1)
-        close ((*p)->index_fd);
-
-    if ((*p)->data_fd != -1)
-        close ((*p)->data_fd);
-
-    xfree ((*p)->tmp_buf);
-
-    xfree (*p);
-    *p = NULL;
-}
-
-Record rec_get (Records p, int sysno)
-{
-    int i;
-    Record rec, *recp;
-    struct record_index_entry entry;
-    int r, got;
-    char *nptr;
-
-    assert (sysno > 0);
-    assert (p);
-
-    if ((recp = rec_cache_lookup (p, sysno, 0)))
-        return rec_cp (*recp);
-
-    read_indx (p, sysno, &entry, sizeof(entry));
-    
-    rec = xmalloc (sizeof(*rec));
-    if (lseek (p->data_fd, entry.u.used.offset, SEEK_SET) == -1) 
-    {
-        logf (LOG_FATAL|LOG_ERRNO, "lseek in %s to pos %ld",
-              p->data_fname, entry.u.used.offset);
-        exit (1);
-    }
-    if (p->tmp_size < entry.u.used.size) 
-    {
-        xfree (p->tmp_buf);
-        p->tmp_size = entry.u.used.size + 16384;
-        p->tmp_buf = xmalloc (p->tmp_size));
-    }
-    for (got = 0; got < entry.u.used.size; got += r)
-    {
-        r = read (p->data_fd, p->tmp_buf + got, entry.u.used.size - got);
-        if (r <= 0)
-        {
-            logf (LOG_FATAL|LOG_ERRNO, "read of %s", p->data_fname);
-            exit (1);
-        }
-    }
-    rec->sysno = sysno;
-
-    nptr = p->tmp_buf;
-    for (i = 0; i < REC_NO_INFO; i++)
-    {
-        memcpy (&rec->size[i], nptr, sizeof(*rec->size));
-        nptr += sizeof(*rec->size);
-        if (rec->size[i])
-        {
-            rec->info[i] = xmalloc (rec->size[i]);
-            memcpy (rec->info[i], nptr, rec->size[i]);
-            nptr += rec->size[i];
-        }
-        else
-            rec->info[i] = NULL;
-    }
-    rec_cache_insert (p, rec, 0);
-    return rec;
-}
-
-Record rec_new (Records p)
-{
-    int sysno, i;
-    Record rec;
-
-    assert (p);
-    rec = xmalloc (sizeof(*rec));
-    if (p->head.index_free == 0)
-        sysno = (p->head.index_last)++;
-    else
-    {
-        struct record_index_entry entry;
-
-        read_indx (p, p->head.index_free, &entry, sizeof(entry));
-        sysno = p->head.index_free;
-        p->head.index_free = entry.u.free.next;
-    }
-    (p->head.no_records)++;
-    rec->sysno = sysno;
-    for (i = 0; i < REC_NO_INFO; i++)
-    {
-        rec->info[i] = NULL;
-        rec->size[i] = 0;
-    }
-    rec_cache_insert (p, rec, 1);
-    return rec;
-}
-
-void rec_put (Records p, Record *recpp)
-{
-    Record *recp;
-
-    if ((recp = rec_cache_lookup (p, (*recpp)->sysno, 1)))
-    {
-        rec_rm (recp);
-        *recp = *recpp;
-    }
-    else
-    {
-        rec_cache_insert (p, *recpp, 1);
-        rec_rm (recpp);
-    }
-    *recpp = NULL;
-}
-
-void rec_rm (Record *recpp)
-{
-    int i;
-    for (i = 0; i < REC_NO_INFO; i++)
-        xfree ((*recpp)->info[i]);
-    xfree (*recpp);
-    *recpp = NULL;
-}
-
-Record rec_cp (Record rec)
-{
-    Record n;
-    int i;
-
-    n = xmalloc (sizeof(*n));
-    n->sysno = rec->sysno;
-    for (i = 0; i < REC_NO_INFO; i++)
-        if (!rec->info[i])
-        {
-            n->info[i] = NULL;
-            n->size[i] = 0;
-        }
-        else
-        {
-            n->size[i] = rec->size[i];
-            n->info[i] = xmalloc (rec->size[i]);
-            memcpy (n->info[i], rec->info[i], rec->size[i]);
-        }
-    return n;
-}
-
-void rec_del (Records p, Record *recpp)
-{
-    assert (0);
-}
-
-
-#endif
 
 char *rec_strdup (const char *s, size_t *len)
 {