Original 2.4
[marc4j.git] / src / org / marc4j / converter / impl / ReverseCodeTableHandler.java
1 // $Id: ReverseCodeTableHandler.java,v 1.2 2005/05/04 11:39:12 bpeters Exp $\r
2 /**\r
3  * Copyright (C) 2002 Bas Peters\r
4  *\r
5  * This file is part of MARC4J\r
6  *\r
7  * MARC4J is free software; you can redistribute it and/or\r
8  * modify it under the terms of the GNU Lesser General Public\r
9  * License as published by the Free Software Foundation; either\r
10  * version 2.1 of the License, or (at your option) any later version.\r
11  *\r
12  * MARC4J is distributed in the hope that it will be useful,\r
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of\r
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU\r
15  * Lesser General Public License for more details.\r
16  *\r
17  * You should have received a copy of the GNU Lesser General Public\r
18  * License along with MARC4J; if not, write to the Free Software\r
19  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA\r
20  */\r
21 package org.marc4j.converter.impl;\r
22 \r
23 import java.io.File;\r
24 import java.io.FileInputStream;\r
25 import java.util.Hashtable;\r
26 import java.util.Vector;\r
27 \r
28 import javax.xml.parsers.SAXParser;\r
29 import javax.xml.parsers.SAXParserFactory;\r
30 \r
31 import org.xml.sax.Attributes;\r
32 import org.xml.sax.InputSource;\r
33 import org.xml.sax.Locator;\r
34 import org.xml.sax.SAXParseException;\r
35 import org.xml.sax.XMLReader;\r
36 import org.xml.sax.helpers.DefaultHandler;\r
37 \r
38 /**\r
39  * <p>\r
40  * <code>ReverseCodeTableHandler</code> is a SAX2 <code>ContentHandler</code>\r
41  * that builds a data structure to facilitate <code>UnicodeToAnsel</code>\r
42  * character conversion.\r
43  * \r
44  * @author Corey Keith\r
45  * @version $Revision: 1.2 $\r
46  * \r
47  * @see DefaultHandler\r
48  */\r
49 public class ReverseCodeTableHandler extends DefaultHandler {\r
50   private Hashtable charset;\r
51 \r
52   private Vector combiningchars;\r
53 \r
54   private boolean useAlt = false;\r
55   \r
56   /** Data element identifier */\r
57   private Integer isocode;\r
58 \r
59   private char[] marc;\r
60 \r
61   private Character ucs;\r
62 \r
63   private boolean combining;\r
64 \r
65   /** Tag name */\r
66   private String tag;\r
67 \r
68   /** StringBuffer to store data */\r
69   private StringBuffer data;\r
70 \r
71   /** Locator object */\r
72   private Locator locator;\r
73 \r
74   public Hashtable getCharSets() {\r
75     return charset;\r
76   }\r
77 \r
78   public Vector getCombiningChars() {\r
79     return combiningchars;\r
80   }\r
81 \r
82   /**\r
83    * <p>\r
84    * Registers the SAX2 <code>Locator</code> object.\r
85    * </p>\r
86    * \r
87    * @param locator\r
88    *          the {@link Locator}object\r
89    */\r
90   public void setDocumentLocator(Locator locator) {\r
91     this.locator = locator;\r
92   }\r
93 \r
94   public void startElement(String uri, String name, String qName,\r
95       Attributes atts) throws SAXParseException {\r
96     if (name.equals("characterSet"))\r
97       isocode = Integer.valueOf(atts.getValue("ISOcode"), 16);\r
98     else if (name.equals("marc"))\r
99       data = new StringBuffer();\r
100     else if (name.equals("codeTables")) {\r
101       charset = new Hashtable();\r
102       combiningchars = new Vector();\r
103     } else if (name.equals("ucs"))\r
104       data = new StringBuffer();\r
105     else if (name.equals("alt"))\r
106       data = new StringBuffer();\r
107     else if (name.equals("code"))\r
108       combining = false;\r
109     else if (name.equals("isCombining"))\r
110       data = new StringBuffer();\r
111 \r
112   }\r
113 \r
114   public void characters(char[] ch, int start, int length) {\r
115     if (data != null) {\r
116       data.append(ch, start, length);\r
117     }\r
118   }\r
119 \r
120   public void endElement(String uri, String name, String qName)\r
121       throws SAXParseException {\r
122     if (name.equals("marc")) {\r
123       String marcstr = data.toString();\r
124       if (marcstr.length() == 6) {\r
125         marc = new char[3];\r
126         marc[0] = (char) Integer.parseInt(marcstr.substring(0, 2), 16);\r
127         marc[1] = (char) Integer.parseInt(marcstr.substring(2, 4), 16);\r
128         marc[2] = (char) Integer.parseInt(marcstr.substring(4, 6), 16);\r
129       } else {\r
130         marc = new char[1];\r
131         marc[0] = (char) Integer.parseInt(marcstr, 16);\r
132       }\r
133     } else if (name.equals("ucs")) {\r
134       if (data.length() > 0)\r
135         ucs = new Character((char) Integer.parseInt(data.toString(), 16));\r
136       else\r
137         useAlt = true;\r
138     } else if (name.equals("alt")) {\r
139       if (useAlt && data.length() > 0) {\r
140         ucs = new Character((char) Integer.parseInt(data.toString(), 16));\r
141         useAlt = false;\r
142       }      \r
143     } else if (name.equals("code")) {\r
144       if (combining) {\r
145         combiningchars.add(ucs);\r
146       }\r
147 \r
148       if (charset.get(ucs) == null) {\r
149         Hashtable h = new Hashtable(1);\r
150         h.put(isocode, marc);\r
151         charset.put(ucs, h);\r
152       } else {\r
153         Hashtable h = (Hashtable) charset.get(ucs);\r
154         h.put(isocode, marc);\r
155       }\r
156     } else if (name.equals("isCombining")) {\r
157       if (data.toString().equals("true"))\r
158         combining = true;\r
159     }\r
160     data = null;\r
161   }\r
162 \r
163   public static void main(String[] args) {\r
164     Hashtable charsets = null;\r
165 \r
166     try {\r
167 \r
168       SAXParserFactory factory = SAXParserFactory.newInstance();\r
169       factory.setNamespaceAware(true);\r
170       factory.setValidating(false);\r
171       SAXParser saxParser = factory.newSAXParser();\r
172       XMLReader rdr = saxParser.getXMLReader();\r
173 \r
174       File file = new File(\r
175           "C:\\Documents and Settings\\ckeith\\Desktop\\Projects\\Code Tables\\codetables.xml");\r
176       InputSource src = new InputSource(new FileInputStream(file));\r
177 \r
178       ReverseCodeTableHandler saxUms = new ReverseCodeTableHandler();\r
179 \r
180       rdr.setContentHandler(saxUms);\r
181       rdr.parse(src);\r
182     } catch (Exception exc) {\r
183       exc.printStackTrace(System.out);\r
184       System.err.println("Exception: " + exc);\r
185     }\r
186   }\r
187 }