一、SAX解析xml簡介
SAX是Simple API for Xml的簡寫,主要功能是用于對xml文檔進行解析。由于該方式采用的是事件驅動(callback回調機制)解析方式,所以有速度快、占內存少的優點,當然這些優點也僅限于xml的讀取操作,SAX是無法對讀取的XML元素進行修改的。如果要修改節點元素則需要使用DOC方式進行將xml文件讀取,它會將xml讀取成document樹結構對象,這樣可用對節點元素進行編輯操作;DOC方式的缺點也比較明顯:占內存大、解析速度較慢。
所以僅用于讀取xml操作,使用SAX方式是比較好的方式。
二、SAX解析XML實例
創建一個解析的xml文件
1
2
3
4
5
6
7
8
9
10
11
|
<? xml version = "1.0" encoding = "utf-8" ?> < persons > < user > < userId >1001</ userId > < userName >張三</ userName > </ user > < user > < userId >1002</ userId > < userName >李四</ userName > </ user > </ persons > |
創建一個XMLparseHandler用于自定義xml解析
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
public class Customhandler extends DefaultHandler2 { List<Map> list = new ArrayList<>(); Map map = null ; String tag = "" ; @Override public void startDocument() throws SAXException { System.out.println( "開始解析xml" ); } @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { System.out.println( "開始解析元素: <" + qName + ">" ); if (qName == "user" ){ map = new HashMap(); } tag = qName; } @Override public void characters( char [] ch, int start, int length) throws SAXException { String text = new String(ch, start, length).trim(); if (text != null && !text.isEmpty() && tag!= null && tag!= "" ){ map.put(tag, text); if (!map.containsKey(tag)){ } System.out.println( "解析到元素值:" + text); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { System.out.println( "結束解析元素: <" + qName + ">" ); if (qName.equals( "user" )){ list.add(map); } tag = "" ; } @Override public void endDocument() throws SAXException { System.out.println( "結束解析xml" ); } } |
創建SAX解析對象解析xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
|
public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //創建xml解析工廠 SAXParserFactory factory = SAXParserFactory.newInstance(); //創建xml解析對象 SAXParser parser = factory.newSAXParser(); File file = new File( "test/custom/user.xml" ); InputStream inputStream = new FileInputStream(file); Customhandler customhandler = new Customhandler(); //方式一 //parser.parse(inputStream, customhandler); //方式二 InputSource source = new InputSource(file.toURI().toURL().toString()); XMLReader xmlParser = parser.getXMLReader(); xmlParser.setContentHandler(customhandler); xmlParser.parse(source); List c = customhandler.list; inputStream.close(); } //打印結果為: 開始解析xml 開始解析元素: <persons> 開始解析元素: <user> 開始解析元素: <userId> 解析到元素值: 1001 結束解析元素: <userId> 開始解析元素: <userName> 解析到元素值:張三 結束解析元素: <userName> 結束解析元素: <user> 開始解析元素: <user> 開始解析元素: <userId> 解析到元素值: 1002 結束解析元素: <userId> 開始解析元素: <userName> 解析到元素值:李四 結束解析元素: <userName> 結束解析元素: <user> 結束解析元素: <persons> 結束解析xml |
三、SAX的實際應用
在tomcat源碼中,有一個Digester對象,這個Digester是tomcat啟動時,初始化各個容器(service、engine、Connetor)的執行者,而Digester執行容器初始化的依據是解析配置文件server.xml的內容,根據xml的具體配置進行來初始化容器。
下面是Digester的類的一些主要方法:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
|
//org.apache.tomcat.util.digester.Digester#parse(org.xml.sax.InputSource) public class Digester extends DefaultHandler2 { //讀取解析xml public Object parse(InputSource input) throws IOException, SAXException { configure(); getXMLReader().parse(input); return root; } //對每個xml標簽進行解析,并執行于之對應的Rule規則列表 public void startElement(String namespaceURI, String localName, String qName, Attributes list) throws SAXException { boolean debug = log.isDebugEnabled(); // Parse system properties list = updateAttributes(list); // Save the body text accumulated for our surrounding element bodyTexts.push(bodyText); bodyText = new StringBuilder(); // the actual element name is either in localName or qName, depending // on whether the parser is namespace aware String name = localName; if ((name == null ) || (name.length() < 1 )) { name = qName; } // Compute the current matching rule StringBuilder sb = new StringBuilder(match); if (match.length() > 0 ) { sb.append( '/' ); } sb.append(name); //根據每次xml節點的名稱拼接成匹配url match = sb.toString(); // Fire "begin" events for all relevant rules(根據namespaceURI匹配獲取的Rule規則列表,有順序規則) List<Rule> rules = getRules().match(namespaceURI, match); matches.push(rules); if ((rules != null ) && (rules.size() > 0 )) { for (Rule value : rules) { try { Rule rule = value; if (debug) { log.debug( " Fire begin() for " + rule); } //依次執行begin方法 rule.begin(namespaceURI, name, list); } catch (Exception e) { log.error( "Begin event threw exception" , e); throw createSAXException(e); } catch (Error e) { log.error( "Begin event threw error" , e); throw e; } } } else { if (debug) { log.debug( " No rules found matching '" + match + "'." ); } } } } |
與之對應的server.xml片段如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
< Service name = "Catalina" > < Connector port = "8081" protocol = "HTTP/1.1" connectionTimeout = "20000" redirectPort = "8443" /> < Engine name = "Catalina" defaultHost = "localhost" > < Host name = "localhost" appBase = "webapps" unpackWARs = "true" autoDeploy = "true" > </ Host > </ Engine > </ Service > |
Digester讀取到上面這些xml標簽后,就會從外向里進行嵌套解析,將這些標簽創建為與之對應的java類實例,也就是tomcat的主體容器結構。
以上就是Java使用SAX解析xml的示例的詳細內容,更多關于Java使用SAX解析xml的資料請關注服務器之家其它相關文章!
原文鏈接:https://juejin.cn/post/6944908543027839013