第一部分：XML初步

发布日期：2018-09-17 作者：atguigu 9613人浏览

第三部分：XML dom4j

1.Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是，dom4j使用接口和抽象基类，虽然Dom4j的API相对要复杂一些，但它提供了比JDOM更好的灵活性。

2.Dom4j是一个非常优秀的Java XML API，具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j，例如Hibernate。使用Dom4j开发，需下载dom4j相应的jar文件。

3.获取Document对象

SAXReader reader = new SAXReader();
Document document = reader.read(new File( "input.xml“ ));

4.元素操作

• //获取文档的元素.

Element root = document.getRootElement();

• //获取某个元素的指定名称的第一个子节点

Element element = element.element(“书名");

• //获取某个元素的指定名称的所有子元素的集合

List list = element.elements(“书名”);

• //添加一个指定名称的子元素

Element childEle = parentEle.addElement(“书名”);

• //删除某个元素指定的子元素

parentEle.remove(childEle);

5.属性操作

• //获取某个元素的指定名称的属性对象

Attribute attr = element.attribute(“id”);

• //获取某个元素的指定名称的属性值

String id = element.attributeValue(“id”);

• //给元素添加属性或更新其值

Attribute attr = element.addAttribute(“id”,”123”);

• //删除某个元素的指定属性

element.remove(attribute);

6.文本操作

• //获取某个元素的文本内容

String text = element.getText();

• //给某个元素添加或更新文本内容

element.setText(“Tom”);

7.将文档写入XML文件，使更改生效

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter writer = new XMLWriter( newFileOutput( "output.xml“ ),format);

writer.write(document);

writer.close();

8.练习：

①查找某一个节点: 查找id为007的学员的所有信息

②添加某一个节点: "姓名：王五，id:134,年龄:18

第四部分：XPath

XPath 是在 XML 文档中查找信息的语言

XPath 是通过元素和属性进行查找

XPath简化了Dom4j查找节点的过程

使用XPath必须导入jaxen-1.1-beta-6.jar

否则出现

NoClassDefFoundError: org/jaxen/JaxenException

2.XPath语法示例

/students/student	从根元素开始逐层找，以”/”开头
//name	直接获取所有name元素对象,以“//”开头
//student/*	获取所有student元素的所有子元素对象
//student[1]或//student[last()]	获取所有student元素的第一个或最后一个
//student[@id]	获取所有带id属性的student元素对象
//student[@id=‘002']	获取id等于002的student元素对象

3.查询节点

• 获取所有符合条件的节点

– document.selectNodes(String xpathExpression) 返回List集合

• 获取符合条件的单个节点

– document.selectSingleNode(String xpathExpression)

– 返回一个Node对象。如果符合条件的节点有多个，那么返回第一个。

4.练习：

①查找id为007的学员姓名

②查找所有的学员姓名

第五部分：XML SAX解析

为什么会出现SAX解析？

在使用 DOM 解析 XML 文档时，需要读取整个 XML 文档，在内存中构架代表整个 DOM 树的Doucment对象，从而再对XML文档进行操作。此种情况下，如果 XML 文档特别大，就会消耗计算机的大量内存，并且容易导致内存溢出。

SAX解析允许在读取文档的时候，即对文档进行处理，而不必等到整个文档装载完才会文档进行操作。

注意：sax只能用于读取xml文件，无法作更新

SAX采用事件处理的方式解析XML文件，利用 SAX 解析 XML 文档，涉及两个部分：解析器和事件处理器(对象)：

解析器可以使用JAXP的API创建，创建出SAX解析器后，就可以指定解析器去解析某个XML文档。

解析器采用SAX方式在解析某个XML文档时，它只要解析到XML文档的一个组成部分，都会去调用事件处理器的一个方法，解析器在调用事件处理器的方法时，会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。

事件处理器由程序员编写，程序员通过事件处理器中方法的参数，就可以很轻松地得到sax解析器解析到的数据，从而可以决定如何对数据进行处理。

3.解析方式

• 使用SAXParserFactory创建SAX解析工厂

SAXParserFactory factory = SAXParserFactory.newInstance();

• 通过SAX解析工厂得到解析器对象

SAXParser sp = factory.newSAXParser();

• 通过解析器对象得到一个XML的读取器

XMLReader xmlReader = sp.getXMLReader();

• 设置读取器的事件处理器

xmlReader.setContentHandler(new BookParserHandler());

• 解析xml文件

xmlReader.parse("book.xml");

4.练习：查找id为007的学生姓名

第六部分：XML Pull解析

为什么会出现PULL解析？

Pull解析与sax解析类似都是基于事件方法回调机制来实现对xml文件解析。

Sax解析不足：即使已经找到所要的数据，xml数据还是会全部加载进来并产生方法调用。程序员无法停止这些无用的操作，而pull解析解决了此问题。

Pull解析：加载每一部分数据产生方法调用，都必须通过程序员调用一个固定的方法才能进行下去，否则解析工作就停止了。Next()

注意：pull解析也只能用于读取xml文件，无法作更新

Pull解析依赖两个jar包：xmlpull_1_0_5.jar和kxml2-2.3.0.jar

3.常用接口或类

XmlPullParserFactory

XmlPullParser(既是解析器又是数据的存储器)

XmlPullParserException

4.练习：查找id为007的学员姓名

上一篇：Tomcat系统架构分析 下一篇：版本控制器SVN