第一部分:XML初步

第三部分:XML dom4j

1.Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。

2.Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate。使用Dom4j开发,需下载dom4j相应的jar文件。

3.获取Document对象

SAXReader reader = new SAXReader();
Document   document = reader.read(new File( "input.xml“ ));

4.元素操作

• //获取文档的元素.

      Element root = document.getRootElement();

• //获取某个元素的指定名称的第一个子节点

Element element = element.element(“书名");

• //获取某个元素的指定名称的所有子元素的集合

      List list = element.elements(“书名”);

• //添加一个指定名称的子元素

      Element childEle = parentEle.addElement(“书名”);

• //删除某个元素指定的子元素

parentEle.remove(childEle);

5.属性操作

• //获取某个元素的指定名称的属性对象

      Attribute attr = element.attribute(“id”);

• //获取某个元素的指定名称的属性值

String id = element.attributeValue(“id”);

• //给元素添加属性或更新其值

      Attribute attr = element.addAttribute(“id”,”123”);

• //删除某个元素的指定属性

      element.remove(attribute);

6.文本操作

• //获取某个元素的文本内容

String text = element.getText();

• //给某个元素添加或更新文本内容

element.setText(“Tom”);

7.将文档写入XML文件,使更改生效

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter writer = new XMLWriter( newFileOutput( "output.xml“ ),format);

writer.write(document);

writer.close();

8.练习:

①查找某一个节点: 查找id为007的学员的所有信息

②添加某一个节点: "姓名:王五,id:134,年龄:18

 

第四部分:XPath

  1. XPath 是在 XML 文档中查找信息的语言

XPath 是通过元素和属性进行查找

XPath简化了Dom4j查找节点的过程

使用XPath必须导入jaxen-1.1-beta-6.jar

否则出现

NoClassDefFoundError: org/jaxen/JaxenException

2.XPath语法示例

/students/student

从根元素开始逐层找,以”/”开头

//name

直接获取所有name元素对象,以“//”开头

//student/*

获取所有student元素的所有子元素对象

//student[1]或//student[last()]

获取所有student元素的第一个或最后一个

//student[@id]

获取所有带id属性的student元素对象

//student[@id=‘002']

获取id等于002的student元素对象

3.查询节点

• 获取所有符合条件的节点

– document.selectNodes(String xpathExpression) 返回List集合

• 获取符合条件的单个节点

– document.selectSingleNode(String xpathExpression)

– 返回一个Node对象。如果符合条件的节点有多个,那么返回第一个。

4.练习:

①查找id为007的学员姓名

②查找所有的学员姓名

 

第五部分:XML SAX解析

  1. 为什么会出现SAX解析?

 

在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。

 

SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。

 

注意:sax只能用于读取xml文件,无法作更新

  1. SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器(对象):

解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。

解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。

事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。

3.解析方式

• 使用SAXParserFactory创建SAX解析工厂

SAXParserFactory factory = SAXParserFactory.newInstance();

• 通过SAX解析工厂得到解析器对象

SAXParser sp = factory.newSAXParser();

• 通过解析器对象得到一个XML的读取器

XMLReader xmlReader = sp.getXMLReader();

• 设置读取器的事件处理器

xmlReader.setContentHandler(new BookParserHandler());

• 解析xml文件

xmlReader.parse("book.xml");

4.练习:查找id为007的学生姓名

 

第六部分:XML Pull解析

  1. 为什么会出现PULL解析?

Pull解析与sax解析类似都是基于事件方法回调机制来实现对xml文件解析。

 

Sax解析不足:即使已经找到所要的数据,xml数据还是会全部加载进来并产生方法调用。程序员无法停止这些无用的操作,而pull解析解决了此问题。

 

Pull解析:加载每一部分数据产生方法调用,都必须通过程序员调用一个固定的方法才能进行下去,否则解析工作就停止了。Next()

 

注意:pull解析也只能用于读取xml文件,无法作更新

 

  1. Pull解析依赖两个jar包:xmlpull_1_0_5.jar和kxml2-2.3.0.jar

 

3.常用接口或类

XmlPullParserFactory

XmlPullParser(既是解析器又是数据的存储器)

XmlPullParserException

 

4.练习:查找id为007的学员姓名