第一部分:XML初步
第三部分:XML dom4j
1.Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。
2.Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate。使用Dom4j开发,需下载dom4j相应的jar文件。
3.获取Document对象
SAXReader reader = new SAXReader(); |
4.元素操作
• //获取文档的元素. Element root = document.getRootElement(); • //获取某个元素的指定名称的第一个子节点 Element element = element.element(“书名"); • //获取某个元素的指定名称的所有子元素的集合 List list = element.elements(“书名”); • //添加一个指定名称的子元素 Element childEle = parentEle.addElement(“书名”); • //删除某个元素指定的子元素 parentEle.remove(childEle); |
5.属性操作
• //获取某个元素的指定名称的属性对象 Attribute attr = element.attribute(“id”); • //获取某个元素的指定名称的属性值 String id = element.attributeValue(“id”); • //给元素添加属性或更新其值 Attribute attr = element.addAttribute(“id”,”123”); • //删除某个元素的指定属性 element.remove(attribute); |
6.文本操作
• //获取某个元素的文本内容 String text = element.getText(); • //给某个元素添加或更新文本内容 element.setText(“Tom”); |
7.将文档写入XML文件,使更改生效
OutputFormat format = OutputFormat.createPrettyPrint(); XMLWriter writer = new XMLWriter( newFileOutput( "output.xml“ ),format); writer.write(document); writer.close(); |
8.练习:
①查找某一个节点: 查找id为007的学员的所有信息
②添加某一个节点: "姓名:王五,id:134,年龄:18
第四部分:XPath
- XPath 是在 XML 文档中查找信息的语言
XPath 是通过元素和属性进行查找
XPath简化了Dom4j查找节点的过程
使用XPath必须导入jaxen-1.1-beta-6.jar
否则出现
NoClassDefFoundError: org/jaxen/JaxenException
2.XPath语法示例
/students/student |
从根元素开始逐层找,以”/”开头 |
//name |
直接获取所有name元素对象,以“//”开头 |
//student/* |
获取所有student元素的所有子元素对象 |
//student[1]或//student[last()] |
获取所有student元素的第一个或最后一个 |
//student[@id] |
获取所有带id属性的student元素对象 |
//student[@id=‘002'] |
获取id等于002的student元素对象 |
3.查询节点
• 获取所有符合条件的节点 – document.selectNodes(String xpathExpression) 返回List集合 • 获取符合条件的单个节点 – document.selectSingleNode(String xpathExpression) – 返回一个Node对象。如果符合条件的节点有多个,那么返回第一个。 |
4.练习:
①查找id为007的学员姓名
②查找所有的学员姓名
第五部分:XML SAX解析
- 为什么会出现SAX解析?
在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。
SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
注意:sax只能用于读取xml文件,无法作更新
- SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器(对象):
解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。
事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
3.解析方式
• 使用SAXParserFactory创建SAX解析工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); • 通过SAX解析工厂得到解析器对象 SAXParser sp = factory.newSAXParser(); • 通过解析器对象得到一个XML的读取器 XMLReader xmlReader = sp.getXMLReader(); • 设置读取器的事件处理器 xmlReader.setContentHandler(new BookParserHandler()); • 解析xml文件 xmlReader.parse("book.xml"); |
4.练习:查找id为007的学生姓名
第六部分:XML Pull解析
- 为什么会出现PULL解析?
Pull解析与sax解析类似都是基于事件方法回调机制来实现对xml文件解析。
Sax解析不足:即使已经找到所要的数据,xml数据还是会全部加载进来并产生方法调用。程序员无法停止这些无用的操作,而pull解析解决了此问题。
Pull解析:加载每一部分数据产生方法调用,都必须通过程序员调用一个固定的方法才能进行下去,否则解析工作就停止了。Next()
注意:pull解析也只能用于读取xml文件,无法作更新
- Pull解析依赖两个jar包:xmlpull_1_0_5.jar和kxml2-2.3.0.jar
3.常用接口或类
XmlPullParserFactory
XmlPullParser(既是解析器又是数据的存储器)
XmlPullParserException
4.练习:查找id为007的学员姓名