Xerces 简明教程

Apache Xerces - DOM Parser Overview

文档对象模型是万维网联盟(W3C)的正式建议。它定义了使程序能够访问和更新 XML 文档的样式、结构和内容的接口。支持 DOM 的 XML 解析器实施了该接口。

When to use?

你应在下列情况下使用 DOM 解析器:

  1. 您需要充分理解文档的结构。

  2. 您需要移动文档的各个部分(例如,您可能想要对某些元素进行排序)。

  3. 您需要多次使用文档中的信息。

What you get?

使用 DOM 解析器解析 XML 文档时,你会得到一个包含你的文档所有元素的树形结构。DOM 提供了各种函数让你能够检查文档的内容和结构。

Advantages

DOM 是用于操作文档结构的通用接口。它的一个设计目标是,为一个 DOM 兼容解析器编写的 Java 代码应该可以在任何其他 DOM 兼容解析器上运行,无需进行更改。

DOM interfaces

DOM 定义了若干 Java 接口。这里是最常见的接口 −

  1. Node − DOM 的基本数据类型。

  2. Element − 您将处理的大多数对象是元素。

  3. Attr − 表示元素的一个属性。

  4. Text − 元素或属性的实际内容。

  5. Document − 表示整个 XML 文档。文档对象通常称为 DOM 树。

Common DOM methods

当使用 DOM 时,有几种经常使用的方法 −

  1. Document.getDocumentElement() − 返回文档的根元素。

  2. Node.getFirstChild() − 返回给定节点的第一个子代。

  3. Node.getLastChild() − 返回给定节点的最后一个子代。

  4. Node.getNextSibling() − 这些方法返回给定节点的下一个同级。

  5. Node.getPreviousSibling() − 这些方法返回给定节点的前一个同级。

  6. Node.getAttribute(attrName) − 对于给定的节点,返回具有请求名称的属性。