Java Xml 简明教程
Java StAX Parser - Parse XML Document
Java StAX 解析器 API 具有以事件形式解析 XML 文档的类、方法和接口。这是一个基于拉的 API,它允许客户端程序仅在需要时获得访问事件的更多权限。在本章中,我们将详细了解如何使用 StAX 解析器 API 在 Java 中解析 XML 文件。
Parse XML Using Java StAX Parser
下面是使用 Java StAX 解析器解析文档时使用的步骤:
-
*步骤 1:*创建 XMLInputFactory 实例
-
步骤 2: 读取 XML
-
*第 3 步:*解析 XML
-
步骤 4: 检索元素
Step 1: Creating XMLInputFactory instance
XMLInputFactory 类是一个抽象类,用于获取输入流。要创建一个 XMLInputFactory 的新实例,我们使用 newInstance() 方法。如果无法加载此工厂的实例,它将抛出名为 "FactoryConfigurationError" 的错误。
XMLInputFactory factory = XMLInputFactory.newInstance();
Step 2: Reading the XML
FileReader 类用于从输入文件读取字符流。如果找不到文件或由于某种原因无法读取文件,则以下语句将抛出 "FileNotFoundException"。
FileReader fileReader = new FileReader("src/input.txt");
除了从文件中读取 XML 内容之外,我们还可以获取内容的字符串形式,并将其转换为字节,如下所示:
StringBuilder xmlBuilder = new StringBuilder();
xmlBuilder.append("<class>xyz</class>");
ByteArrayInputStream input = new ByteArrayInputStream(xmlBuilder.toString().getBytes("UTF-8"));
Retrieving Element Name
要检索元素名称,我们首先应该从 XML 文档中获取元素。当事件类型为 XMLStreamConstants.START_ELEMENT,XMLEvent 对象的 asStartElement() 以 StartElement 对象的形式检索元素。
StartElement 的 getName() 方法以字符串的形式返回元素的名称。
Example
RetrieveElementName.java 程序采用 StringBuilder 对象中的 XML 内容并将其转换为字节。所获得的 InputStream 用于创建 XMLEventReader。使用解析器通告的事件来访问元素。
import java.io.ByteArrayInputStream;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;
public class RetrieveElementName {
public static void main(String args[]) {
try {
//Creating XMLInputFactory instance
XMLInputFactory factory = XMLInputFactory.newInstance();
//Reading the XML
StringBuilder xmlBuilder = new StringBuilder();
xmlBuilder.append("<class>xyz</class>");
ByteArrayInputStream input = new ByteArrayInputStream(xmlBuilder.toString().getBytes("UTF-8"));
//Parsing the XML
XMLEventReader eventReader =
factory.createXMLEventReader(input);
//Retrieving the Elements
while(eventReader.hasNext()) {
XMLEvent event = eventReader.nextEvent();
if(event.getEventType()==XMLStreamConstants.START_ELEMENT) {
StartElement startElement = event.asStartElement();
System.out.println("Element Name: " + startElement.getName());
}
}
} catch(Exception e) {
e.printStackTrace();
}
}
}
Retrieving Text Content
要检索元素的文本内容,在 XMLEvent 对象上使用 asCharacters() 方法。仅当事件类型为 XMLStreamConstants.CHARACTERS 时,我们才能使用 asCharacters() 方法。此方法以 Characters 对象的形式返回数据。 getData() 方法用于以字符串的形式获取文本内容。
Example
在前面的示例中,我们已将 XML 内容作为输入流。现在,让我们通过从文件读取输入,即通过将以下 XML 内容保存在名为 classData.xml 的文件中来获取输入
<class>xyz</class>
在以下 RetrievingTextContent.java 程序中,我们已使用 FileReader 对象读取 classData.xml 文件,并将其作为输入传递给 XMLEventReader。使用 XMLEvent 对象,我们已获取元素的文本内容。
import java.io.FileReader;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.events.Characters;
import javax.xml.stream.events.XMLEvent;
public class RetrievingTextContent {
public static void main(String args[]) {
try {
//Creating XMLInputFactory instance
XMLInputFactory factory = XMLInputFactory.newInstance();
//Reading the XML
FileReader fileReader = new FileReader("classData.xml");
//Parsing the XML
XMLEventReader eventReader =
factory.createXMLEventReader(fileReader);
//Retrieving the Elements
while(eventReader.hasNext()) {
XMLEvent event = eventReader.nextEvent();
if(event.getEventType()==XMLStreamConstants.CHARACTERS) {
Characters characters = event.asCharacters();
System.out.println("Text Content : "+ characters.getData());
}
}
} catch(Exception e) {
e.printStackTrace();
}
}
}
Retrieving Attributes
StartElement 接口的 getAttributes() 方法返回此元素上声明的属性的只读迭代器。如果此元素上未声明任何属性,它将返回一个空迭代器。
Attribute 接口上的 getValue() 函数以字符串的形式返回属性的值。
Example
以下 classData.xml 包含三个学生的信息及其作为属性的学号。让我们使用 Java 中的 StAX API 来检索此信息。
<?xml version = "1.0"?>
<class>
<student rollno = "393">
<firstname>dinkar</firstname>
<lastname>kad</lastname>
<nickname>dinkar</nickname>
<marks>85</marks>
</student>
<student rollno = "493">
<firstname>Vaneet</firstname>
<lastname>Gupta</lastname>
<nickname>vinni</nickname>
<marks>95</marks>
</student>
<student rollno = "593">
<firstname>jasvir</firstname>
<lastname>singn</lastname>
<nickname>jazz</nickname>
<marks>90</marks>
</student>
</class>
在以下 RetrieveAttributes.java 程序中,我们已使用 switch case 语句(用于 START_ELEMENT、CHARACTERS 和 END_ELEMENT XMLStreamConstants)来访问元素的所有信息。
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.util.Iterator;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.Attribute;
import javax.xml.stream.events.Characters;
import javax.xml.stream.events.EndElement;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;
public class RetrievingAttributes {
public static void main(String[] args) {
boolean bFirstName = false;
boolean bLastName = false;
boolean bNickName = false;
boolean bMarks = false;
try {
//Creating XMLInputFactory instance
XMLInputFactory factory = XMLInputFactory.newInstance();
//Reading the XML
FileReader fileReader = new FileReader("classData.xml");
//Parsing the XML
XMLEventReader eventReader =
factory.createXMLEventReader(fileReader);
//Retrieving the Elements
while(eventReader.hasNext()) {
XMLEvent event = eventReader.nextEvent();
switch(event.getEventType()) {
case XMLStreamConstants.START_ELEMENT:
StartElement startElement = event.asStartElement();
String qName = startElement.getName().getLocalPart();
if (qName.equalsIgnoreCase("student")) {
System.out.println("Start Element : student");
Iterator<Attribute> attributes = startElement.getAttributes();
String rollNo = attributes.next().getValue();
System.out.println("Roll No : " + rollNo);
} else if (qName.equalsIgnoreCase("firstname")) {
bFirstName = true;
} else if (qName.equalsIgnoreCase("lastname")) {
bLastName = true;
} else if (qName.equalsIgnoreCase("nickname")) {
bNickName = true;
}
else if (qName.equalsIgnoreCase("marks")) {
bMarks = true;
}
break;
case XMLStreamConstants.CHARACTERS:
Characters characters = event.asCharacters();
if(bFirstName) {
System.out.println("First Name: " + characters.getData());
bFirstName = false;
}
if(bLastName) {
System.out.println("Last Name: " + characters.getData());
bLastName = false;
}
if(bNickName) {
System.out.println("Nick Name: " + characters.getData());
bNickName = false;
}
if(bMarks) {
System.out.println("Marks: " + characters.getData());
bMarks = false;
}
break;
case XMLStreamConstants.END_ELEMENT:
EndElement endElement = event.asEndElement();
if(endElement.getName().getLocalPart().equalsIgnoreCase("student")) {
System.out.println("End Element : student");
System.out.println();
}
break;
}
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (XMLStreamException e) {
e.printStackTrace();
}
}
}
Output
所有学生的信息及其学号都显示在输出屏幕上。
Start Element : student
Roll No : 393
First Name: dinkar
Last Name: kad
Nick Name: dinkar
Marks: 85
End Element : student
Start Element : student
Roll No : 493
First Name: Vaneet
Last Name: Gupta
Nick Name: vinni
Marks: 95
End Element : student
Start Element : student
Roll No : 593
First Name: jasvir
Last Name: singn
Nick Name: jazz
Marks: 90
End Element : student