Xml 简明教程
XML - Encoding
Encoding 是将 unicode 字符转换为其等效二进制表示的过程。XML 处理器读取 XML 文档时,它会根据编码类型对文档进行编码。因此,我们需要在 XML 声明中指定编码类型。
Encoding Types
主要有两种编码类型 −
-
UTF-8
-
UTF-16
UTF 表示 UCS 转换格式,UCS 本身表示通用字符集。数字 8 或 16 指的是用于表示字符的位数。它们要么是 8(1 到 4 个字节),要么是 16(2 或 4 个字节)。对于不包含编码信息的文档,默认设置为 UTF-8。
Syntax
编码类型包含在 XML 文档的前言部分。UTF-8 编码的语法如下 −
<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
UTF-16 编码的语法如下 −
<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>
Example
以下示例展示了编码声明 −
<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
<name>Tanmay Patil</name>
<company>TutorialsPoint</company>
<phone>(011) 123-4567</phone>
</contact-info>
在上面的示例中, encoding="UTF-8" 指定使用 8 位来表示字符。要表示 16 位字符,可以使用 UTF-16 编码。
经 UTF-8 编码的 XML 文件往往比经 UTF-16 格式编码的文件小。