编码

编码便是变换 Unicode 标识符为等额的二进制表明的全过程。XML 程序处理载入一个 XML 文档时,它取决于编码类型来编码文档。因而,大家必须在 XML 申明中特定编码类型。

编码类型
关键有二种类型的编码:

UTF-8
UTF-16
UTF 表明 UCS 转换视频格式,而 UCS 自身的实际意义是通用性字段名。序号 8 或是 16 表明展现标识符的比特数。他们是 8(一个字节)或是 16(2个字节数)。针对沒有编码信息的文档,默认设置应用 UTF-8。

英语的语法
编码信息包括在 XML 文档的前言一部分。UTF-8 编码的英语的语法以下:

XML/HTML Code拷贝內容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="no" ?>  

UTF-16 编码英语的语法以下:

XML/HTML Code拷贝內容到剪贴板
  1. <?xml version="1.0" encoding="UTF-16" standalone="no" ?>  

实例

下边的事例展现了编码申明:

XML/HTML Code拷贝內容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  2. <contact-info>  
  3.     <name>Tanmay Patil</name>  
  4.     <company>TutorialsPoint</company>  
  5.     <phone>(011) 123-4567</phone>  
  6. </contact-info>  

在上面的 encoding="UTF-8" 实例中,特定应用 8 位表明标识符。要应用 16 为表明标识符,能够应用 UTF-16 编码。

应用 UTF-8 编码的 XML 文件尺寸比 UTF-16 文件格式的文档更小。

认证

认证 便是对 XML 文档开展认证的全过程。假如文档內容与原素,特性和关系的文档类型界定(DTD)配对,及其文档合乎b表述的约束则该文档被觉得是合理的。根据 XML 在线解析解决认证的方法有二种。分别是:

文件格式优良的 XML 文档
合理的 XML 文档
文件格式优良的 XML 文档
假如 XML 文档遵循下列标准则被觉得是文件格式优良的。

沒有 DTD 的 XML 文档务必应用预订义的标识符实体线解决 amp(&),apos(单引号),g(>),quot(双引号)。
务必遵照标识的次序,例如內部标识务必在外界标识合闭以前合闭。
每一个刚开始标识务必都是有一个完毕标识或是务必是一个自合闭标识(<title>...</title> 或是 <title />)。
在刚开始标识中务必只有有一个特性,而且必须应用冒号包囊。
除开amp(&),apos(单引号),g(>),quot(双引号)实体线以外别的的务必先申明再应用。
实例

下边是一个文件格式优良的 XML 文档实例:

XML/HTML Code拷贝內容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
  2. <!DOCTYPE address   
  3. [   
  4. <!ELEMENT address (name,company,phone)>  
  5.     <!ELEMENT name (#PCDATA)>  
  6.     <!ELEMENT company (#PCDATA)>  
  7.     <!ELEMENT phone (#PCDATA)>  
  8. ]>  
  9. <address>  
  10.     <name>Tanmay Patil</name>  
  11.     <company>TutorialsPoint</company>  
  12.     <phone>(011) 123-4567</phone>  
  13. </address>  

上边的实例被觉得是文件格式优良的,由于:

它界定了文档类型。而且这儿文档类型是原素类型。
包括一个名叫 address 的根原素。
每一个子原素 name,company 和 phone 全是一个自表述恰当合闭的标识。
标识的次序恰当。