【9-7】XML学习笔记01

时间:2023-03-09 09:25:32
【9-7】XML学习笔记01

Tips


  • XML标签大小写敏感;

  • XML文件一般使用国际化通用的编码“utf-8”,所以平时看到的XML文件的头部都会有这样的代码:

    <?xml version="1.0" encoding="utf-8"?>
    当XML文件中有中文时,必须使用encoding属性指明文档的字符编码,例如:encoding="GB2312"或者encoding="utf-8",并且在保存文件时,也要以相应的文件编码来保存,否则在使用浏览器解析XML文件时,就会出现解析错误的情况。
  • XML声明语句有standalone属性:
    • 该属性定义了是否可以在不读取任何其他文件的情况下处理该文档,其属性值可以是yes或no,如果XML文档没有引用任何其他文件,则可以指定standalone=”yes”,否则standalone=”no”。 standalone默认值是no。
  • 格式良好的XML文档必须有且仅有一个根标签,其它标签都是这个根标签的子孙标签。对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。

  • 一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:

    1. 区分大小写,例如,<P>和<p>是两个不同的标记。
    2. 不能以数字或"_" (下划线)开头。
    3. 不能以xml(或XML、或Xml 等)开头。
    4. 不能包含空格。
    5. 名称中间不能包含冒号(:)
  • Xml文件中的注释采用: <!--注释--> 格式。XML声明之前不能有注释,注释不能嵌套;
  • 字符引用:实际处理过程中,不在键盘上的字符或是图形字符是无法直接输入的,这种情况下,可以使用Unicode码将它们以字符引用的形式加入。

<![CDATA[不需解析的内容]]>特殊标签


  • CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data);
  • 在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理,遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出。

实体引用(entity reference)


  • 避免把字符数据和标签中需要用到的一些特殊字符相混淆;

  • <:&lt;
  • >:&gt;
  • &:&amp;
  • ':&apos;
  • ":&quot;

处理指令


  • 处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容,标签名为中文时,css不起作用。  
  • <?xml-stylesheet type="text/css" href="css文件名.css"?>
  • 处理指令必须以"<?"作为开头,以"?>"作为结尾,XML声明语句(<?xml version="1.0" encoding="utf-8"?>)就是最常见的一种处理指令。
  • <?xml version="1.0" encoding="utf-8"?>
  • xls文件:XSL是可扩展样式表语言的外语缩写,是一种用于以可读格式呈现 XML(标准通用标记语言的子集)数据的语言。eXtensible Stylesheet Language
  • <?xml-stylesheet type='text/xsl' href='xxx.xsl'?>