XHtml规则-Html转换为XHtml

时间:2022-11-10 14:21:14

XHTML规则

XHTML是XML得一个应用,它遵守XML得规范和要求。从技术角度上讲。这些语法规则是由XML规范定义的。

XML文档必须遵守的规则使得生成工具以解析文档变得更容易。这些规则也使得XML更容易处理。规则很简单,并且使用过HTML得人对于其中得一些规则应该比较熟悉。我们把XML得规则定义为下列两类:


 ∷XML语法规则,指的是定义了基本语法要求的规则。

∷XML文档规则,指的是管理着基本文档要求的规则。


∷XHTML语法规则

    XHTML需要遵守的许多语法规则,比HTML文档需要遵守的规则严格很多。因此,下面所说的每个规则示例都伴随有使用HTML语法的HTML示例和遵循每节中定义的规则的XHTML示例。


1.所有的标记都必须要有一个相应的结束标记

以前在HTML中,你可以打开许多标签,例如<p>和<li>而不一定写对应的</p>和</li>来关闭它们。但在XHTML中这是不合法的。XHTML要求有严谨的结构,所有标签必须关闭。如果是单独不成对的标签,在标签最后加一个"/"来关闭它。例如:

<br /><img height="80" alt="网页设计师" src="../images/logo_w3cn_200x80.gif" width="200" />

2.所有标签的元素和属性的名字都必须使用小写

与HTML不一样,XHTML对大小写是敏感的,<title>和<TITLE>是不同的标签。XHTML要求所有的标签和属性的名字都必须使用小写。例如:<BODY>必须写成<body> 。大小写夹杂也是不被认可的,通常dreamweaver自动生成的属性名字"onMouseOver"也必须修改成"onmouseover"。


3.所有的XHTML标记都必须合理嵌套

同样因为XHTML要求有严谨的结构,因此所有的嵌套都必须按顺序,以前我们这样写的代码:
<p><b></p>/b>必须修改为:<p><b></b>/p>
就是说,一层一层的嵌套必须是严格对称。


4.所有的属性必须用引号""括起来

在HTML中,你可以不需要给属性值加引号,但是在XHTML中,它们必须被加引号。例如:

<height=80> 必须修改为:<height="80">
特殊情况,你需要在属性值里使用双引号,你可以用",单引号可以使用&apos;,例如:

<alt="say&apos;hello&apos;">

5.把所有<和&特殊符号用编码表示

任何小于号(<),不是标签的一部分,都必须被编码为&lt ;
任何大于号(>),不是标签的一部分,都必须被编码为&gt ;
任何与号(&),不是实体的一部分的,都必须被编码为&amp;


6.给所有属性赋一个值

XHTML规定所有属性都必须有一个值,没有值的就重复本身。例如:

<td nowrap>
<input type="checkbox" name="shirt" value="medium" checked>
必须修改为:

<td nowrap="nowrap">
<input type="checkbox" name="shirt" value="medium" checked="checked">

7.不要在注释内容中使“- -”

“--”只能发生在XHTML注释的开头和结束,也就是说,在内容中它们不再有效。例如下面的代码是无效的:

<!--这里是注释-----------这里是注释-->
用等号或者空格替换内部的虚线。

<!--这里是注释= = = = = = = = = = = =这里是注释-->

以上这些规范有的看上去比较奇怪,但这一切都是为了使我们的代码有一个统一、唯一的标准,便于以识别。

∷XHTML文档规则
    这里有为数不多的文档规则控制着良好构成的XML文档。我们还定义了一些可选择规则并推荐大家遵守,但这不是必须的。

 

 

 

 


把HTML转换成XHTML


1.手工转换文档

如果你更新数量不太多的文档,并且自己又很不愿意有一些XHTML实践经验,那么你会选择手工把HTML页面转换成XHTML。现在有非常出色的免费工具(HTML Tidy,将在下面具体讨论)可以帮你完成。但是,理解工具做了什么很重要,这样才能使用其中的自定义选项。


向后兼容性


XHTML与老式浏览器保持向后兼容。你应该记住XHTML使用HTML的词汇表,只有语法管理是阻止XHTML与老式浏览器兼容的实际障碍。幸运的是,XML语法与SGML(因此还有HTML)非常接近,因此语法方面的差别并不大。


在上面,已经讲解了XHTML文档必须遵守的所有规范,其中大多数已经由HTML进行了定义。额外的一些情况如所有的元素都必须关闭以及遵守空元素规则,是新增的

● 在使用XML的空元素语法时,在后面的斜线(/)之前要加一个空格,如<br />。
 

● 大多数老式浏览器会把XML的声明

    <?xml version=”1.o” encoding=”HTF-8” standlone=”no”?>

作为内容显示出来,因此最好是省去将被老式浏览器看到的XHTML文档。如果你从文档中省去了XML声明,则该文档只能使用UTF-8或者UTF-16字符编码。

 

● 使用外部样式或者脚本文档,而不要把他们嵌入到你的XHTML文档的头部。在XHML代码之前,Web开发者可以使用HTML注释把脚本和样式单语句隐藏起来不被老式浏览器所见。XHTML使用XML CDATA节来标识内部脚本和样式单语法。

 老式和新式的处理器很可能有冲突。如果你不使用外部脚本或者样式单,则应保证内部语句不要包含<.&.}]>或者--。

 

● 要在属性值或中加入折行或者多个空白符。许多XML开发者使用折行来帮助提供文档的可读性,但是浏览器对空白的处理切并不统一,并且在显示XHTML文档时多个空白符可能会引起问题。如果要使用空白符来提高可读性,那么要保证你只在元素之间使用这些空白符。

 

● 引用以英镑符(#value)开始的段识别符时要使用name和id属性。Name属性最初用于引用命名的锚接点(anchor);但是HTML4已经不在赞成使用此属性,并且引入了id属性代替它来唯一的标识给定的元素。为了保证将来的兼容性,你希望使用id属性;但是,因为许多目前的浏览器以及老式浏览器并不支持此属性,所以你也要使用name属性。例如:

      <a name=”one” id=”one”>…</a>

 

● 同样,为了保持向前和向后的兼容性,还要同时使用lang和xml:lang属性来定义一个给定元素的语言。xml:lang属性比lang属性优先。

 

规则

    作为XML的一个应用,XHTML要求遵守XML的语法要求。详细规则在前面已经说过。

闭合所有元素;

使用正确的空元素语法;

所有的属性值都必须用引号;

为所有属性分配值;

元素和属性名要小写。XHTML区分大小写;

元素要正确嵌套;

包含一个DOCTYPE声明

如果你坚持使用XHTML1的DTD之一,就不能使用HTML4的DTD引用。当你把自己的文档从HTML转换到XHTML时,要保证使用的是正确的DOCTYPE声明。


XHTML提供了三种dtd声明可供选择:

过渡的(transitional):

要求非常宽松的dtd,它允许你继续使用html4.01的标识(但是要符合xhtml的写法)。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">

严格的(strict):
要求严格的dtd,你不能使用任何表现层的标识和属性,例如<br>。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 STRICT//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd">

框架的(frameset):
专门针对框架页面设计使用的dtd,如果你的页面中包含有框架,需要采用这种dtd。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 FRAMESET//EN" http://www.w3.org/tr/xhtml1/dtd/xhtml1-frameset.dtd">

添加XHTML名字空间:
    XHTML使用XML名字空间来帮助唯一地标识元素和属性集。这种办法对于计划混和(嵌套)使用其他XML词汇表地时候尤其会带来方便。根据XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML名字空间(xmlns="http://www.w3.org/1999/xhtml")。这个名字空间是要求使用的,并且必须定义在html起始标志中。

综合应用

 

下面的清单不是一个良好构成的XHTML文档,我们将把它转换成良好构成的XHTML文档。


    不严谨的HTML文档

<HTML>

<HEAD>

<TITLE>Sloppy HTML</TITLE>

</HEAD>

<BODY>

<H1>Element Rules</H1>

<P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT>

<BR>

<OL COMPACT>

<LI>Close all elements.

<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.

<LI>Convert all stand-alone attributes to attributes with values.

<LI>Add quotation marks to all attribute values.

<LI>Convert all uppercase element and cttribute names to lowercase.

<LI>Use the appropriate DOCTYPE declaration.

<LI>Add the XHTML namespace to the html start tag.

<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "

</OL>

</BODY>

</HTML>

 

按照下列步骤把上述文档更改为具有良好的构成:

 

1.关闭所有元素。注意p元素以及列表项元素(li)都没有关闭标志,因此应该添加标识关闭的p和li标志。

 <P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT></P>

<BR>

<OL COMPACT>

<LI>Close all elements.</LI>

<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility. </LI>

<LI>Convert all stand-alone attributes to attributes with values. </LI>

<LI>Add quotation marks to all attribute values. </LI>

<LI>Convert all uppercase element and cttribute names to lowercase. </LI>

<LI>Use the appropriate DOCTYPE declaration. </LI>

<LI>Add the XHTML namespace to the html start tag. </LI>

<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "</LI>

</OL>

 

2.空元素应该最手空元素语法,并且要保证加入必要的空格以保持向后兼容性。BR元素是上述文档中唯一的空元素,因此应该把它更改成<BR />。

 

3.把所有独立的属性转换成带有值的属性。把COMPACT更改为COMPACT=COMPACT。

 

4.在所有属性值上加引号。

<P><FONT COLOR="RED">Elements provide the structure that holds your document together.</FONT></P>

<BR>

<OL COMPACT="COMPACT">

 

5.把所有大写元素和属性名(以及属性值)都转换为小写。

<html>

<head>

<title>Sloppy HTML</title>

</head>

<body>

<h1> Element Rules</h1>

<p><font color="red"> Elements provide the structure that holds your document together.</font></p>

<br />

<ol compact="compact">

<li> Close all elements.</li>

<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>

<li> Convert all stand-alone attributes to attributes with values.</li>……

 

6.使用正确的DOCTYPE声明。我们将使用过渡型(Transitional)DTD:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">

 

7.把XHTML名字空间添加到html起始标志中。

<html xmlns=http://www.w3.org/1999/xhtml>

 

 


最后得到的代码如下:


简洁的XHTML文档

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">

<html xmlns=http://www.w3.org/1999/xhtml>

<head>

<title>Sloppy HTML</title>

</head>

<body>

<h1> Element Rules</h1>

<p><font color="red"> Elements provide the structure that holds your document together.</font></p>

<br />

<ol compact="compact">

<li> Close all elements.</li>

<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>

<li> Convert all stand-alone attributes to attributes with

values.</li>

<li> Add quotation marks to all attribute values.</li>

<li>Convert all uppercase element and cttribute names to lowercase.</li>

<li>Use the appropriate DOCTYPE declaration.</li>

<li>Add the XHTML namespace to the html start tag.</li>

<li>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility."</li>

<ol>

</body>

</html>