Java第三阶段学习(十、XML学习)

时间:2023-03-09 17:27:43
Java第三阶段学习(十、XML学习)

一、XML学习

1、模拟Servlet执行

在学习完前端及java与数据库后,将进行WEB编程阶段的学习。在WEB编程中,可以通过浏览器访问WEB服务器上的数据。这时WEB服务器就相当于另一台计算机。

Java第三阶段学习(十、XML学习)

浏览器的入口不同(访问路径),访问的资源也不同。

Java第三阶段学习(十、XML学习)

网址就是浏览器访问服务器的路径:

Java第三阶段学习(十、XML学习)

2、相关技术

为了灵活实现不同路径执行不同的资源,我们需要用XML进行配置,为了限定XML内容,我们需要用XML约束(DTD或schema),为了获得XML的内容,我们需要用dam4j解析。

2.1 什么是XML?

XML英文名称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

因为W3C后面出的新版本都不兼容旧版本,所以目前学习使用的都还是XML1.0版本。

示例代码:

XML代码:

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://java.sun.com/xml/ns/javaee" xsi:schemaLocation="http://java.sun.com/xml/ns/javaee http://java.sun.com/xml/ns/javaee/web-app_2_5.xsd" id="WebApp_ID" version="2.5">
<!-- 外部xml是整个项目的配置文件 -->
<display-name>WEB001</display-name>
<servlet>
<servlet-name>MyServlet</servlet-name>
<servlet-class>com.oracle.demo01.MyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>MyServlet</servlet-name>
<url-pattern>/MyServlet</url-pattern>
</servlet-mapping>
<welcome-file-list>
<!-- 默认的欢迎页面 -->
<welcome-file>index.html</welcome-file>
</welcome-file-list>
</web-app>

Servlet代码:

package com.oracle.demo01;

import java.io.IOException;

import javax.servlet.Servlet;
import javax.servlet.ServletConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.http.HttpServletResponse; public class MyServlet implements Servlet{ @Override
public void destroy() {
// TODO Auto-generated method stub } @Override
public ServletConfig getServletConfig() {
// TODO Auto-generated method stub
return null;
} @Override
public String getServletInfo() {
// TODO Auto-generated method stub
return null;
} @Override
public void init(ServletConfig arg0) throws ServletException {
// TODO Auto-generated method stub } @Override
//请求:request 响应:response
public void service(ServletRequest arg0, ServletResponse arg1) throws ServletException, IOException {
HttpServletResponse res=(HttpServletResponse)arg1;
res.setCharacterEncoding("UTF-8");
res.getWriter().write("hello"); } }

2.2 XML语法

 1、XML文档声明

Java第三阶段学习(十、XML学习)

1.文档声明必须为<?xml开头,以?>结束;

2.文档声明必须从文档的0行0列位置开始:

3.文档声明只有属性:

a)      versioin:指定XML文档版本。必选属性,因为我们不会选择1.1,只会选择1.0;

b)      encoding:指定当前文档的编码。可选属性,默认值是。utf-8:

  2、元素element

Java第三阶段学习(十、XML学习)

1.元素是XML文档中最重要的组成部分,

2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>

3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>

4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>

5.元素命名:

a)      区分大小写

b)      不能使用空格,不能使用冒号:

c)      不建议以XML,  xml,  Xml开头

6.格式化良好的XML文档,必须只有一个根元素。

   3、属性

Java第三阶段学习(十、XML学习)

1.属性是元素的一部分,它必须出现在元素的开始标签中

2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引

3.一个元素可以有O ~ N个属性,但一个元素中不能出现同名属性

4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头

  4、注释

XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

  5、转义字符

XML中的转义字符与HTML一样。

因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”。

Java第三阶段学习(十、XML学习)

6、CDATA区

Java第三阶段学习(十、XML学习)

当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

     注意:  在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

<?xml version="1.0" encoding="UTF-8"?>
<person>
<person1 id="1">
<name>&lt;张三</name>
<name>
<![CDATA[
if(a==2&&a==3){
a=2;
}
]]>
</name>
</person1>
</person>

2.3 什么是DTD约束

DTD (Document Type Definition ),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。

通过提供的DTD"web-app_2_3.dtd "编写XML

(重点)实现步骤:

Normal
0

7.8 磅
0
2

false
false
false

EN-US
ZH-CN
X-NONE

/* Style Definitions */
table.MsoNormalTable
{mso-style-name:普通表格;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:10.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}

步骤1:创建web.xml文档,并将“web-app_ 2_ 3.dtd"拷贝相同目录下。

Java第三阶段学习(十、XML学习)

Normal
0

7.8 磅
0
2

false
false
false

EN-US
ZH-CN
X-NONE

/* Style Definitions */
table.MsoNormalTable
{mso-style-name:普通表格;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:10.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}

步骤2:从DTD文档开始处,拷贝需要的“文档声明”

Java第三阶段学习(十、XML学习)

DTD文档代码:

<?xml version="1.0" encoding="UTF-8"?>
<!--
模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
格式如下:
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
-->
<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))>
<!ELEMENT servlet-mapping (servlet-name,url-pattern+) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT description (#PCDATA)>
<!ELEMENT jsp-file (#PCDATA)> <!ELEMENT welcome-file-list (welcome-file+)>
<!ELEMENT welcome-file (#PCDATA)> <!ATTLIST web-app version CDATA #IMPLIED>

Normal
0

7.8 磅
0
2

false
false
false

EN-US
ZH-CN
X-NONE

/* Style Definitions */
table.MsoNormalTable
{mso-style-name:普通表格;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:10.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}

步骤3:完成xml内容编写

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
<servlet>
<servlet-name>MyServerlet1</servlet-name>
<servlet-class>com.oracle.demo01.MyServerlet</servlet-class>
</servlet>
<!-- mapping:映射 -->
<servlet-mapping>
<servlet-name>MyServlet1</servlet-name>
<!-- 用来起别名的,随便起,不过在前面必须要加个“/” -->
<url-pattern>/hello</url-pattern>
</servlet-mapping>
</web-app>

 2.4 schema约束

2.4.1 什么是schema约束

1) Schema是新的XML文档约束:

2)Schema要比DTD强大很多,是DTD替代者;

3)Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .

4)Schema功能更强大,数据类型更完善

5)Schema支持名称空间

2.4.2 通过schema约束编写XML文档:

步骤:

步骤1:创建web.xml,并将"web-app_2_5.xsd"拷贝到同级目录

Java第三阶段学习(十、XML学习)

步骤2:从xsd文档中拷贝需要的“命名空间”

Java第三阶段学习(十、XML学习)

Java第三阶段学习(十、XML学习)

步骤3.完成xml内容编写

xsd文档代码:

<?xml version="1.0" encoding="UTF-8"?>
<!--
模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
格式如下:
<web-app xmlns="http://www.example.org/web-app_2_5"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
version="2.5">
-->
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.example.org/web-app_2_5"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:tns="http://www.example.org/web-app_2_5"
elementFormDefault="qualified"> <xsd:element name="web-app">
<xsd:complexType>
<xsd:choice minOccurs="0" maxOccurs="unbounded">
<xsd:element name="servlet">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="servlet-name"></xsd:element>
<xsd:element name="servlet-class"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="servlet-mapping">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="servlet-name"></xsd:element>
<xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="welcome-file-list">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:choice>
<xsd:attribute name="version" type="double" use="optional"></xsd:attribute>
</xsd:complexType>
</xsd:element>
</xsd:schema>

XML代码演示:

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
version="2.5">
<!-- schema约束 -->
<servlet>
<servlet-name>MyServlet</servlet-name>
<servlet-class>com.oracle.Demo02.MyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>MyServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
</web-app> <!-- 记得写结束代码,否则会报错 -->

测试代码:

package com.oracle.Demo03;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader; public class Demo { public static void main(String[] args) throws DocumentException {
// 1.获取解析器
SAXReader saxReader=new SAXReader();
//2.通过路径读取约束的xml文件,获得document文档对象
Document doc=saxReader.read("src/com/oracle/Demo03/schemaxml.xml");
//3.运用方法获取根元素
Element rootElement=doc.getRootElement();
//打印根元素 的名称
// System.out.println(rootElement.getName());
//根据属性名称获得的
System.out.println(rootElement.attributeValue("version"));
//4.获取根元素下的子元素
List<Element> list=rootElement.elements();
//5.遍历子元素 Element:元素
for(Element e:list){
if("servlet".equals(e.getName())){
//.element(..)指定名称则获取指定的,否则会获得第一个
Element servletName=e.element("servlet-name");
Element servletClass=e.element("servlet-class");
System.out.println(servletName.getText());
System.out.println(servletClass.getText());
}
}
} }

 2.5  命名空间(属于语法部分)

名称空间就是用来处理元素和属性的名称冲突问题

 声明命名空间:

Java第三阶段学习(十、XML学习)

示例代码:

<?xml version="1.0" encoding="UTF-8"?>
<!--
模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
格式如下:
<web-app xmlns="http://www.example.org/web-app_2_5"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
version="2.5">
-->
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.example.org/web-app_2_5"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:tns="http://www.example.org/web-app_2_5"
elementFormDefault="qualified"> <xsd:element name="web-app">
<xsd:complexType>
<xsd:choice minOccurs="0" maxOccurs="unbounded">
<xsd:element name="servlet">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="servlet-name"></xsd:element>
<xsd:element name="servlet-class"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="servlet-mapping">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="servlet-name"></xsd:element>
<xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="welcome-file-list">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:choice>
<xsd:attribute name="version" type="double" use="optional"></xsd:attribute>
</xsd:complexType>
</xsd:element>
</xsd:schema>

 2.6 dom4j解析

当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果用java的方法会很繁琐,但是用解析方法就很简便了。

 2.6.1 解析方式和解析器:

开发中比较常见的解析方式有三种,如下:

1、DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

a)  优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

b)  缺点:XML文档过大,可能出现内存溢出显现。

2、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解即可)

a)  优点:处理速度快,可以处理大文件

b)  缺点:只能读,逐行后将释放资源。

3.  PULL:  Android内置的XML解析方式,类似SAX。(了解即可)

  解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

Java第三阶段学习(十、XML学习)

2.6.2  常见的解析开发包:

1)  JAXP: sun公司提供支持DOM和SAX开发包

2)  JDom:dom4j兄弟

3)  jsoup:一种处理HTML特定解析开发包

4)  dom4j:比较常用的解析开发包,hibernate底层采用。我们只用这种

v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}

Normal
0
false

7.8 磅
0
2

false
false
false

EN-US
ZH-CN
X-NONE

/* Style Definitions */
table.MsoNormalTable
{mso-style-name:普通表格;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:10.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}
table.MsoTableGrid
{mso-style-name:网格型;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-unhide:no;
mso-style-qformat:yes;
border:solid windowtext 1.0pt;
mso-border-alt:solid windowtext .5pt;
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-border-insideh:.5pt solid windowtext;
mso-border-insidev:.5pt solid windowtext;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
text-align:justify;
text-justify:inter-ideograph;
mso-pagination:none;
font-size:10.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}