无废话XML--DOM4J

时间:2023-03-09 07:39:29
无废话XML--DOM4J

Dom4j  是一个易用的、开源的库,用于 XML ,XPath  和 XSLT 。它应用于 Java  平台,采用了 Java  集合框架并完全支持 DOM ,SAX 和 和 JAXP 。我们可以很方便的使用DOM4J来对一个XML进行CRUD操作,当然也可以面向对象编程,将一个XML里面的数据来转换成相关对象使用。

  • 常用有4个接口,4个工具类:

Node  Node:为所有的 dom4j 中 XML 节点定义了多态行为

Element  Element:定义 XML 元素

Attribute  Attribute:定义了 XML 的属性

Text  Text:定义 XML 文本节点。

SAXReader:sax解析工具类

DOMReader:dom解析工具类

XMLWriter:写入XML文档工具类

OutputFormat:输入格式化工具类。

  • 值得注意的2点是:

1,格式化输出和指定编码。默认的输出方式为紧凑方式,默认编码为 UTF-8,但对于我们的应用而言,一般都要用到中文,并且希望显示时按自动缩进的方式的显示,这就需用到OutputFormat 类。

2,Dom4j 编码问题。j ava中由W ri t er类继承下来的子类没有提供编码格式处理,所以dom 4j 也就无法对输出的文件进行正确的格式处理。这时候所保存的文件会以系统的默认编码对文件进行保存,在中文版的wi ndow下j ava的默认的编码为G BK,也就是所虽然我们标识了要将xm l 保存为ut f -8格式但实际上文件是以G BK格式来保存的,所以这也就是为什么能够我们使用G BK、G B2312编码来生成xm
l 文件能正确的被解析,而以U TF-8格式生成的文件不能被xm l 解析器所解析的原因。所以在创建XMLWriter这个对象时,最好使用FileOutputStream,不要用FileWriter。



以下代码使用了DOM4J对XML实现了CRUD操作:

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.URL;
import java.util.List; import org.dom4j.Attribute;
import org.dom4j.Comment;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.Text;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter; /**
*
* @version 1L
* @author LinkinPark
* @since 2014-12-29
* @motto 梦似烟花心似水,同学少年不言情
* @desc ^其实DOM4J还是比较简单的,API也不是很多,着重记住Document,Element,Attribute就好了。
* Node是上面所有的接口的公共一个多态接口
*/
public class Dom4jHandler
{
public Document parse(URL url) throws DocumentException
{
SAXReader reader = new SAXReader();
Document document = reader.read(url);
return document;
} //解析XML
public void read(String fileName) throws DocumentException
{
SAXReader reader = new SAXReader();
//定义XML文档
Document document = reader.read(this.getClass().getResourceAsStream("/" + fileName));
//定义XML元素
Element rootElement = document.getRootElement();
System.out.println("根节点是:" + rootElement.getName());
List<Element> childElements = rootElement.elements();
for (Element element : childElements)
{
System.out.println(element.getName());
//下面这个nodeCount里面包含了所有的节点,那个换行也包含上了呢
System.out.println(element.nodeCount());
for (int i = 0; i < element.nodeCount(); i++)
{
Node node = element.node(i);
System.out.println("节点的名字是" + node.getName() + ";节点的值是" + node.getText() + ";节点的类型是" + node.getNodeTypeName());
if (node instanceof Element)
{
System.out.println("这里是元素!");
}
else if (node instanceof Comment)
{
System.out.println("这里是注释!");
}
else
{
System.out.println("这里鸡毛都没有!");
}
}
//现在开始解决上面那个空白的换行问题 如何去掉呢?
System.out.println("========开始去掉那个空白============");
for (int i = 0; i < element.nodeCount(); i++)
{
Node node = element.node(i);
if (node instanceof Text)
{
System.out.println("这里是文本!");
if ("".equals(node.getText().trim()))
{
System.out.println("这里就是要去掉的空白吆。。。");
}
else
{
System.out.println("这里是内容不是空白,所以不要去掉。。。");
System.out.println(node.getText().trim());
}
}
}
System.out.println("=========去掉空白结束=============");
List<Attribute> attributes = element.attributes();
//遍历这个元素里面的所有的属性
for (Attribute attribute : attributes)
{
System.out.println(attribute.getName() + ":" + attribute.getValue());
}
//现在我只想得到version这个属性
Attribute attribute = element.attribute("version");
System.out.println(attribute.getName() + ":" + attribute.getValue());
//现在我只想直接拿出version这个属性的值
String attributeValue = element.attributeValue("version");
System.out.println(attributeValue);
//获得element这个元素里面的所有的子节点
List<Element> childs = element.elements();
for (Element element2 : childs)
{
//Element元素里面没有getValue方法,Attribute里面有,其实和getText是一样的
System.out.println(element2.getName() + ":" + element2.getText());
}
//同样的Element也可以直接获得值,而且还可以去除空格
System.out.println(element.elementText("driver"));
System.out.println(element.elementTextTrim("driver"));
}
} //写出一个XML
public void write(String fileName) throws Exception
{
//生成一个XML文档
Document document = DocumentHelper.createDocument();
//给XML文档也就是Document添加数据
Element root = document.addElement("DataSource");//添加根节点
root.addComment("这里是LinkinPark自己生成的XML。。。");//添加注释
Element dateBase = root.addElement("database");//在root根节点下添加一个子节点
dateBase.addAttribute("name", "mysql");//给dateBase添加属性
dateBase.addAttribute("version", "5.0");//给dateBase添加属性
dateBase.addElement("driver").setText("com.mysql.jdbc.Driver");//给dateBase添加子节点
dateBase.addElement("url").setText("jdbc:mysql://localhost:3306/linkinjdbc");//给dateBase添加子节点
dateBase.addElement("user").setText("root");//给dateBase添加子节点
dateBase.addElement("password").setText("root");//给dateBase添加子节点
//将这个XML文档写出到文件去
writerTo(document, fileName);
} //专门定义一个写出XML到指定文件的方法
public void writerTo(Document document, String fileName) throws Exception
{
//OutputFormat of = OutputFormat.createCompactFormat();//这个format是不换行的,没有格式化过的
OutputFormat of = OutputFormat.createPrettyPrint();//这里是格式化过的
of.setEncoding("UTF-8");
//XMLWriter writer = new XMLWriter(new FileWriter(fileName), of);
//最好使用下面这种情况,这样子可以有效的解决XML编码是UTF-8的编码错误问题
XMLWriter writer = new XMLWriter(new FileOutputStream(fileName), of);
writer.write(document);
writer.close();
} //修改一个XML 2个参数:一个是读取文件自己的位置,一个是要保存到的文件的位置。
//这里也很好的说明了加载文件和流的区别:使用类加载器是直接从内存中要的,所以相对路径没有src;但是要是使用一个流来指定输入位置,那么就是文件系统,src要有的。
public void update(String fileName1, String fileName2) throws Exception
{
//现在我要修改LinkinPark下面的数据库的名称和数据库连接的名称,一个是属性,一个是节点
SAXReader reader = new SAXReader();
Document document = reader.read(this.getClass().getResourceAsStream("/" + fileName1));
Element rootElement = document.getRootElement();
List<Element> childElements = rootElement.elements("database");
for (Element element : childElements)
{
if ("mysql".equals(element.attributeValue("name")))
{
//换了这个属性的名字
element.attribute("name").setText("Oracle1");
}
List<Element> childs = element.elements("driver");
for (Element element2 : childs)
{
System.out.println(element2.getText().trim());
if ("com.mysql.jdbc.Driver".equals(element2.getText().trim()))
{
element2.setText("oracle.jdbc.driver.OracleDriver");
}
}
}
writerTo(document, fileName2);
} //删除一个XML里面的一部分内容
public void delete(String fileName1, String fileName2) throws Exception
{
//现在我要删除LinkinPark下面的数据库的名称和数据库连接的名称,一个是属性,一个是节点
SAXReader reader = new SAXReader();
Document document = reader.read(this.getClass().getResourceAsStream("/" + fileName1));
Element rootElement = document.getRootElement();
List<Element> childElements = rootElement.elements("database");
for (Element element : childElements)
{
//删除掉这个属性
element.remove(element.attribute("name"));
//删除掉这个子节点
element.remove(element.element("driver"));
}
writerTo(document, fileName2);
} public static void main(String[] args) throws Exception
{
//new Dom4jHandler().read("data-sources.xml");
new Dom4jHandler().write("src/LinkinPark...");
//new Dom4jHandler().update("LinkinPark...", "src/LinkinPark...");
//new Dom4jHandler().delete("LinkinPark...", "src/LinkinPark...");
} }
<?xml version="1.0" encoding="UTF-8"?>

<DataSource>
<!--这里是LinkinPark自己生成的XML。。。-->
<database name="mysql" version="5.0">
<driver>com.mysql.jdbc.Driver</driver>
<url>jdbc:mysql://localhost:3306/linkinjdbc</url>
<user>root</user>
<password>root</password>
</database>
</DataSource>