dom4j将xml文件转换成project.properties配置文件和Excel表格

时间:2024-05-18 15:48:09

要求使用dom4j将xml文件转换成project.properties配置文件和Excel表格:

如XML文件:

  1. <?xml version="1.0" encoding="UTF-8"?>

  2. <root>

  3. <books type="名著">

  4. <book name="三国演义" author="罗贯中">

  5. <info>三国简介</info>

  6. </book>

  7. <book name="红楼梦" author="曹雪芹">

  8. <info>红楼简介</info>

  9. </book>

  10. </books>

  11. <books type="小说">

  12. <book name="斗罗大陆" author="唐家三少">

  13. <info>斗罗简介</info>

  14. </book>

  15. <book name="诛仙" author="萧鼎">

  16. <info>诛仙简介</info>

  17. </book>

  18. </books>

  19. </root>

要求转换成形如此的配置文件:

 

dom4j将xml文件转换成project.properties配置文件和Excel表格

此处先就生成此配置文件做一些个人的小结,仅供参考交流学习。

 

正文:

准备阶段:

要想使用dom4j解析xml文件就必须有dom4j的开发环境,由于javaSE中是不含有dom4j的接口的,因此需要手动添加dom4j的jar文件。

考虑受众可能不知道怎样使用Eclipse导入jar文件,这里做一个简要介绍步骤:

1、创建一个工程

2、建立一个jar文件夹用来存放dom4j.jar文件(如图)

dom4j将xml文件转换成project.properties配置文件和Excel表格

3、将dom4j.jar文件直接拖拽进jar文件夹(RT)

dom4j将xml文件转换成project.properties配置文件和Excel表格

4、将此java包添加进入工程,步骤如下。

dom4j将xml文件转换成project.properties配置文件和Excel表格

5、当你看到如下图效果时,恭喜你,你已经可以进行编程了。

dom4j将xml文件转换成project.properties配置文件和Excel表格

 

好了,环境配好了,可以继续往下进行了。

要想使用dom4j来解析xml文件,首先要弄懂两件事(不懂也得知道怎么用的):

1、xml的结构特点

2、dom4j的api

下面逐一分析:

1、xml的机构特点

以上面的xml文件为例,其意义上可以看作是是一个树型结构,总体上是这个样子

dom4j将xml文件转换成project.properties配置文件和Excel表格

 

Root有两个子节点books,每个books又各有两个子节点book,每个book节点下各有一个子节点info。

而type、name、author等,虽然再文件中也要生成,但他们并不是一个节点,而是这些节点的属性,而属性的调用在dom4j中也有相应的方法。

这个结构就暂且说到这,主要是为了讲dom4j的方法好理解一些才涉及的。

 

2、dom4j的API

dom4j的主要接口有:

Attribute

Attribute定义了XML的属性

Branch

Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为,

CDATA

CDATA定义了XML CDATA 区域

CharacterData

CharacterData是一个标识接口,标识基于字符的节点。如CDATA,Comment, Text.

Comment

Comment定义了XML注释的行为

Document

Document定义了XML文档

DocumentType

DocumentType定义XML DOCTYPE声明

Element

Element定义XML 元素

ElementHandler

ElementHandler定义了 Element 对象的处理器

ElementPath

ElementPath被 ElementHandler 使用,用于取得当前正在处理的路径层次信息

Entity

Entity定义 XML entity

Node

Node为所有的dom4j中XML节点定义了多态行为

NodeFilter

NodeFilter 定义了在dom4j节点中产生的一个滤镜或谓词的行为(predicate)

ProcessingInstruction

ProcessingInstruction 定义 XML 处理指令

Text

Text 定义XML 文本节点

Visitor

Visitor 用于实现Visitor模式

XPath

XPath 在分析一个字符串后会提供一个XPath表达式

 

 

实际上,这些接口的命名都是根据他的功能来命名的,看到名字大概也能猜到其作用了吧。

由于dom4j内容很大,而且要完成以上任务根本不需要了解这么多,感兴趣的话可以点击一下连接,里面有dom4j的详细介绍。点击打开链接

 

我们这里就只抽其需要的做一下拼接就能完成任务了。

我们需要的就只有Document接口Element接口和Attribute接口,就这三个就足够了,是不是够简单啊?

 

Document接口:

 

 
  1. SAXReader reader = new SAXReader();

  2. Document document = reader.read(newFile(xmlAddress));

 

 

  • @使用SAXReader创建一个reader对象,通过此对象可以读取xml文件存在Document的对象中
  • @xmlAddress:xml文件的地址,如 "src/demo/books.xml"

 

 

Element接口:

 

Element root=document.getRootElement(); 
  • @通过Document对象的.getRootElement()方法可以获取根节点<root>
  • @此处的root就代表了上面树图中的第一个节点。只有通过他,我们才能往下解析,得到更远节点的属性名和值。

Element接口中有一些很重要的函数是我们必须用到的:

1、root.element(String nodeName)

Element element=root.element("books");

 通过这一步,你就得到了root节点下的第一个标签名为“books”的一个节点元素,如果有多个的话就不能使用这种方法了,所以你可以调用下面的方法

 

2、root.ementnts()

List elemBooksList=root.elements();

 由于elements()的返回值为List<Element>,应该定义一个List数组储存。

 List的使用到基本方法如下

  • elemBooksList.get(int index)        //得到List中第index个元素(index从0开始)
  • elemBooksList.size()             //得到List的大小

 当然,如果你想玩的高端一些,你可以使用下面的迭代器。

 

3、root.elementIterator()

Iterator iterator=root.elementIterator();

通过他得到的是root下所有直接节点的一个迭代器,使用迭代器你就能对这个两个books节点做遍历了。

  • 通过iterator.hasNext();判断是否迭代器中还有元素,如果有就进入迭代,如果没有就跳出
  • 通过iterator.next();取出此迭代器中的接下来的一个元素
  • 要遍历此树中的所有节点就要用到数据结构的线序遍历思想和递归方法,这个在接下来的内容中涉及

4、root.getName()

String elementName=element.getName();

通过getName()方法可以获得当前节点的节点名,如上图文件中的[root,books,book,info]这些值。
 

5、element.getText()

String nodeText=element.getText();

通过getText()方法可以得到当前节点的节点中的内容,如上图文件中的[三国简介,红楼简介。。。]
 

6、element.attribute(String attributeName)

Attribute attribute=book.attribute("name");

通过这个方法,可以得到book节点中,名为“name”的属性元素,当然同上面的1号function,此方法也有同样的问题,当然也有同样的数组方法和迭代方法

 

7、element.attributes()

List attList =elem.attributes();

 同上2号function。

 

8、elemenet.attributeIterator()

Iterator iterator=book.attributeIterator();

通过他得到的是book节点中所有属性的一个迭代器,同意你可以迭代遍历book的几个属性[name,author]


Attribute接口:

Attribute attribute=book.attribute("name");
  • 同Element对象一样,Attribute对象也有getName()和getText()方法,分别得到属性的名字和属性值。

好了,到这差不多都会遍历了把,下面的问题就是怎么把这些值输到project.properties文件中。其实很简单,就是用流输入就可以了。

tip:建议先把想要输出的样式在控制台打印实现。这样不容易乱。

 

我的实现方法就是用一个BufferWriter对象输出的。

 
  1. File toPro=new File("src/demo/project1.properties");

  2. BufferedWriter bw=new BufferedWriter(new FileWriter(toPro));

  3. bw.write("要输出的String"); //...........此处省略若干代码............

  4. bw.newLine(); //换行

  5. bw.close(); //关闭流


下面来看看代码实现吧:

 

 
  1. import java.io.BufferedWriter;

  2. import java.io.File;

  3. import java.io.FileWriter;

  4. import java.io.IOException;

  5. import java.util.Date;

  6. import java.util.Iterator;

  7. import java.util.List;

  8. import org.dom4j.Attribute;

  9. import org.dom4j.Document;

  10. import org.dom4j.DocumentException;

  11. import org.dom4j.Element;

  12. import org.dom4j.io.SAXReader;

  13.  
  14.  
  15.  
  16. public class dom4jTest {

  17. public static void main(String[] args) {

  18. String xmlAddress="src/demo/books.xml";

  19. String toProAddess="src/demo/project.properties";

  20. readXML(xmlAddress,toProAddess);

  21. }

  22.  
  23. static void readXML(String xmlAddress,String toProAddess){

  24. try {

  25. SAXReader reader = new SAXReader();

  26. Document document = reader.read(new File(xmlAddress));

  27.  
  28. File toPro=new File(toProAddess);

  29. BufferedWriter bw = new BufferedWriter(new FileWriter(toPro));

  30.  
  31. Element root =document.getRootElement(); //获取根节点root

  32. String date="【生产时间:"+(new Date()).toString()+"】";

  33. System.out.println(date);

  34. bw.write(date); //写入日期

  35. bw.newLine();

  36. List elemBooksList=root.elements();

  37. for (int i = 0; i < elemBooksList.size(); i++) {

  38. Element elemBooks=(Element) elemBooksList.get(i);

  39. List attBooksList =elemBooks.attributes();

  40. for (int j = 0; j < attBooksList.size(); j++) {

  41. Attribute att=(Attribute)attBooksList.get(j);

  42. // System.out.println("root.books.["+att.getName()+"]="+att.getText());

  43. bw.write("root.books.["+att.getName()+"]="+att.getText());

  44. bw.newLine();

  45. }

  46. List elemBookList=elemBooks.elements();

  47. for (int m = 0; m < elemBookList.size(); m++) {

  48. Element elemBook=(Element) elemBookList.get(m);

  49. List attBookList =elemBook.attributes();

  50. for (int n = 0; n < attBookList.size(); n++) {

  51. Attribute att=(Attribute)attBookList.get(n);

  52. // System.out.println("root.books.book.["+att.getName()+"]="+att.getText());

  53. bw.write("root.books.book.["+att.getName()+"]="+att.getText());

  54. bw.newLine();

  55. }

  56. Element elemBookInfo=(Element) elemBook.element("info");

  57. // System.out.println("root.books.book."+elemBookInfo.getName()+"="+elemBookInfo.getText());

  58. bw.write("root.books.book."+elemBookInfo.getName()+"="+elemBookInfo.getText());

  59. bw.newLine();

  60. }

  61. }

  62. bw.close();

  63. } catch (DocumentException e) {

  64. System.out.println("xml文件读取失败。");

  65. } catch (IOException e) {

  66. System.out.println("IO故障。");

  67. }

  68. }

  69. }