12、使用Jacob来处理文档
Word或Excel程序是以一种COM组件形式存在的。如果能够在Java中调用相应组件,便能使用它的方法来获取文档中的文本信息。Jacob是一个JAVA到微软的COM接口的桥梁。Jacob允许任何JVM访问COM对象,从而使JAVA应用程序能够调用COM对象。如果要对 MS Word、Excel 进行处理,Jacob 是一个好的选择。
12.1、Jacob的下载
Jacob 是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库,并通过JNI的方式实现了在Java平台上对COM程序的调用。Jacob下载的地址为:
http://sourceforge.net/project/showfiles.php?group_id=109543&package_id=118368。
12.2、在Eclipse中的配置
(1) 将jacob.jar导入工程的Build Path,然后确认自己机器的CPU类型(X86或AMD64),并选择不同目录下的jacob.dll文件。
(2) 将jacob.dll放到%JAVA_HOME%\jre\bin目录下,其中,%JAVA_HOME%就是JDK的安装目录。注意这个的jre目录必须是Eclipse当前正在使用的目录,在Eclipse中选择“window->Preferences”菜单,在弹出的对话框中选择“Java->Installed JREs”项。
(3) 当前选择的JRE是“C:\Program Files\Java\jdk1.5.0_07\jre”目录下的,所以需要把jacob.dll复制到“C:\Program Files\Java\jdk1.5.0_07\jre\bin”目录下面。
(4) 在工程中新建一个ch7.jacob包,并在包中创建WordReader类。该类将提供一个静态的extractDoc()方法。它接收两个参数,一个是要处理的DOC文件名,另一个则是输出的文件名,然后通过JNI调用Word的API转换内容,该函数的代码如下。
public static void extractDoc(String inputFIle, String outputFile) { boolean flag = false; // 打开Word应用程序 ActiveXComponent app = new ActiveXComponent("Word.Application"); try { // 设置word不可见 app.setProperty("Visible", new Variant(false)); // 打开word文件 Dispatch doc1 = app.getProperty("Documents").toDispatch(); Dispatch doc2 = Dispatch.invoke( doc1, "Open", Dispatch.Method, new Object[] { inputFIle, new Variant(false), new Variant(true) }, new int[1]).toDispatch(); // 作为txt格式保存到临时文件 Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[] { outputFile, new Variant(7) }, new int[1]); // 关闭word Variant f = new Variant(false); Dispatch.call(doc2, "Close", f); flag = true; } catch (Exception e) { e.printStackTrace(); } finally { app.invoke("Quit", new Variant[] {}); } if (flag == true) { System.out.println("Transformed Successfully"); } else { System.out.println("Transform Failed"); } }
注意:在使用Jacob时,很重要的一点是,用户本地系统中必须安装有Word的应用程序。否则也就无法建立Java-COM桥,进而无法解析了。
12.3、Jacob中常用方法
(1) 初始化com的线程,很重要,否则第二次创建com对象的时候会出现can't co-create object异常,完成操作com组件后要调用release方法。
ComThread.InitSTA();// 初始化com的线程
(2) 初始化word应用程序,新建一个空白文档,取得文档内容对象
//Instantiate objWord //Declare word object
ActiveXComponent objWord = new ActiveXComponent("Word.Application");
//Assign a local word object
Dispatch wordObject = (Dispatch) objWord.getObject();
//Create a Dispatch Parameter to show the document that is opened
Dispatch.put((Dispatch) wordObject, "Visible", new Variant(true));
// new Variant(true)表示word应用程序可见
Tip:设置一个对象的属性的时候,利用Dispatch的put方法,给属性赋值。上面这行语句相当于vb的wordObject.Visible=true语句。
//Instantiate the Documents Property
Dispatch documents = objWord.getProperty("Documents").toDispatch();
//documents表示word的所有文档窗口。
//Add a new word document, Current Active Document
Dispatch document = Dispatch.call(documents, "Add").toDispatch();
// 使用Add命令创建一个新文档,用Open命令可以打开一个现有文档
Tip:调用一个对象的方法的时候,利用Dispatch的call方法,上面的语句相当于vb的document = documents.Add() 语句。
Dispatch wordContent = Dispatch.get(document, "Content").toDispatch();
// 取得word文件的内容
Tip:取得一个对象的成员变量(属性)时,利用Dispatch的get方法,上面的语句相当于vb的wordContent = document.Content语句。
(3) 取得word文档的内容后,可以对其内容进行操作
Dispatch.call(wordContent, "InsertAfter", "这里是一个段落的内容");//插入一个段落
(4) 设置刚插入的段落的文字格式
Dispatch paragraphs = Dispatch.get(wordContent, "Paragraphs").toDispatch();
// 获取所有段落
int paragraphCount = Dispatch.get(paragraphs, "Count").toInt();
// 总的段落数
Dispatch lastParagraph = Dispatch.call(paragraphs, "Item",new Variant(paragraphCount)).toDispatch();
// 最后一段
Dispatch lastParagraphRange = Dispatch.get(lastParagraph, "Range").toDispatch();
Dispatch font = Dispatch.get(lastParagraphRange, "Font").toDispatch();
Dispatch.put(font, "Bold", new Variant(true));
// 设置为黑体
Dispatch.put(font, "Italic", new Variant(true));
// 设置为斜体
Dispatch.put(font, "Name", new Variant("宋体")); //
Dispatch.put(font, "Size", new Variant(12)); //小四
注意:如果想插入一个新的空白行,也需要设置段落的文字格式,否则新插入行的文字格式会于刚插入的段落的格式相同。
(5) 将当前文档保存
Dispatch.call(document, "SaveAs", new Variant("C:abc.doc")); // 保存一个新文档
(6) 释放COM线程
ComThread.Release();//释放com线程。根据Jacob的帮助文档,com的线程回收不由java的垃圾回收器处理。
12.4、Jacob中常用模块
(1) 打印模块
ActiveXComponent axc = null;
try {
ComThread.InitSTA();
axc = new ActiveXComponent("Excel.Application");
Dispatch.put(axc, "Visible", new Variant(false));
Dispatch workbooks = axc.getProperty("Workbooks").toDispatch();
Dispatch workbook = Dispatch.call(workbooks, "Open", fileFullPath,
new Integer(0), Boolean.FALSE).toDispatch();
Dispatch sheets = Dispatch.call(workbook, "Worksheets").toDispatch();
Dispatch sheet = Dispatch.call(sheets, "Item", new Integer(1))
.toDispatch();
Dispatch.call(sheet, "PrintOut", new Integer(beginPage), new Integer(endPage), new Integer(copys));
Dispatch.call(workbook, "Close", Variant.VT_FALSE);
} finally {
axc.invoke("Quit", new Variant[] {});
ComThread.Release();
}
(2) 纸张大小设置
Dispatch pageSetup = Dispatch.call(sheet, "PageSetup").toDispatch();
Dispatch.put(pageSetup, "PaperSize", new Integer(8));//A3是8,A4是9,A5是11等等
可通过如下方式获取纸张大小所对应的整数值
int ps = Dispatch.get(pageSetup, "PaperSize").toInt();
System.out.println("ps=" + ps);
(3)页边距设置
Dispatch.put(pageSetup, "LeftMargin", new Variant(left)); //左
Dispatch.put(pageSetup, "TopMargin", new Variant(top)); //上
Dispatch.put(pageSetup, "RightMargin", new Variant(right)); //右
Dispatch.put(pageSetup, "BottomMargin", new Variant(bottom)); //下
Dispatch.put(pageSetup, "HeaderMargin", new Variant(header)); //页眉
Dispatch.put(pageSetup, "FooterMargin", new Variant(footer)); //页脚
注: left、top、right、bottom、header和footer是double类型的数值,并且如果单位是厘米的话,需乘以28.35。
(4) 统计Excel已使用的行数
Dispatch userRange=Dispatch.call(sheet, "UsedRange").toDispatch();
Dispatch row=Dispatch.call(userRange, "Rows").toDispatch();
int rowCount=Dispatch.get(row,"Count").getInt();
System.out.println("rowCount=" + rowCount);
(5) 在指定的行号上插入一空行
Dispatch rowSheet = Dispatch.call(sheet, "Rows", new Variant(i)).toDispatch();//这里的i是行号,int类型
rowSheet.call(rowSheet, "Insert");
(6) 根据不同版本的Excel做不同的处理
System.out.println("version=" + axc.getProperty("Version"));
12.5、程序实例
(1)实例一:
package com.xfzx.test.POI.main; import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant; public class JacobPress { /**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
printWord("D:/txt.docx");
// printExcel("D:/提醒通知明细通用模板.xlsx");
} public static void printExcel(String filePath) {
/**
* 功能:实现打印工作
*/
ComThread.InitSTA();
ActiveXComponent xl = new ActiveXComponent("Excel.Application");
try {
// System.out.println("version=" + xl.getProperty("Version"));
// 不打开文档
Dispatch.put(xl, "Visible", new Variant(true));
Dispatch workbooks = xl.getProperty("Workbooks").toDispatch();
// 打开文档
Dispatch excel = Dispatch.call(workbooks, "Open", filePath)
.toDispatch();
// 开始打印
Dispatch.call(excel, "PrintOut");
xl.invoke("Quit", new Variant[] {});
} catch (Exception e) {
e.printStackTrace();
} finally {
// 始终释放资源
ComThread.Release();
}
} public static void printWord(String filePath) {
ComThread.InitSTA();
ActiveXComponent wd = new ActiveXComponent("Word.Application");
try {
// 不打开文档
Dispatch.put(wd, "Visible", new Variant(true));
Dispatch document = wd.getProperty("Documents").toDispatch();
// 打开文档
Dispatch doc = Dispatch.invoke(document, "Open", Dispatch.Method,
new Object[] { filePath }, new int[1]).toDispatch();
// 开始打印
Dispatch.callN(doc, "PrintOut");
wd.invoke("Quit", new Variant[] {});
} catch (Exception e) {
e.printStackTrace();
} finally {
// 始终释放资源
ComThread.Release();
}
} // 获得文件后缀名
public static String getPostfix(String inputFilePath) {
String[] p = inputFilePath.split("\\.");
if (p.length > 0) {// 判断文件有无扩展名
// 比较文件扩展名
return p[p.length - 1];
} else {
return null;
}
} }
(2)实例二:
public static boolean printOfficeFile(File f) {
if (f != null && f.exists()) {
String fileNameString = f.getName();
String postfixString = Utils.getPostfix(fileNameString);
if (postfixString.equalsIgnoreCase("xls")
|| postfixString.equalsIgnoreCase("xlsx")) {
/**
* 功能:实现excel打印工作
*/
ComThread.InitSTA();
ActiveXComponent xl = new ActiveXComponent("Excel.Application");
try {
// System.out.println("version=" +
// xl.getProperty("Version"));
// 不打开文档
Dispatch.put(xl, "Visible", new Variant(false));
Dispatch workbooks = xl.getProperty("Workbooks")
.toDispatch();
// 打开文档
Dispatch excel = Dispatch.call(workbooks, "Open",
f.getAbsolutePath()).toDispatch();
// 横向打印(2013/05/24)
// Dispatch currentSheet = Dispatch.get(excel, "ActiveSheet")
// .toDispatch();
// Dispatch pageSetup = Dispatch
// .get(currentSheet, "PageSetup").toDispatch();
// Dispatch.put(pageSetup, "Orientation", new Variant(2));
//每张表都横向打印2013-10-31
Dispatch sheets = Dispatch.get((Dispatch) excel, "Sheets")
.toDispatch();
// 获得几个sheet
int count = Dispatch.get(sheets, "Count").getInt();
// System.out.println(count);
for (int j = 1; j <=count; j++) {
Dispatch sheet = Dispatch.invoke(sheets, "Item",
Dispatch.Get, new Object[] { new Integer(j) },
new int[1]).toDispatch();
Dispatch pageSetup = Dispatch.get(sheet, "PageSetup").toDispatch();
Dispatch.put(pageSetup, "Orientation", new Variant(2));
Dispatch.call(sheet, "PrintOut");
}
// 开始打印
if (excel != null) {
//Dispatch.call(excel, "PrintOut");
//增加以下三行代码解决文件无法删除bug
Dispatch.call(excel, "save");
Dispatch.call(excel, "Close" , new Variant(true));
excel=null;
}
xl.invoke("Quit", new Variant[] {});
xl=null;
return true;
} catch (Exception e) {
e.printStackTrace();
return false;
} finally {
// 始终释放资源
ComThread.Release();
}
} else if (postfixString.equalsIgnoreCase("doc")
|| postfixString.equalsIgnoreCase("docx")) {
ComThread.InitSTA();
ActiveXComponent wd = new ActiveXComponent("Word.Application");
try {
// 不打开文档
Dispatch.put(wd, "Visible", new Variant(false));
Dispatch document = wd.getProperty("Documents")
.toDispatch();
// 打开文档
Dispatch doc = Dispatch.invoke(document, "Open",
Dispatch.Method, new Object[] { f.getAbsolutePath() },
new int[1]).toDispatch();
// 开始打印
if (doc != null) {
Dispatch.call(doc, "PrintOut");
//增加以下三行代码解决文件无法删除bug
Dispatch.call(doc, "save");
Dispatch.call(doc, "Close" , new Variant(true));
doc=null;
}
wd.invoke("Quit", new Variant[] {});
wd=null;
return true;
} catch (Exception e) {
e.printStackTrace();
return false;
} finally {
// 始终释放资源
ComThread.Release();
}
} else {
return false;
}
} else {
return false;
}
}