JAVA实现将PDF转换成word文档

时间:2025-04-27 10:27:40

导入依赖:

Apache PDFBox提供了处理PDF文档的功能。
Apache POI支持处理Word、Excel和.ppt。

<dependencies>
    <!-- Apache PDFBox -->
    <dependency>
        <groupId></groupId>
        <artifactId>pdfbox</artifactId>
        <version>2.0.27</version>
    </dependency>
    
    <!-- Apache POI -->
    <dependency>
        <groupId></groupId>
        <artifactId>poi</artifactId>
        <version>5.0.0</version>
    </dependency>
    <dependency>
        <groupId></groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>5.0.0</version>
    </dependency>
</dependencies>

代码实现:

import .*;
import ;
import ;

import ;
import ;
import ;

public class PdfToWordConverter {

    public static void convertPdfToWord(String pdfFilePath, String docxFilePath) {
        try {
            // 加载PDF文档
            PDDocument document = (new FileInputStream(pdfFilePath));

            // 创建Word文档
            XWPFDocument doc = new XWPFDocument();

            // 提取PDF文本内容
            PDFTextStripper stripper = new PDFTextStripper();
            String text = (document);

            // 创建段落并添加文本内容
            XWPFParagraph paragraph = ();
            XWPFRun run = ();
            (text);

            // 保存Word文档
            FileOutputStream out = new FileOutputStream(docxFilePath);
            (out);
            ();

            // 关闭文档
            ();
            ();

            ("PDF转Word成功!");
        } catch (IOException e) {
            ("PDF转Word失败:" + ());
        }
    }

	// 在main方法中调用convertPdfToWord方法,传入PDF文件的路径和要生成的Word文档的路径
    public static void main(String[] args) {
        String pdfFilePath = "";
        String docxFilePath = "";
        convertPdfToWord(pdfFilePath, docxFilePath);
    }
}