Python_pdf2Excel:提取pdf内容写入Excel

时间:2021-04-30 08:45:34
【文件属性】:
文件名称:Python_pdf2Excel:提取pdf内容写入Excel
文件大小:7.71MB
文件格式:ZIP
更新时间:2021-04-30 08:45:34
Python 摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标。 作者:yooongchun 微信公众号: yooongchun小屋 要求: 读取PDF文件找到特定关键字,然后读取其对应的数值提取出来 在Excel中查找对应关键字,然后在对应位置把上面提取出来的内容填进去 基本实现过程: 遍历文件夹,按照特定的要求找出指定类型的PDF文件 解析PDF文件 提取指定内容和对应值 更新数据到Excel 所需工具: 解析PDF文件的模块:pdfminer 操作Excel的模块:xlwt、xlrd、xlutils 注意:要在一个已经存在的Excel中写入数据需要配合xlutils使用,即先copy一个Excel对象,在该对象中进行写入,最后删除原对象而保存copy出来的对象 io
【文件预览】:
Python_pdf2Excel-master
----README.md(25KB)
----README.txt(1KB)
----yooongchun_cabin.jpg(28KB)
----pdf2excel.py(20KB)
----KEYWORDS.txt(961B)
----PDF2Excel.exe(7.81MB)

网友评论