【文件属性】:
文件名称:python-pdfbox:Apache PDFBox命令行工具的Python接口
文件大小:105KB
文件格式:ZIP
更新时间:2021-05-16 01:40:34
python pdf python3 pdfbox Python
python-pdfbox
包装说明
为命令行工具提供简单的Python 3界面。
要求
除了Python 3和指定的那些软件包外,python-pdfbox要求java出现在系统路径中。
一些用户报告了某些版本的Java上的。 如果遇到此类问题,请尝试使用OpenJDK的最新版本(14或更高版本)。
安装
该软件包可以按以下方式安装:
pip install python-pdfbox
可以通过PDFBOX环境变量指定PDFBox jar文件的位置。 如果未设置,则python-pdfbox在平台特定的用户缓存目录中查找jar文件,并自动下载3.0.0以下的最新可用版本,如果不存在,则将其缓存。
用法
该界面当前仅公开PDFBox中的几个功能(文本提取,转换为图像,提取图像):
import pdfbox
p = pdfbox.PDFBox()
p.extract_text('/
【文件预览】:
python-pdfbox-master
----.gitignore(46B)
----setup.cfg(14B)
----README.rst(2KB)
----tests()
--------test.md(71B)
--------test.pdf(24KB)
--------test space.pdf(24KB)
--------test_pdfbox.py(2KB)
--------test3.pdf(83KB)
--------test2.pdf(3KB)
----pdfbox()
--------__init__.py(10KB)
----MANIFEST.in(124B)
----setup.py(1KB)
----AUTHORS.rst(479B)
----Makefile(485B)
----LICENSE.rst(617B)