GCC提取docx,doc,xls,xlsx,ppt,ppts,pdf,html,eml,rtf,htm,思维导图等文件内容文本

时间:2022-01-21 12:17:56
【文件属性】:
文件名称:GCC提取docx,doc,xls,xlsx,ppt,ppts,pdf,html,eml,rtf,htm,思维导图等文件内容文本
文件大小:14.74MB
文件格式:ZIP
更新时间:2022-01-21 12:17:56
GCC文件搜索 office/pdf文件内容搜 Lucene/CLucene OA文件处理 跨平台 按照压缩包中的使用示例编译即可 支持文件类型: A: pdf文件 B: office word文件 ".doc", ".odt", ".docx", ".dotm", ".docm" C: wps文档 ".wps" D: office excel文件 ".xls", ".xlsx", ".xlsm", ".xltm" E: wps表格 ".et" F: office powerPoint文件 ".ppt", ".pptx", ".potm", ".pptm", ".ppsm" G: wps演示 ".dps" H: 开放文档格式 ".ofd", 注:“电子发票版式文件” I: 富文本类型 ".rtf" J: HTML页面文件 ".html", ".htm", ".mht", ".mhtml" K: 邮件格式文件 ".eml", 注:默认提5个附件 L: 部分思维导图格式文件 ".emmx", "xmind", "gmind" M:UTF8编码, Unicode编码, Ansi编码的文本文件 N: 帮助文件 “*.chm" O: 压缩文件 ".zip", 注:默认提前5个文件
【文件预览】:
test
----graccvs文件正文提取接口.pdf(213KB)
----Adobe Intro.ofd(646KB)
----简可信模板OCR识别工具帮助.docx(399KB)
示例使用说明.txt
graccvs64.dll
graccvsDllTest.c
graccvs32.dll
graccvs.h
.vscode
----launch.json(1KB)
----tasks.json(750B)

网友评论