【文件属性】:
文件名称:pdf2htmlEX:在不丢失文本或格式的情况下将PDF转换为HTML
文件大小:9.13MB
文件格式:ZIP
更新时间:2021-02-03 19:28:36
html pdf pdf-viewer pdf-document-processor HTMLHTML
pdf2htmlEX
与上游pdf2htmlEX的区别:
这是我的pdf2htmlEX分支,其目的是允许进行开放式协作以帮助保持项目活跃。 其他分支也进行了许多更改和改进:
修复了许多错误,大部分是边缘情况
集成最新的开罗代码
超出源建设
重写处理模糊/部分模糊的文本-现在更加准确
对透明文本的一些支持
DPI设置的改进-夹紧DPI以确保输出图形不会太大
--correct-text-visibility跟踪每个字符的4个采样点的可见性(当前,字符边界框的4个角,已稍微插入)以确定可见性。 现在有两种模式。 1 =已处理完全遮挡的文本(即未放入HTML层)。 2 =处理了部分遮挡的文本。