nashi:javascript的一些用法以使用PageXML转录扫描的页面

时间:2024-05-17 22:50:23
【文件属性】:

文件名称:nashi:javascript的一些用法以使用PageXML转录扫描的页面

文件大小:145KB

文件格式:ZIP

更新时间:2024-05-17 22:50:23

ocr transcription pagexml HTML

纳西(nasḫī) 一些JavaScript可以使用PageXML转录扫描的页面。 ltr和rtl语言均受支持。 但是,等等,还有更多:现在下载并获得一个用Python / Flask编写的完整Web应用程序,该应用程序可以处理您扫描的页面与导入和导出,以进行半自动布局分析,为您进行行分割(通过 )并保存数据库中您宝贵的PageXML。 您所需要做的就是按照下面的说明进行操作,并帮助我实现所有缺少的功能...由于我们的Web主机功能有限,因此目前不包括OCR培训和认可。 有关nashi.html的说明 将nashi.html放在包含PageXML文件(包含线段数据)和页面图像的文件夹中(或上面的某个文件夹)。 将文件夹放在您选择的Web服务器中,或仅使用file://协议(目前仅在Firefox中受支持)。 在浏览器中,打开界面为... / path / to / nashi.htm


【文件预览】:
nashi-master
----.gitignore(1KB)
----Test.xml(10KB)
----ocr()
--------setup.py(888B)
--------nashi_ocr()
--------MANIFEST.in(20B)
--------LICENSE(34KB)
--------setup.cfg(67B)
--------README.md(124B)
----Test.png(49KB)
----server()
--------setup.py(1KB)
--------MANIFEST.in(69B)
--------LICENSE(34KB)
--------setup.cfg(67B)
--------README.md(12B)
--------nashi()
----nashi.html(31KB)
----LICENSE(34KB)
----README.md(5KB)

网友评论