【文件属性】:
文件名称:TableNet:“ TableNet的非官方实现
文件大小:2.55MB
文件格式:ZIP
更新时间:2021-05-04 21:02:41
JupyterNotebook
表格网
ICDAR 2019论文的非正式实施: TableNet:用于从扫描文档图像进行端到端表检测和表格数据提取的深度学习模型。
概述
论文:TableNet:用于从扫描文档图像进行端到端表检测和表格数据提取的深度学习模型
TableNet是一种现代深度学习体系结构,由TCS Research年度的团队在2019年提出。其主要动机是通过手机或照相机从扫描的表中提取信息。
他们提出了一种解决方案,其中包括准确检测图像中的表格区域并随后从检测到的表格的行和列中检测和提取信息。
体系结构:体系结构基于Long等人的语言,该模型用于语义分割。 相同的编码器/解码器网络用作FCN体系结构以进行表提取。 使用Tesseract OCR对图像进行预处理和修改。
资料来源:
怎么跑
pip install -r requirements.txt
从自述文件中提供的链接下载Marmot数据集。
运
【文件预览】:
TableNet-master
----TableNet.pdf(1.13MB)
----data_preprocess()
--------generate_mask.py(3KB)
----TableNet.ipynb(1.71MB)
----requirements.txt(49B)
----.gitignore(45B)
----README.md(2KB)
----architecture.png(183KB)
----Readme.pdf(48KB)