文件名称:CUTIE:CUTIE(卷积通用文本信息提取器的TensorFlow实现)
文件大小:3.06MB
文件格式:ZIP
更新时间:2024-06-03 06:36:51
computer-vision deep-learning text-extraction Python
CUTIE TensorFlow implementation of the paper "CUTIE: Learning to Understand Documents with Convolutional Universal Text Information Extractor." Xiaohui Zhao CUTIE 是用于“票据文档” 2D 关键信息提取/命名实体识别/槽位填充 算法。 使用CUTIE前,需先使用OCR算法对“票据文档” 中的文字执行检测和识别,而后将格式化的文本输入入CUTIE网络,具体流程可参照论文。 CUTIE can be considered as one type of 2-Dimensional Key Information Extraction, 2-D NER (Named Entity Recognition) or a 2-Dimension
【文件预览】:
CUTIE-master
----model_cutie_hr.py(12KB)
----export_data.py(8KB)
----helper.py(2KB)
----tokenization.py(12KB)
----model_cutie.py(6KB)
----model_cutie_aspp.py(4KB)
----.pydevproject(302B)
----utils.py(18KB)
----model_cutie2_fpn.py(4KB)
----main_data_tokenizer.py(758B)
----others()
--------example_1.jpg(186KB)
--------TrainingStatistic.xlsx(214KB)
--------example_2.jpg(122KB)
--------chart.jpg(285KB)
----data(14B)
----model_cutie2.py(7KB)
----main_build_dict.py(938B)
----invoice_data()
--------Faktura1.pdf_0.json(39KB)
--------Faktura1.pdf_1.json(40KB)
--------Faktura1.pdf_0.jpg(195KB)
--------Faktura1.pdf_1.jpg(195KB)
----model_cutie_res_bert.py(3KB)
----model_cutie2_aspp.py(5KB)
----.settings()
--------org.eclipse.core.resources.prefs(171B)
----.idea()
--------CUTIE.iml(398B)
--------misc.xml(185B)
--------vcs.xml(180B)
--------modules.xml(262B)
--------workspace.xml(18KB)
----main_evaluate_json.py(7KB)
----.project(359B)
----bert_embedding.py(8KB)
----dict()
--------20000T_index_to_word.npy(197KB)
--------table_dictionary.npy(68KB)
--------SROIE_index_to_word.npy(10KB)
--------20000TC_dictionary.npy(207KB)
--------SROIE_classes.npy(288B)
--------20000TC_classes.npy(192B)
--------SROIEnc_classes.npy(288B)
--------20000T_classes.npy(596B)
--------vocab.txt(972KB)
--------SROIE_dictionary.npy(9KB)
--------SROIE_word_to_index.npy(10KB)
--------table_classes.npy(288B)
--------SROIEnc_dictionary.npy(51KB)
--------SROIEnc_index_to_word.npy(54KB)
--------40000_classes.npy(596B)
--------table_index_to_word.npy(71KB)
--------40000_dictionary.npy(538KB)
--------20000TC_index_to_word.npy(213KB)
--------40000_word_to_index.npy(561KB)
--------20000TC_word_to_index.npy(213KB)
--------20000T_word_to_index.npy(197KB)
--------table_word_to_index.npy(71KB)
--------40000_index_to_word.npy(561KB)
--------20000T_dictionary.npy(187KB)
--------SROIEnc_word_to_index.npy(54KB)
----requirements.txt(622B)
----.gitignore(70B)
----model_cutie2_dilate.py(4KB)
----model_framework.py(21KB)
----README.md(2KB)
----download_data.py(3KB)
----data_loader_json.py(51KB)
----deprecated()
--------model_cutie_res_att_bert.py(3KB)
--------model_cutie_att.py(3KB)
--------model_cutie_dilate.py(2KB)
--------model_cutie_fpn8.py(3KB)
--------model_cutie_res.py(3KB)
--------model_cutie_res_att.py(3KB)
--------model_cutie_res16.py(3KB)
--------model_cutie_sep.py(3KB)
--------model_cutie_unet8.py(3KB)
----main_train_json.py(21KB)