NER-in-Chinese-Text:NLP硬BiLSTM + CRF

时间:2024-06-04 05:04:49
【文件属性】:

文件名称:NER-in-Chinese-Text:NLP硬BiLSTM + CRF

文件大小:11.09MB

文件格式:ZIP

更新时间:2024-06-04 05:04:49

nlp ner bilstm-crf Python

NER:Keras中的中文命名实体识别 模型1:基于字符嵌入的BiLSTM-CRF。 Model2:在model1的基础上。 使用Conv1D从单词嵌入中提取n_gram特征作为辅助特征。 ps: 首先运行preprocess.py和utils.py,以获取已处理的train / dev / test数据和预训练的char / word嵌入矩阵。 文件“ appendix_···.py”是通过“ BosonNLP”写入的。 参考: 1,通过双向LSTM-CNNs-CRF进行端到端序列标记马学哲,爱德华·霍维(Eduard Hovy) 2.用于序列标记的双向LSTM-CRF模型。 黄志恒,徐伟,于凯。 3用于命名实体识别的神经体系结构Guillaume Lample等。


【文件预览】:
NER-in-Chinese-Text-master
----wiki_100.utf8.txt(14.63MB)
----dicts()
--------dict.txt.big(8.19MB)
--------stop_words.txt(13KB)
----README.md(682B)
----crf_layer.py(25KB)
----predict_bilstm_crf.py(6KB)
----train_bilstm_crf.py(2KB)
----bilstm_crf_add_word.py(6KB)
----utils.py(4KB)
----predict_bilstm_crf_add_word.py(5KB)
----train_bilstm_crf_add_word.py(2KB)
----bilstm_crf.py(2KB)
----preprocess.py(6KB)
----appendix_bosonnlp_location_recognition.py(1KB)
----data()
--------test.txt(1.34MB)
--------dev.txt(686KB)
--------train.txt(5.99MB)

网友评论