【文件属性】:
文件名称:lstm-crf-pytorch:PyTorch中的LSTM-CRF
文件大小:18KB
文件格式:ZIP
更新时间:2021-05-24 13:05:24
crf pytorch sequence-labeling lstm-crf Python
PyTorch中的LSTM-CRF
用于序列标记的双向LSTM-CRF的最小PyTorch(1.7.1)实现。
支持的功能:
CUDA的小批量培训
嵌入层中的查找,CNN,RNN和/或自我关注
分层递归编码(HRE)
条件随机场(CRF)的PyTorch实现
CRF损失的矢量化计算
矢量化维特比解码
用法
培训数据的格式应如下:
token/tag token/tag token/tag ...
token/tag token/tag token/tag ...
...
有关更多详细信息,请参见每个子目录中的README.md。
准备数据:
python3 prepare.py training_data
训练:
python3 train.py model char_to_idx word_to_idx tag_to_idx training_data.csv (v
【文件预览】:
lstm-crf-pytorch-master
----sentence-segmentation()
--------README.md(1KB)
--------word+iob.py(569B)
----pos-tagging()
--------char+tag+iob.py(590B)
--------README.md(867B)
----train.py(2KB)
----dataloader.py(3KB)
----word-segmentation()
--------char+iob.py(808B)
----prepare.py(2KB)
----parameters.py(1KB)
----utils.py(3KB)
----sentence-classification()
--------block-tokenize.py(699B)
--------README.md(1KB)
----model.py(5KB)
----predict.py(2KB)
----embedding.py(8KB)
----README.md(3KB)
----evaluate.py(2KB)