【文件属性】:
文件名称:productner:对产品进行分类并对产品描述中的单词进行命名实体识别的算法
文件大小:111KB
文件格式:ZIP
更新时间:2021-05-03 14:34:56
Python
产品分类和命名实体识别
该存储库旨在自动从产品标题和描述中提取功能。 下面我们解释如何安装和运行代码以及实现的算法。 我们还提供了背景信息,包括序列分类和序列标记方面的最新技术,并提出了可能对当前实现进行改进的建议。 享受!
要求
需要以下库:
Keras> 2.0( )
Tensorflow> r1.0( )
SKlearn> 0.18( )(仅适用于指标)
用法
正在撷取资料
亚马逊商品数据
cd ./data/
wget http://snap.stanford.edu/data/amazon/productGraph/metadata.json.gz
gzip -d metadata.json.gz
手套
cd ./data/
wget http://nlp.stanford.edu/data/glove.6B.zip
unzip glove.6B.zip
预处理数据
【文件预览】:
productner-master
----ner.py(8KB)
----.gitignore(86B)
----classifier.py(8KB)
----data()
--------normalize.py(834B)
--------parse.py(1KB)
--------trim.py(698B)
--------groups.py(599B)
--------tag.py(1KB)
--------supplement.py(773B)
----Product Dataset.csv(339KB)
----Pipfile.lock(16KB)
----train_classifier.py(1KB)
----train_ner.py(1KB)
----tokenizer.py(2KB)
----train_tokenizer.py(967B)
----README.md(13KB)
----Pipfile(171B)
----extract.py(3KB)