【文件属性】:
文件名称:nodejieba:"结巴"中文分词的Node.js版本
文件大小:4.12MB
文件格式:ZIP
更新时间:2021-04-27 16:18:17
JavaScript
NodeJieba "结巴"分词的Node.js版本
介绍
NodeJieba是"结巴"中文分词的 Node.js 版本实现,
由提供底层分词算法实现,
是兼具高性能和易用性两者的 Node.js 中文分词组件。
特点
词典载入方式灵活,无需配置词典路径也可使用,需要定制自己的词典路径时也可灵活定制。
底层算法实现是C++,性能高效。
支持多种分词算法,各种分词算法见CppJieba的README.md介绍。
支持动态补充词库。
对实现细节感兴趣的请看如下博文:
Node.js的C++扩展初体验之NodeJieba
由NodeJieba谈谈Node.js异步实现
下载
npm install nodejieba
因为npm速度很慢而且经常因为墙的原因出现莫名其妙的问题,可以试试使用cnpm,命令如下:
npm install nodejieba --registry=https://reg
【文件预览】:
nodejieba-master
----.gitignore(121B)
----tsconfig.json(5KB)
----deps()
--------cppjieba()
--------limonp()
----README.md(9KB)
----.github()
--------FUNDING.yml(719B)
----binding.gyp(1KB)
----test()
--------testdata()
--------load_dict_demo.js(509B)
--------load_dict_test.js(360B)
--------test.js(8KB)
--------demo.js(1KB)
----ChangeLog.md(7KB)
----.vscode()
--------launch.json(172B)
----LICENSE(1KB)
----package.json(1KB)
----typescript_demo.ts(872B)
----index.js(1KB)
----types()
--------index.d.ts(902B)
----.npmignore(182B)
----.travis.yml(2KB)
----README_EN.md(7KB)
----lib()
--------nodejieba.cpp(6KB)
--------nodejieba.h(817B)
--------utils.h(1KB)
--------index.cpp(50B)
----dict()
--------idf.utf8(5.72MB)
--------jieba.dict.utf8(4.84MB)
--------hmm_model.utf8(508KB)
--------user.dict.utf8(49B)
--------stop_words.utf8(9KB)