Python-BounterPython高性能大规模数据集词频计数

时间:2022-08-29 23:34:14
【文件属性】:
文件名称:Python-BounterPython高性能大规模数据集词频计数
文件大小:189KB
文件格式:ZIP
更新时间:2022-08-29 23:34:14
Python开发-自然语言处理 Bounter:Python高性能大规模数据集(词频)计数
【文件预览】:
RaRe-Technologies-bounter-dd21639
----MANIFEST.in(131B)
----README.rst(12KB)
----cbounter()
--------hll.c(4KB)
--------cms_log1024.c(2KB)
--------hll.h(2KB)
--------ht_common.c(30KB)
--------cms_log8.c(2KB)
--------cms_cmodule.c(2KB)
--------ht_basic.c(357B)
--------cms_common.c(15KB)
--------cms_conservative.c(715B)
--------ht_cmodule.c(2KB)
--------murmur3.c(8KB)
--------murmur3.h(1KB)
----bounter()
--------bounter.py(2KB)
--------__init__.py(381B)
--------count_min_sketch.py(9KB)
--------tests()
----ISSUE_TEMPLATE.md(1KB)
----upload.sh(103B)
----requirements.txt(1B)
----CONTRIBUTING.md(225B)
----.travis.yml(155B)
----LICENSE(1KB)
----setup.py(2KB)
----README.md(10KB)
----docs()
--------bounter_unigrams_wiki.png(62KB)
--------count_min_sketch.ipynb(11KB)
--------experiments.md(6KB)
--------bounter_bigrams_wiki.png(64KB)
----.gitignore(1KB)
----CHANGELOG.md(2KB)

网友评论