reddit-nlp:对流行的 subreddits 执行基本的 NLP 以了解热门话题

时间:2021-06-21 08:33:51
【文件属性】:
文件名称:reddit-nlp:对流行的 subreddits 执行基本的 NLP 以了解热门话题
文件大小:19KB
文件格式:ZIP
更新时间:2021-06-21 08:33:51
Python Reddit NLP 包 一个轻量级的 Python 模块,在 Reddit 上执行文本标记化和处理。 它允许您分析用户、标题、评论和 subreddits 以了解他们的词汇。 该模块带有自己的倒排索引构建器,用于存储词汇和词频,这样您就可以生成和操作大型 tf-idf 加权词语料库,而无需担心实现。 如果您长时间运行脚本并希望保存中间结果,这将特别有用。 执照 版权所有 2014 Jai Juneja。 该程序是免费软件:您可以根据*软件基金会发布的 GNU 通用公共许可证(许可证的第 3 版或(由您选择)任何更高版本)的条款重新分发和/或修改它。 分发此程序是希望它有用,但不作任何保证; 甚至没有对适销性或针对特定目的的适用性的暗示保证。 有关更多详细信息,请参阅 GNU 通用公共许可证。 您应该已经收到一份 GNU 通用公共许可证以及该程序。 如果没有,请参阅 。 安装 使
【文件预览】:
reddit-nlp-master
----MANIFEST.in(92B)
----tests.py(0B)
----redditnlp()
--------__init__.py(23KB)
--------words()
----requirements.txt(58B)
----.travis.yml(133B)
----setup.py(2KB)
----README.md(7KB)
----ez_setup.py(10KB)
----.gitignore(81B)
----example.py(4KB)

网友评论