【文件属性】:
文件名称:reporec:基于最近邻居和 minhash 的 Github-repository 推荐系统
文件大小:6KB
文件格式:ZIP
更新时间:2021-06-05 02:27:23
Python
注意:这是一个轻微的失修状态,不能保证下面的说明正常工作。
在终端中运行 reporec 的演示
$ python reporec.py
不幸的是,我无法避免对 mongo 的依赖:(
因为完整的数据库太大而无法压缩,并且从 GHTorrent 下载需要很长时间,我将数据样本作为 json 文件包含在内,该文件将在 reporec.py 的主要函数中解析为 python。 但是 minhash 需要 mongo。
要将 n 个最新的 Watchers 数据集下载并加载到 mongo 中,请运行
$ ./download_data n
其中 n 是整数。 每个数据集大约是 2 个月的数据。
您还可以通过运行导出 userToRepos 数据
$ ./export_user_to_repos.sh
【文件预览】:
reporec-master
----.gitignore(529B)
----export_user_to_repos.sh(146B)
----reporec.py(6KB)
----dbutil.py(1KB)
----download_data.sh(1KB)
----README.md(743B)
----minhash.py(2KB)