【文件属性】:
文件名称:amazon_reviews_postgres
文件大小:6KB
文件格式:ZIP
更新时间:2021-03-04 01:38:26
Shell
亚马逊评论通过PostgreSQL提供的数据
设置
注意:仅在使用书评的情况下进行此测试。
从以下位置下载数据集: :
将数据集和元文件放入名为以下目录的./import_job/datasets目录中:
data.json.gz
meta.json.gz
运行start.sh
运行./import_job/run.sh
检查是否成功导入
用户名:postgres
密码:postgres
如何查询数据
在我们的联合学习实验中,我们可以将每个审阅者视为一个分区。 要获取所有分区ID,请运行:
SELECT DISTINCT data_json . values - >> ' reviewerID '
FROM data_json;
要获得单个评论者ID的所有评论,您可以运行
SELECT *
FROM data_json
WHERE data_json . value
【文件预览】:
amazon_reviews_postgres-main
----import_job()
--------Dockerfile(697B)
--------run.sh(588B)
--------.dockerignore(8B)
--------scripts()
----stop.sh(116B)
----docker-compose.yml(382B)
----.gitignore(21B)
----start.sh(123B)
----README.md(1KB)