【文件属性】:
文件名称:kb-shrink:缩减知识密集型任务的知识库,一次一对键值对
文件大小:26KB
文件格式:ZIP
更新时间:2021-03-26 05:01:00
Python
知识库收缩
笔记:
观察以KB为单位的密钥分布
减少嵌入向量的大小
截断SVD / PCA,自动编码器,随机投影,裁剪/折叠嵌入
观察性能下降与大小的关系
训练前与训练后减少效果
通过聚类减少知识库的大小。
观察性能与群集数
训练前与训练后减少效果
必须对MIPS进行修改,以使其趋向于平均值-商店群集大小。
用法
pip3 install -r requirementss.txt
mkdir -p data
# download ELI5 dataset
wget -O data/eli5-dev.jsonl http://dl.fbaipublicfiles.com/KILT/eli5-dev-kilt.jsonl
# compute sentence prompt embeddings
python3 src/misc/embedding.py --dataset "data/el
【文件预览】:
kb-shrink-main
----src()
--------reduce_count()
--------reduce_dim()
--------misc()
----requirements.txt(86B)
----meta()
--------cache_artefact.odg(15KB)
----README.md(2KB)
----.gitignore(43B)