文件名称:matlab的素描代码-projects2019-string-embedding:projects2019字符串嵌入
文件大小:7.4MB
文件格式:ZIP
更新时间:2024-06-12 21:41:26
系统开源
matlab的素描代码projects2019字符串嵌入 该项目实施了快速序列相似性草图绘制,并进行了实验以将其与min-hash和有序的min-hash进行比较。 这是将此方法(上图)与有序最小哈希(下图)进行比较的初步结果: 组织 该代码的总体组织如下: $(HOME)/.config_string_embedding :项目的配置文件,指定PROJECT_DIR 代码:python代码主要用于原型设计,最终所有代码都必须在C ++中本地运行(正在进行中)。 python:*。py文件,用于序列生成,字符串嵌入和简单的KNN搜索 cpp:*。cpp文件,用于进行草图绘制(正在进行中) matlab:* .m包含最新的开发 数据:用于单元测试的样本数据 $(PROJ_DIR) 数据 结果 运行代码的要求 python代码必须由Python 3.6+运行。 所需的软件包为numpy, shutil, annoy, tqdm和flann ,所有这些软件包都可以由flann安装。 对于c ++代码,已使用-std=c++17标准对代码进行了编译和测试。 有cmake可以自动编译cpp文件。
【文件预览】:
projects2019-string-embedding-master
----result.png(285KB)
----code()
--------matlab()
--------cpp()
--------Pipfile.lock(28KB)
--------Pipfile(260B)
--------python()
--------include()
----README.md(2KB)
----data()
--------seqs7.npz(5.79MB)
--------seqs4.npz(38.09MB)
--------seqs8.npz(51.9MB)
--------seqs1.npz(3.17MB)
--------seqs0.npz(55KB)