backend:用于matchID项目的后端(Docker和AP​​I)

时间:2021-04-16 21:49:36
【文件属性】:
文件名称:backend:用于matchID项目的后端(Docker和AP​​I)
文件大小:6.64MB
文件格式:ZIP
更新时间:2021-04-16 21:49:36
elasticsearch machine-learning record-linkage entity-resolution pandas 介绍 该项目旨在为matchID项目提供后端。 完整文档可从。 主要目标是处理一个或多个公民国家数据集,并识别同一个人的多个匹配项(至少两个!)。 后端基本上提供了用配方烹饪数据集的可能性,从而产生了一个新的数据集。 该食谱可以“现场”烹饪或在后台烹饪,从而可以在Elasticsearch的基础上进行实时重新排名(无论是否使用机器学习)。 集成了用于准备姓名,出生位置,模糊匹配和分数的食谱书,并且可以针对您的用例进行完全自定义。 它是全API设计的(没有cli!),基于Flask RESTPlus 。 可扩展性依赖于单一的服务器多用于大熊猫ADN scikit学习Python部分,elasticsearch的云可扩展性大型模糊匹配使用情况。 它旨在提供在1U服务器上一天将两个数据集与数以千万计的记录进行匹配的功能。 全云可扩展性仍需要进一步的开发。 目前,该代码仍被认为仍处于“
【文件预览】:
backend-dev
----conf()
--------connectors()
--------recipes()
--------matchID-validation.yml(3KB)
--------datasets()
--------conf.yml(877B)
--------security()
----.dockerignore(47B)
----.github()
--------workflows()
----log()
--------.gitignore(14B)
----models()
--------.gitignore(14B)
----.travis.yml.old(2KB)
----Dockerfile(2KB)
----tagfiles.version(91B)
----code()
--------config.py(5KB)
--------oauth.py(5KB)
--------log.py(4KB)
--------recipes.py(103KB)
--------tools.py(7KB)
--------security.py(5KB)
--------automata.py(7KB)
--------.gitignore(19B)
--------parsers.py(1KB)
--------api.py(41KB)
----requirements.txt(257B)
----LICENCE(7KB)
----README.md(4KB)
----Makefile(22KB)
----docs()
--------dataprep.md(4KB)
--------api.md(3KB)
--------todo.md(2KB)
--------recipes.md(11KB)
----docker-components()
--------docker-compose-kibana.yml(288B)
--------docker-compose-postgres.yml(348B)
--------docker-compose-postgres-cstore.yml(473B)
--------Dockerfile_elasticsearch_phonetic(435B)
--------docker-compose-elasticsearch.yml(572B)
--------Dockerfile_postgres_cstore(532B)
--------docker-compose-elasticsearch-phonetic.yml(630B)
--------docker-compose-elasticsearch-node.yml(512B)
--------.gitignore(47B)
----docker-compose.yml(1KB)
----docker-compose-dev.yml(211B)
----.gitignore(87B)
----referential_data()
--------french_last_names.csv(218KB)
--------2016_pays_INSEE_norm.csv(20KB)
--------2017_communes_fr_com_code.csv(9.42MB)
--------2017_communes_fr_com_2dep.csv(676KB)
--------2017_communes_fr_com_alg_norm.csv(10.27MB)
--------2016_pays_INSEE_code.csv(20KB)
--------2016_codes_postaux_prep.csv(4.68MB)
--------2017_communes_alg_norm.csv(298KB)
--------2016_codes_postaux_population.csv(455KB)
--------french_first_names.csv(37KB)

网友评论