【文件属性】:
文件名称:arxiv-fulltext:arXiv纯文本提取
文件大小:16.77MB
文件格式:ZIP
更新时间:2021-05-02 19:59:07
arXiv纯文本提取
此服务从arXiv PDF提取纯文本。 在提交过程中将其用作常规质量保证检查的一部分。 公告后也可以使用它来更新质量保证工具(例如,重叠检测)并使纯文本内容可供授权的API使用者使用。
批量访问arXiv电子打印
请参阅,以获取有关如何批量访问arXiv电子印刷品的说明。
去做
使用工厂功能,而不是仅在模块中实例化Celery。
从Flask应用程序配置Celery应用程序(统一配置)。
。
快速开始
依存关系
我们使用来管理Python依赖项。 您可以像这样安装该项目的所有依赖项:
pipenv install --dev
码头工人
最小的工作服务集群需要API应用程序,工作程序应用程序,Docker主机(例如,垃圾容器)和任务队列/结果后端的Redis。 使所有这些一起运行的最简单方法是在此存储库的根目录中使用docker-compose.yml配置。