潭州课堂25班:Ph201805201 爬虫高级 第九课 scrapyd 部署 (课堂笔记)

时间:2021-12-24 00:35:02

c

rapyd是 scrapy 的部署, 是官方提供的一个爬虫管理工具,

通过他可以非常方便的上传控制爬虫的运行,

安装 : pip install scapyd

他提供了一个json ,web, server

在命令行中输入scrapyd 回车,

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

给个本地请求:  curl http://localhost:6800

如果 是*面的 linux ,可以通过端口转发

python安装库的路径

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

vim进到该文件中 默认为127.0.0.1

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

这样就可以访问了,

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

还要安装个客户端, pin install scrapy client

在这个文件中配置服务信息

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

需要配置的就这两个,一个是服务器 ip, 一个是项目名,

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

列出可用的服务器

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

部署项目: scrapyd-deploy <target0> -p <project>--version<version>

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

用最装箱单的方法写推送:scrapyd-deploy -p 项目名

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

调用爬虫: curl http://localhost:6800/schedule.json -d project xxx -d spider=xx

xxx 是项目名,

xx 是爬虫的名字,在项目里的 spider 目录下的 xx.py 文件的名字

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

取消爬虫: curl http://localhost:6800/cancer.json -d project xxx -d job=0000000

其中0000000表示这个爬虫的 jobid

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

列出所有的 job:      curl http://localhost:6800/listjobs.json?project=xxx

其中 xxx 项目名

列出爬虫:      curl http://localhost:6800/listjobs.json?spider=xxx

删除项目: curl http://localhost:6800/delproject.json -d projec=xxxx -d version=

查scrapy 进程id

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课  scrapyd 部署  (课堂笔记)

潭州课堂25班:Ph201805201 爬虫高级 第九课 scrapyd 部署 (课堂笔记)的更多相关文章

  1. 潭州课堂25班:Ph201805201 爬虫高级 第二课 sclapy 框架 &lpar;课堂笔记)

    win 下安装 sclapy 先安装 pip install wheel py 库下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 在这 ...

  2. 潭州课堂25班:Ph201805201 爬虫高级 第一课 pyspider框架 &lpar;课堂笔记)

    利用wheel安装 S1: pip install wheelS2: 进入www.lfd.uci.edu/~gohlke/pythonlibs/,Ctrl + F查找pycurl 这个包名是pycur ...

  3. 潭州课堂25班:Ph201805201 爬虫基础 第九课 图像处理- PIL &lpar;课堂笔记)

    Python图像处理-Pillow 简介 Python传统的图像处理库PIL(Python Imaging Library ),可以说基本上是Python处理图像的标准库,功能强大,使用简单. 但是由 ...

  4. 潭州学院-JavaVIP的Javascript的高级进阶-KeKe老师

    潭州学院-JavaVIP的Javascript的高级进阶-KeKe老师 讲的不错,可以学习 下面是教程的目录截图: 下载地址:http://www.fu83.cn/thread-283-1-1.htm ...

  5. 潭州课堂25班:Ph201805201 WEB 之 页面编写 第四课 登录注册 &lpar;课堂笔记&rpar;

    index.html 首页 <!DOCTYPE html> <html lang="en"> <head> <meta charset=& ...

  6. 潭州课堂25班:Ph201805201 WEB 之 页面编写 第三课 &lpar;课堂笔记&rpar;

    index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...

  7. 潭州课堂25班:Ph201805201 WEB 之 页面编写 第二课 &lpar;课堂笔记&rpar;

    index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...

  8. 潭州课堂25班:Ph201805201 WEB 之 页面编写 第一课 &lpar;课堂笔记&rpar;

    index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...

  9. 潭州课堂25班:Ph201805201 第十课 类的定义,属性和方法 &lpar;课堂笔记&rpar;

    类的定义 共同属性,特征,方法者,可分为一类,并以名命之 class Abc: # class 定义类, 后面接类名 ( 规则 首字母大写 ) cls_name = '这个类的名字是Abc' # 在类 ...

随机推荐

  1. ASP&period;NET MVC 4&plus; T&period;JPager使用

    一.同步Link模式 var pagecount = TCalcPager.CalcPageCount(count, pageSize); var page = new TBuilderLinkPag ...

  2. MySQL安装及主从配置

    系统环境:CentOS release 6.5 (Final)(最小化安装) MySQL版本:mysql-5.6.12 Cmake版本:cmake-2.8.4 说明:安装mysql先安装cmake(原 ...

  3. 刀哥多线程之并发队列gcd-05-dispatch&lowbar;queue&lowbar;concurrent

    并发队列 特点 以先进先出的方式,并发调度队列中的任务执行 如果当前调度的任务是同步执行的,会等待任务执行完成后,再调度后续的任务 如果当前调度的任务是异步执行的,同时底层线程池有可用的线程资源,会再 ...

  4. &lbrack;IO&rsqb; C&num; DirFileHelper文件与文件夹操作类教程与源码下载 &lpar;转载&rpar;

    点击下载 DirFileHelper.zip 主要功能如下所示 // 摘要: // 向文本文件的尾部追加内容 // // 参数: // filePath: // 文件的绝对路径 // // conte ...

  5. MySQL中binlog参数&colon;binlog&lowbar;rows&lowbar;query&lowbar;log&lowbar;events

    在使用RBR也就是行格式的时候,去解析binlog,需要逆向才能分析出对应的原始SQL是什么,而且,里面对应的是每一条具体行变更的内容.当然,你可以开启general log,但如果我们需要的只是记录 ...

  6. 理解defineProperty以及getter、setter

    我们常听说vue是用getter与setter实现数据监控的,那么getter与setter到底是什么东西,它与defineProperty是什么关系,平时有哪些用处呢?本文将为大家一一道来. 对象的 ...

  7. 使用jquery模拟请求,测试项目是否存在跨域限制

    1.Get 请求 <html> <head><script src="https://cdn.staticfile.org/jquery/1.10.2/jque ...

  8. EJB 笔记

    EJB(Enterprise JavaBean)是J2EE服务器端的组件模型,EJB包括会话Bean(Session Bean).实体Bean(Entity Bean).消息驱动Bean(Messag ...

  9. Android adb调试

    1.首先是adb 修改 devices/amlogic/p201_iptv/system.prop service.adb.tcp.port=5555 或者直接在盒子串口下修改 system/buil ...

  10. Linux音频驱动学习之:(2)移植wm8976声卡驱动(linux-3&period;4&period;2)

    1.wm8976驱动程序: /* * wm8976.h -- WM8976 Soc Audio driver * * This program is free software; you can re ...