scrapyforjingdong:京东商品爬虫

时间:2021-07-07 12:34:46
【文件属性】:
文件名称:scrapyforjingdong:京东商品爬虫
文件大小:64KB
文件格式:ZIP
更新时间:2021-07-07 12:34:46
Python scrapy crawl test -s JOBDIR=data -o items.csv 运行爬虫,输出文件items.csv,可以返回上次中断继续运行. watch -n 1 -d 'wc -l items.csv;du -h items.csv' 可以观察文件变化 结果: comment,category,price,product_id,title 9,首页>生鲜>熟食腊味>面食,¥59.00,1174694681.html?sid=2040f2381b2d810c386154968e0, 思念放心油条 早餐点心 油炸速冻食品 油条30根装 450g*3袋 - 40,首页>生鲜>熟食腊味>面食,¥59.00,1036452047.html?sid=2040f2381b2d810c386154968e0, 1212热卖思念食品思念无馅儿香糯小圆子元宵速冻汤圆300gX5 - 2,首页
【文件预览】:
scrapyforjingdong-master
----tutorial()
--------items.pyc(510B)
--------pipelines.py(288B)
--------spiders()
--------__init__.pyc(135B)
--------data()
--------items.py(423B)
--------__init__.py(0B)
--------settings.py(493B)
--------settings.pyc(247B)
--------items.csv(3KB)
----scrapy.cfg(258B)
----.gitignore(12B)
----README.md(3KB)

网友评论