【文件属性】:
文件名称:node-tarantula:用于 nodejs 的网络爬虫
文件大小:15KB
文件格式:ZIP
更新时间:2021-07-04 07:27:58
JavaScript
节狼蛛
nodejs crawler/spider,它提供了一个简单的接口来爬取网络。 它的 API 受到了启发。
快速示例
var brain = {
legs : 8 ,
shouldVisit : function ( uri ) {
return true ;
}
} ;
var tarantula = new Tarantula ( brain ) ;
tarantula . on ( 'data' , function ( uri ) {
console . info ( '200' , uri ) ;
} ) ;
tarantula . on ( 'done' , function ( ) {
console . log ( 'done' ) ;
} ) ;
tarantula . start ( [ "http:/
【文件预览】:
node-tarantula-master
----example-wikidive-phantom.js(935B)
----.jshintrc(239B)
----.gitignore(12B)
----package.json(989B)
----LICENSE(1KB)
----useragents.json(2KB)
----example-wikidive.js(850B)
----THANKS(230B)
----README.md(848B)
----lib()
--------client()
--------UserAgents.json(2KB)
--------tarantula.js(10KB)
--------ResourcePool.js(2KB)