【文件属性】:
文件名称:node-osmosis:适用于NodeJS的Web抓取工具
文件大小:67KB
文件格式:ZIP
更新时间:2021-04-12 20:31:13
JavaScript
渗透作用
用于NodeJSHTML / XML解析器和Web抓取工具。
特征
使用本机libxml C绑定
干净的承诺式界面
支持CSS 3.0和XPath 1.0选择器混合
,,和
没有像jQuery,cheerio或jsdom这样的大型依赖项
组成深层和复杂的数据结构
HTML解析器功能
快速解析
快速搜寻
内存占用少
HTML DOM功能
加载和搜索ajax内容
DOM交互和事件
执行嵌入式和远程脚本
在DOM中执行代码
HTTP请求功能
记录网址,重定向和错误
Cookie罐和自定义Cookie /标题/用户代理
登录/表单提交,会话cookie和基本身份验证
单个代理或多个代理,并处理代理故障
重试和重定向限制
例子
var osmosis = require ( 'osmosis' ) ;
osmosis
. get ( 'www.craigslist.org/about/si
【文件预览】:
node-osmosis-master
----.gitignore(34B)
----package.json(803B)
----package-lock.json(23KB)
----Changes.md(6KB)
----.travis.yml(44B)
----index.js(12KB)
----jsdoc.json(201B)
----Readme.md(3KB)
----lib()
--------Form.js(5KB)
--------Data.js(7KB)
--------Command.js(13KB)
--------Queue.js(1KB)
--------Request.js(4KB)
--------commands()
----benchmark()
--------server()
--------index.js(2KB)
--------tests()
----.npmignore(13B)
----test()
--------click.js(2KB)
--------filters.js(1KB)
--------proxy.js(2KB)
--------resume.js(1KB)
--------login.js(3KB)
--------set.js(7KB)
--------server()
--------follow.js(4KB)
--------stop.js(820B)
--------save.js(0B)
--------run.js(2KB)
--------submit.js(6KB)
--------do.js(682B)
--------then.js(3KB)
--------user_agent_option.js(1KB)
--------get.js(6KB)
--------process_response_option.js(2KB)
--------internals.js(2KB)
--------config.js(6KB)
--------z_close.js(119B)
--------find.js(2KB)
--------paginate.js(3KB)
--------parse.js(538B)