【文件属性】:
文件名称:metascraper:使用Open Graph,HTML元数据和后备信息从网站上抓取数据
文件大小:5.02MB
文件格式:ZIP
更新时间:2021-04-04 23:23:41
metadata parse scrape HTML
一个库,可以使用Open Graph,JSON + LD,常规HTML元数据和一系列后备功能轻松地从Web上的文章中抓取元数据。
目录
入门
metascraper是一个库,可使用Open Graph元数据,常规HTML元数据和一系列后备功能轻松地从Web上的文章中刮取元数据。
它遵循一些原则:
默认情况下,在线文章的准确性很高。
使添加新规则或覆盖现有规则变得简单。
不要将规则限制为CSS选择器或文本访问器。
安装
$ npm install metascraper --save
用法
让我们从以下文章中提取准确的信息:
然后使用您要申请提取内容的规则捆绑包调用metascraper :
const metascraper = require ( 'metascraper' ) ( [
require ( 'metascraper-author' ) ( ) ,
re