【文件属性】:
文件名称:Node.js抓取中文网页乱码问题和解决方法
文件大小:36KB
文件格式:PDF
更新时间:2021-01-20 07:17:27
js od url
Node.js 抓取非 utf-8 的中文网页时会出现乱码问题,比如网易的首页编码是 gb2312,抓取时会出现乱码
代码如下:
var request = require(‘request’)
var url = ‘http://www.163.com’
request(url, function (err, res, body) {
console.log(body)
})
可以使用 iconv-lite 来解决
安装
代码如下:
npm install iconv-lite
同时我们顺带把 user-agent 修改一下,以防网站屏蔽:
代码如下:
var or