我在Node.js中使用Iconv将抓取的HTML(通过binary
编码请求)从SHIFT_JIS
转换为UTF-8
:
request({url:url, encoding:'binary'}, function (error, res, html) {
var iconv = new Iconv('SHIFT_JIS', 'UTF-8//TRANSLIT//IGNORE')
var converted = iconv.convert(new Buffer(html,'binary')).toString('utf8')
})
我回来的转换看起来像:
é«SnÌ\r\núêXj[J[ÍAVvÉÈ調ȫ³É\r\nå«ÈCpNgð^
预转换看起来像:���[�J�b�g����X�j�[�J�[
我尝试在请求中使用encoding:null
,但这也不起作用。
答案 0 :(得分:0)
编码实际上如上所述,在处理请求函数之外的最终响应时存在问题。