标签: node.js web-crawler
我正在用jsdom和jQuery编写一个蜘蛛,如the example
只有一个问题:当网页不是UTF-8编码且响应头的内容类型没有告诉我字符集时,如何检测响应体的编码?
我知道node-iconv可以提供帮助,但问题是我需要先了解编码
(额外问题:网页浏览器如何自动检测网页的编码?)
答案 0 :(得分:0)
npm install node-ice-charset-detector
https://github.com/mooz/node-icu-charset-detector