用nodejs检测响应体编码

时间:2012-01-11 15:36:24

标签: node.js web-crawler

我正在用jsdom和jQuery编写一个蜘蛛,如the example

只有一个问题:当网页不是UTF-8编码且响应头的内容类型没有告诉我字符集时,如何检测响应体的编码?

我知道node-iconv可以提供帮助,但问题是我需要先了解编码

(额外问题:网页浏览器如何自动检测网页的编码?)

1 个答案:

答案 0 :(得分:0)

npm install node-ice-charset-detector

https://github.com/mooz/node-icu-charset-detector