我正在使用Node.js从Windows-1255编码的网页中提取文本。我正在尝试使用以下Windows-1255编码器/解码器解码文本: https://www.npmjs.com/package/windows-1255
使用NPM安装并在相关文件中要求后,我尝试使用它:
var title = windows1255.decode('#title').text());
这似乎没有任何效果。关于为什么的任何想法?
谢谢!
帽儿
答案 0 :(得分:0)
不知道你是否还在等待这个问题的答案,但以下内容对我有用......
在获取数据(文件)时,我将编码的get选项设置为二进制:
var options = {
method: 'GET',
url: 'myURL',
encoding: 'binary'
};
request(options, function (error, response, body) {
//deal with hebrew encoding
csvString = encoding.convert(body, 'UTF8', "CP1255").toString();
然后我将CP1255
(= windows1255
)的编码切换为UTF8
。
希望有所帮助:)