在Node JS中从Windows-1255转换为UTF-8

时间:2015-12-08 07:27:12

标签: node.js utf-8 character-encoding windows-1255

我正在使用Node.js从Windows-1255编码的网页中提取文本。我正在尝试使用以下Windows-1255编码器/解码器解码文本: https://www.npmjs.com/package/windows-1255

使用NPM安装并在相关文件中要求后,我尝试使用它:

var title = windows1255.decode('#title').text());

这似乎没有任何效果。关于为什么的任何想法?

谢谢!

帽儿

1 个答案:

答案 0 :(得分:0)

不知道你是否还在等待这个问题的答案,但以下内容对我有用......

在获取数据(文件)时,我将编码的get选项设置为二进制:

var options = {
        method: 'GET',
        url: 'myURL',
        encoding: 'binary' 
    };

    request(options, function (error, response, body) {

        //deal with hebrew encoding
        csvString = encoding.convert(body, 'UTF8', "CP1255").toString();

然后我将CP1255(= windows1255)的编码切换为UTF8

希望有所帮助:)