节点编码和解码utf-16缓冲区

时间:2016-11-04 08:44:16

标签: javascript node.js

我正在处理需要与C ++ tcp / udp套接字通信的javascript / nodejs应用程序。好像我从旧的C ++客户端获得了一个utf16缓冲区。我现在没有找到解决方案将其转换为可读字符串,而另一个方向似乎是同样的问题。

这两个方向有一个简单的方法吗?

很高兴的问候

2 个答案:

答案 0 :(得分:5)

如果您有UTF-16编码的缓冲区,可以将其转换为UTF-8字符串,如下所示:

let string = buffer.toString('utf16le');

要从流中读取这些内容,最简单的方法是在最后使用convert to string:

let chunks = [];
stream.on('data', chunk => chunks.push(chunk))
      .on('end',  ()    => {
        let buffer = Buffer.concat(chunks);
        let string = buffer.toString('utf16le');
        ...
      });

将JS字符串转换为UTF-16:

let buffer = Buffer.from(string, 'utf16le')

答案 1 :(得分:1)

单一缓冲区

如果您有一个Buffer,则可以使用其toString方法,该方法将使用特定编码将全部或部分二进制内容转换为字符串。如果您没有提供参数,则默认为utf8,但我在此示例中明确设置了编码。

var req = http.request(reqOptions,function(res){     ...

res.on('data', function(chunk) {
    var textChunk = chunk.toString('utf8');
    // process utf8 text chunk
});

});

流式缓冲区

如果您有上述问题中的流式缓冲区,其中多字节UTF8字符的第一个字节可能包含在第一个缓冲区(块)中,第二个字节可能包含在第二个缓冲区中,那么您应该使用StringDecoder。 :

var StringDecoder = require(' string_decoder')。StringDecoder;

var req = http.request(reqOptions,function(res){     ...     var decoder = new StringDecoder(' utf8');

res.on('data', function(chunk) {
    var textChunk = decoder.write(chunk);
    // process utf8 text chunk
});

}); 如果您有一个Buffer,则可以使用其toString方法,该方法将使用特定编码将全部或部分二进制内容转换为字符串。如果您没有提供参数,则默认为utf8,但我在此示例中明确设置了编码。

var req = http.request(reqOptions,function(res){     ...

res.on('data', function(chunk) {
    var textChunk = chunk.toString('utf8');
    // process utf8 text chunk
});

});