如何在不知道原始类型的情况下将缓冲区转换为字符串/数字/日期

时间:2019-03-26 13:38:09

标签: javascript node.js buffer

我正在编写连接到HBase并支持不同GET / POST查询的查询服务。检索到的数据是对象的数组,其中键是列的名称,值是buffer

但是,对象的每一列都不能使用简单的columns[columnName].toString(),因为有些字段可以是字符串,日期或数字。 .toString可以很好地处理字符串/日期,但是数字以如下格式返回:"all": "\u0000\u0000\u0000\u0000\u0000\u0000\u0004\ufffd",

蛮力(我确实意识到这不是我正在测试的漂亮代码)方法是这样的:

function parseEntry(entry) {
    let parsed = {};
    Object.keys(entry.columns).forEach(column => {
        const value = entry.columns[column].value;
        parsed[column] = (typeof value === 'object' && value.length <= 8) ?
            value.readInt32BE(4) :
            value.toString();

    });

    return parsed;
}

但是有时候我会得到长度为< 8的字符串,我会尝试将它们转换为数字,这是不希望的行为。我还尝试使用/[^\u0000-\uffff]+/.test(value)之类的正则表达式测试该值,但由于某种原因,该测试对每个条目都返回false。

我尝试了.toStringJSON.parse.trimreadInt32BE等的所有可能组合,但是没有成功解析这样的对象。是否有一种方法可以正确执行此操作,而无需根据列名使用很多if条件?

修改: 我的响应数组中的条目如下所示(如果它可以帮助您测试事物;出于安全考虑,我剥离了一些字段; all应该是数字,cUSfs应该是日期,fqdn是一个字符串,val是一个IP,它也是一个字符串)。

{ 'd:all': 
      { value: <Buffer 00 00 00 00 00 00 04 8e>,
        timestamp: [Int64 value:1553606385109 octets:00 00 01 69 ba 28 1d d5] },
     'd:cUS': 
      { value: <Buffer 32 30 31 39 2d 30 33 2d 32 36 54 31 32 3a 35 36 3a 30 39 2e 31 37 37 5a>,
        timestamp: [Int64 value:1553604980146 octets:00 00 01 69 ba 12 ad b2] },
     'd:fqdn': 
      { value: <Buffer 61 70 69 2d 67 6c 6f 62 61 6c 2e 6e 65 74 66 6c 69 78 2e 63 6f 6d>,
        timestamp: [Int64 value:1553606699454 octets:00 00 01 69 ba 2c e9 be] },
     'd:fs': 
      { value: <Buffer 32 30 31 39 2d 30 33 2d 32 32 54 31 35 3a 30 30 3a 31 33 2e 35 30 32 5a>,
        timestamp: [Int64 value:9005645987910764 octets:00 1f fe 96 5a 15 14 6c] },
     'd:val': 
      { value: <Buffer 35 32 2e 32 30 39 2e 31 33 30 2e 31 37 32>,
        timestamp: [Int64 value:1553606699454 octets:00 00 01 69 ba 2c e9 be] },
}

1 个答案:

答案 0 :(得分:1)

您可以使用以下命令将字符串转换为数字。 \u0000代表一个字符,因此您只需要使用.来匹配它。然后使用String#charCodeAt可以将其转换为数字。

  

charCodeAt()方法返回0到65535之间的整数,表示给定索引处的UTF-16代码单元。

const res = "\u0000\u0000\u0000\u0000\u0000\u0000\u0004\ufffd"
.match(/./g)
.map(v=>v.charCodeAt());

console.log(res);

但是通常,您将需要条件来检查应使用哪种方法转换缓冲区。

通过将类型(十六进制,二进制,utf8(默认)或ascii)作为参数传递,可以使用Buffer包来完成。