HBase:GET请求带有时间戳的行数据

时间:2016-06-23 07:55:24

标签: hadoop timestamp hbase http-get

我通过Java API创建了一个HBase表,并通过Put添加了数据。我还可以使用相应的Get读取Java中的数据。 HBase文档说明也可以使用GET请求读取单元格值,例如在浏览器中,请参阅documentation

以下请求适用于我,它返回整行:

http://my_hbase_url:12345/dm-table/exampleRow/family:html?v=1

结果是一个xml,看起来如下:

<CellSet>
  <Row key="ZXhhbXBsZVJvdw==">
    <Cell column="ZmFtaWx5Omh0bWw=" timestamp="1466667016879">PGh0bWw+Li4uTXkgSFRNTC4uLjwvaHRtbD4=</Cell>
  </Row>
</CellSet>

如果您查看时间戳1466667016879,但是当我打电话

http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016879

我得到not found结果! Java代码也可以工作并给我这个时间戳:

HTable table = new HTable(config, TABLE_NAME.getBytes());

Get g = new Get("exampleRow".getBytes());
g.setTimeStamp(1466667016879L);

Result r = table.get(g);
System.out.println("Timestamp: " + r.rawCells()[0].getTimestamp());

byte[] value = r.getValue(CF_DEFAULT.getBytes(), "html".getBytes());
String valueStr = new String(value);
System.out.println("GET: " + valueStr);

打印:

Timestamp: 1466667016879
GET: <html>...My HTML...</html>

所以时间戳确实存在,但http GET请求不能用于时间戳,有人可以帮忙吗?

1 个答案:

答案 0 :(得分:1)

URL中的时间戳查找带有EARLIER时间戳的最新数据集!

请看下面的例子:

当您致电时http://my_hbase_url:12345/dm-table/exampleRow/family:html您得到以下结果:

<CellSet>
  <Row key="ZXhhbXBsZVJvdw==">
    <Cell column="ZmFtaWx5Omh0bWw=" timestamp="1466667016879">PGh0bWw+Li4uTXkgSFRNTC4uLjwvaHRtbD4=</Cell>
  </Row>
</CellSet>

因此,如果您希望通过时间戳获取此结果(例如,因为您保存了不同版本的数据),则可以将时间戳添加到URL以获取具有较早时间戳的最新数据集。因此,要获取上面显示的数据集,您必须将/<timestamp + 1>添加到URL:

http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016880

这带来了与上面显示的相同的结果。如果这是唯一或最早的版本,则调用http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016879将无法找到任何结果,并且会以not found结果结束,如上述问题中所述。

但是,您必须使用<timestamp + 1>(或更高版本)来获取预期数据!

感谢@Whitefret提出这个解决方案的提示!