按时间戳获取Hbase处理器过滤器行

时间:2017-02-27 14:42:21

标签: apache-nifi

我试图在NIFI中使用HBase get处理器,我想在hbase处理器中执行此命令是否可能?

scan 't1', {COLUMNS => 'c1', TIMERANGE => [1303668804, 1303668904]}

enter image description here

2 个答案:

答案 0 :(得分:2)

GetHBase处理器根据时间戳从HBase表中进行增量提取。初始时间范围属性确定最小时间是从0开始还是在当前时间,之后处理器跟踪上一次执行中看到的最大时间并将其用作下次执行中的最小时间。因此,您无法提供自己的时间范围,因为处理器正在为您管理。

答案 1 :(得分:1)

GetHBase处理器始终根据时间戳查找增量更新。基本上它会自动识别新的/更新的数据。

但是如果您仍然想要专门为时间戳读取行,则必须在“过滤器表达式”选项卡中使用以下格式的正则表达式:

TimeStampsFilter(timestamp1,timestamp2 .... timestampn)

您可以在https://www.cloudera.com/documentation/enterprise/5-3-x/topics/admin_hbase_filtering.html

中找到这些过滤器的列表