我对Apache NiFi提供的数据来源选项有疑问。
“数据源”页面中提供的搜索选项具有基于EventType,FlowFileId等进行搜索的选项。通常在流文件中包含多个 记录可以在那里,并且在大多数情况下,我们会对基于特定值(例如,作为数据一部分的事件ID)进行搜索感兴趣。
数据来源是否支持这一点?
或者我误会了。
答案 0 :(得分:1)
我不这样认为,通过使用Data provenance search,我们只能在 flowfile attribute
级别上进行搜索,而不能在 flowfile content(data)
上进行搜索。
其他过滤流文件内容的方法:
要在流文件数据级别上进行查询,我们需要使用 QueryRecord
处理器
(或)
我们需要提取流文件数据并将其保留为流文件的属性,然后使用 RouteOnAttribute
..等处理器,我们可以进行过滤仅所需的流文件。
在此方法中,每个流文件只需要包含一个记录。
(或)
使用RouteOnContent (or) RouteText
处理器,请参考this链接。