我一直在试验Nifi(通过Hortonworks HDF)并且无法掌握看似基本的东西。我从一个文件开始..我想根据一个值过滤记录(例如,字段编号2包含" xyz")...然后只将匹配的记录写入HDFS。
我有一个非过滤流程,但无法找到任何文档或示例,说明如何应用模式(或以任何方式理解文件的内容")。
我错过了什么?
(我已经看到对FlowFiles的引用是"无架构" - 不确定它是如何有用的。)
例如,像这样的文件:
[app1][field1][field2]
[app2][field1][field2]
[app2][field1][field2][field3]
[app3][field1]
我想过滤以选择包含" [app2]"的记录并创建一个如下所示的HDFS文件:
field1,field2
field1,field2,field3