无法将内容从ExecuteScript的流文件拆分为多个流文件

时间:2018-11-07 10:37:13

标签: apache-nifi

我有一个测试流程,可以将日期拆分为多个流程文件。这些日期是从ExecuteScript生成的。

但是不幸的是,在使用SplitContent拆分为多个流文件时,流文件属性保持不变并且没有拆分。

以下是我的流程:

enter image description here

ExecuteScript产生流文件属性all_first_dates如下: enter image description here

我在UpdateAttribute中使用它来将all_first_dates分配给dates属性。 enter image description here

由于我的日期值被分隔为换行符,因此我对splitcontent进行了如下配置:

enter image description here

但是在拆分时,我发现结果仍然与原始结果相同。

enter image description here

1 个答案:

答案 0 :(得分:3)

SplitContent 处理器基于byte sequencenot the flowfile attributes拆分流文件内容

您的情况流量如下所示:

1.GenerateFlowfile
2.ExecuteScript
3.ReplaceText //Always replace as Replacement strategy and 
    Replacement value as ${all_first_dates}
4.SplitContent (or) SplitText //to split each line as individual flowfile
5.ExtractText //add new property dates with value as (.*)
    Now each flowfile will have dates attribute with the value
6.PutFile.

此外,如果要从$ {all_first_dates}中获取某些特定值,请使用UpdateAttribute处理器对属性值使用getDelimitedField函数。