我有一个Apache NiFi流,在其中读取了一个巨大的.csv
文件。这是一个示例.csv
:
school, date, city
Vanderbilt, xxxx, xxxx
Georgetown, xxxx, xxxx
Duke, xxxx, xxxx
Vanderbilt, xxxx, xxxx
我想使用NiFi读取文件,然后通过.csv
名称输出另一个school
文件。即将有一个.csv
文件,其中包含两个Vanderbilt
记录(总共两行,b / c两记录),一个文件用于Georgetown
,一个文件用于Duke
。
我已经使用GetFile
来绘制我的文件(作品,已验证),然后使用SplitText
(行拆分计数= 1和标题行计数= 1),然后绘制{{1} },但我在其中有一个非常错误的配置。最后,我有ExtractText
,它写了我需要去的地方。谢谢。
答案 0 :(得分:4)
看看NiFi的记录处理功能,您将需要使用PartitionRecord在学校领域进行分区,这将产生您所描述的内容。