我有一个如下所示的csv:
first,second,third,num1,num2,num3
12,312,433,0787388393,0783452323,01123124
12,124345,453,07821323,077213424,0123124421
33,2432,214,077213424,07821323,0234234211
我必须根据num1
和num2
中存储的数据创建另一列。列中可以有各种值,但是新列应仅包含2个值,即original
或fake
。 (我应该只比较两个num1 and
num2`中的前3位数字。
对于映射部分,我还有另一个csv,它看起来像这样(我有更多行):
078,078,fake
072,078,original
077,078,original
映射后,我的输出csv应该如下所示:
first,second,third,num1,num2,num3,status
12,312,433,0787388393,0783452323,01123124,fake
12,124345,453,07821323,072213424,0123124421,original
33,2432,214,078213424,07821323,0234234211,fake
希望您可以向我建议一个nifi工作流程来完成以下工作:
答案 0 :(得分:1)
您可以使用LookupRecord
,但是由于特殊的逻辑,您可能必须编写自己的ScriptedLookupService
才能读取映射文件并比较前3位数字。