假设我有一个巨大的CSV文件,说它包含10000条记录,它有3个字段,如ID,Name和Age,它也有一些重复的记录。在这里,我想根据ID字段删除重复记录,并将所有唯一记录存储在数据库中。 我应该如何使用Anypoint Studio在Mulesoft中实现它?
答案 0 :(得分:2)
您可以使用数据编辑来识别唯一记录。然后插入到DB中。
流程将像File Connector(Reading File) >> Dataweave(identify unique records) >> DB connector(DB insert)
。
请参阅此处了解更多详情。
https://docs.mulesoft.com/mule-user-guide/v/3.8/dataweave-operators#distinct-by
希望这有帮助。
答案 1 :(得分:0)
您可以尝试在dataweave中使用distinct选项,并将输出创建为csv格式文件本身。
检查下面的链接以了解不同的运营商。
https://docs.mulesoft.com/mule-user-guide/v/3.9/dataweave-operators#distinct-by