如何从Huge csv文件中删除重复记录并使用Anypoint Studio将其存储到Mulesoft中的数据库中

时间:2016-10-20 12:19:31

标签: java mule mule-studio anypoint-studio

假设我有一个巨大的CSV文件,说它包含10000条记录,它有3个字段,如ID,Name和Age,它也有一些重复的记录。在这里,我想根据ID字段删除重复记录,并将所有唯一记录存储在数据库中。 我应该如何使用Anypoint Studio在Mulesoft中实现它?

2 个答案:

答案 0 :(得分:2)

您可以使用数据编辑来识别唯一记录。然后插入到DB中。

流程将像File Connector(Reading File) >> Dataweave(identify unique records) >> DB connector(DB insert)

请参阅此处了解更多详情。

https://docs.mulesoft.com/mule-user-guide/v/3.8/dataweave-operators#distinct-by

希望这有帮助。

答案 1 :(得分:0)

您可以尝试在dataweave中使用distinct选项,并将输出创建为csv格式文件本身。

检查下面的链接以了解不同的运营商。

https://docs.mulesoft.com/mule-user-guide/v/3.9/dataweave-operators#distinct-by