我正在解析大量的复杂文件(主要是CSV文件,但有些不是),我需要将它们构造/解析成一些标准格式。这不仅涉及行式清理数据,还涉及一些简单的单个基于单元的逻辑。我想要一个非程序员也可以使用的工具,这样业务团队成员就可以编写简单的拖放逻辑而不占用工程时间。到目前为止,我已经查看了Google Refine和Data wrangler,最后一个看起来很棒。还有其他这样的工具吗?
答案 0 :(得分:2)
ETL工具更多地面向关系数据库,但也支持XML和CSV文件输入/输出。例子:
虽然可能很容易过于复杂。另外,请参阅SO上的类似问题(附加链接):What software is availible for data quality checking。