使用python在两个CSV文件之间进行验证的最简单方法

时间:2016-02-29 12:01:47

标签: python csv

我有两个CSV文件,我想验证(找出差异和相似之处)这两个文件之间的数据。

我正在从vertica检索这些数据,因为数据太大我想在CSV级别进行验证。

2 个答案:

答案 0 :(得分:1)

csvdiff允许您比较两个CSV文件的语义内容,忽略行和列排序等内容,以便获得实际更改的内容。如果您将自动系统的输出从一天比较到下一天,这非常有用,这样您就可以查看更改的内容。

答案 1 :(得分:1)

我不认为您可以使用openpyxl直接比较工作表,而无需在每行上手动循环并使用您自己的验证代码。 这取决于你的目标,如果速度不是一个要求,那么为什么不,但这将需要一些额外的工作。

相反,我会使用 pandas 数据帧来满足任何CSV验证需求,如果你可以添加这种依赖关系,那么在比较文件的同时保持它的性能会非常容易。

以下是完整示例的链接: http://pbpython.com/excel-diff-pandas.html

但是,使用read_csv()而不是read_excel()来读取文件中的数据。