比较大型Excel电子表格中的数据

时间:2014-10-24 14:32:31

标签: excel validation large-files

我有两个大的(非常大的)excel电子表格,我需要找到两者之间的差异。它们都是SQL查询的输出,一个是旧代码,另一个是新代码,我需要验证新代码是否仍然返回与旧代码相同的内容。我最感兴趣的是知道新版本中哪一行或哪一行不同,而不是它们如何不同。

电子表格太大,无法处理。我也尝试过github上的na-ka-na的ExcelCompare项目,但我也遇到了内存问题。有没有(免费)工具可以处理这些大表,或者我可以使用哪种技术将它们分解成更易于管理的部分?

1 个答案:

答案 0 :(得分:0)

为什么不把它保存在SQL中并编写一些简单的set operations - 例如intersect

或者您可以使用Rdplyr包并使用setdiff(dataset1, dataset1)