标签: excel validation large-files
我有两个大的(非常大的)excel电子表格,我需要找到两者之间的差异。它们都是SQL查询的输出,一个是旧代码,另一个是新代码,我需要验证新代码是否仍然返回与旧代码相同的内容。我最感兴趣的是知道新版本中哪一行或哪一行不同,而不是它们如何不同。
电子表格太大,无法处理。我也尝试过github上的na-ka-na的ExcelCompare项目,但我也遇到了内存问题。有没有(免费)工具可以处理这些大表,或者我可以使用哪种技术将它们分解成更易于管理的部分?
答案 0 :(得分:0)
为什么不把它保存在SQL中并编写一些简单的set operations - 例如intersect?
intersect
或者您可以使用R和dplyr包并使用setdiff(dataset1, dataset1)
dplyr
setdiff(dataset1, dataset1)