标签: python pandas
我正在使用每天使用文件下载的库存数据。该文件每天包含相同的列数,但行将根据列表中的存入和存出而每天更改。我希望比较2个日期的文件,并找到“总量”列之间的差异。我想看看库存进入或退出清单的两个文件之间的区别。
我尝试使用pandas数据框并将其存储在hd5文件中。然后尝试合并数据框的功能,以找到两个文件之间的差异。我正在寻找一种非常优雅的解决方案,以便可以比较数据帧并找到差异,就像我使用excel的index和match(或vlookup)函数一样。
答案 0 :(得分:0)
您应该使用python difflib库来比较文件。
从文档中:
此模块提供用于比较序列的类和函数。例如,它可以用于比较文件,并可以产生各种格式的差异信息,包括HTML和上下文以及统一的差异
另外,请参考this类似问题的答案以获取一些示例。在您的情况下可能有用的一个示例是this one。