想要帮助比较两个csv文件,发现差异并记录在最新csv文件中添加/删除/修改的字段
我尝试了多个软件包,但不会获得更好的结果,与以前相比,手动编码将有助于查找当前文件中添加/删除/修改的字段。我已经在R中尝试过此方法,但是我也愿意接受python的帮助
library(readr)
library(daff)
library(dplyr)
setwd("path")
# Load csvs to compare into data frames
x_original <- read.csv("CN_DD.csv")
x_changed <- read.csv("CN_DD_rev5.csv")
originaldf <- tbl_df(x_original)
changeddf<- tbl_df(x_changed)
#Get shared items
inner_join(originaldf, changeddf)
#to get non shared items
anti_join(originaldf, changeddf)
最终结果应该是另一个生成的csv,其中包含有关添加,删除和修改的字段的信息