报告R中两个数据帧之间的差异

时间:2017-03-22 15:07:49

标签: r dataframe compare difference

我有两个从csv文件加载的数据框。基本上从不同的环境但类似的格式/列,它们可以在行/值上有差异。我想找到差异并在新的数据框架中创建它们。两个数据帧也将具有相同的顺序。我有100个文件需要比较。提前谢谢。

Dataframe1:df1test

product | country | partner | value
------------------------------------
prdct1  |  china  | part1   | ["563,45"]
prdct2  |  UK     | part4   | ["52,455"]
prdct3  |  USA    | part2   | ["563,45"]
prdct4  |  ITALY  | part6   | ["674,45"]
prdct5  |  UK     | part7   | ["563,578"]

Dataframe2:df1prod

product | country | partner | value
------------------------------------
prdct1  |  china  | part1   | ["563,45"]
prdct2  |  UK     | part4   | ["247,455"]
prdct3  |  USA    | part41  | ["563,45"]
prdct4  |  UK     | part6   | ["0,45"]

我想在第三个数据框中显示差异

Dataframe3:dfDifference

Env:test                             Env:prod    
product| country|partner| value      product| country | partner | value
------------------------------------ -----------------------------------
prdct2 | UK     |part4 | ["52,455"]  prdct2 |UK |part4  | ["247,455"]
prdct3 | USA    |part2 | ["563,45"]  prdct3 |USA|part41 | ["563,45"]
prdct4 | ITALY  |part6 | ["674,45"]  prdct4 |UK |part6  | ["0,45"]
prdct5 | UK     |part7 | ["563,578"] Not Available

我尝试了以下功能和方法,但确实没有锻炼

Compare function
    comptest<-compare(df1test,df1prod,allowAll = TRUE)

Variable combine
    df1test$Varcomp <- apply(df1test,1,paste,collapse=';')
    df1prod$Varcomp <- apply(df1prod,1,paste,collapse=';')
    aabb<-sapply(df1prod$Varcomp,FUN = function(x){x==df1test$Varcomp})

1 个答案:

答案 0 :(得分:0)

执行此操作的一种好方法是setdiff()函数,它将两个数据帧作为参数。

newdata <- setdiff(df1, df2)