我有以下数据,第一行是标题。空间并不重要。我想找出具有类别ATP Group
的{{1}}和Business Event
以及没有类别EQ
的不同组合。在下面的示例中,EQ
和02/A
组合有02/B
,组合EQ
没有。{/ p>
如果我有一个更大的文件,如何得到这个答案?提前谢谢。
我尝试了什么(ZM/A
)
我知道下面的内容不正确,没有给出理想的结果
dplyr
由于某种原因,我必须转换为data.frame才能正确打印数据
file1_1 <- file1 %>% group_by(ATP.Group,Business.Event) %>% filter(Category != "EQ") %>% distinct(ATP.Group,Business.Event)
下面显示的数据
file1_1 <- as.data.frame(file1_1)
file1_1
答案 0 :(得分:0)
我已经成长为dplyr的粉丝,所以这就是我的一切。我对代码进行了一些小修改。如下所示
代码开始 file1&lt; - read.table(“check jul13 v2.txt的范围”,header = TRUE,sep =“|”,stringsAsFactors = FALSE,strip.white = TRUE)
file1&lt; - select(file1,ATP.Group,Business.Event,Category)
file1_1&lt; - file1%&gt;%group_by(ATP.Group,Business.Event)%&gt;%过滤器(类别==“EQ”)%&gt;%distinct(ATP.Group,Business.Event) file1_1&lt; - as.data.frame(file1_1) file1_1
file1_2&lt; - file1%&gt;%group_by(ATP.Group,Business.Event)%&gt;%distinct(ATP.Group,Business.Event) file1_2&lt; - as.data.frame(file1_2) file1_2
setdiff(选择(file1_2,ATP.Group,Business.Event),选择(file1_1,ATP.Group,Business.Event))
代码结束
这适用于我拥有的数据。如果有更优雅的方式,请告诉我。谢谢,
Satish Vadlamani