Question

我有以下数据，第一行是标题。空间并不重要。我想找出具有类别ATP Group的{{1}}和Business Event以及没有类别EQ的不同组合。在下面的示例中，EQ和02/A组合有02/B，组合EQ没有。{/ p>

如果我有一个更大的文件，如何得到这个答案？提前谢谢。

我尝试了什么（ZM/A）

我知道下面的内容不正确，没有给出理想的结果

dplyr

由于某种原因，我必须转换为data.frame才能正确打印数据

file1_1 <- file1  %>% group_by(ATP.Group,Business.Event) %>% filter(Category != "EQ") %>% distinct(ATP.Group,Business.Event)

下面显示的数据

file1_1 <- as.data.frame(file1_1)
file1_1

Answer 1

我已经成长为dplyr的粉丝，所以这就是我的一切。我对代码进行了一些小修改。如下所示

代码开始     file1＆lt; - read.table（“check jul13 v2.txt的范围”，header = TRUE，sep =“|”，stringsAsFactors = FALSE，strip.white = TRUE）

file1＆lt; - select（file1，ATP.Group，Business.Event，Category）

file1_1＆lt; - file1％＆gt;％group_by（ATP.Group，Business.Event）％＆gt;％过滤器（类别==“EQ”）％＆gt;％distinct（ATP.Group，Business.Event） file1_1＆lt; - as.data.frame（file1_1） file1_1

file1_2＆lt; - file1％＆gt;％group_by（ATP.Group，Business.Event）％＆gt;％distinct（ATP.Group，Business.Event） file1_2＆lt; - as.data.frame（file1_2） file1_2

setdiff（选择（file1_2，ATP.Group，Business.Event），选择（file1_1，ATP.Group，Business.Event））

代码结束

这适用于我拥有的数据。如果有更优雅的方式，请告诉我。谢谢，

Satish Vadlamani

如何根据特定条件分组并获取不同行的分组行

1 个答案: