所以,我有一个很大的data.frame,其中有多列,其中“ trial.number”和“ indexer”为2。
dplyr不断使我感到烦恼,无论如何,添加索引器列。 一个简单的例子:
saccade.df %>%
distinct(trial.number, .keep_all = F)
我希望看到唯一的trial.numbers和只有trial.number列。但是,输出看起来像这样:
如何阻止dplyr执行此操作?为什么它不显示唯一的trial.numbers却仅显示唯一的索引器(我什至没有问过)。
example.df <- data.frame(trial.number = rep(1:10, each = 10), time =
seq(1:100), indexer = rep(21:30, each = 10))
example.df %>%
distinct(trial.number, .keep_all = F)
这给出正确的输出。但是,我以某种方式对自己的变量进行了分组。
谢谢!
答案 0 :(得分:3)
尝试ungroup
:
df <- data.frame(trial.number=1:2,indexer=3:4)
df %>% distinct(trial.number)
# trial.number
#1 1
#2 2
df %>% group_by(trial.number,indexer) %>% distinct(trial.number)
## A tibble: 2 x 2
## Groups: trial.number, indexer [2]
# trial.number indexer
# <int> <int>
#1 1 3
#2 2 4
df %>% group_by(trial.number,indexer) %>% ungroup %>% distinct(trial.number)
## A tibble: 2 x 1
# trial.number
# <int>
#1 1
#2 2