根据特定条件删除参与者

时间:2019-01-02 11:20:56

标签: r filtering subset data-manipulation

我有许多参与者和他们选择的实验。 为简单起见,我们假设以下内容:

part<-c(1,1,1,2,2,2,3,3,3)
choice<-c(6,2,9,2,3,18,3,6,8)
study<-cbind(part,choice)

       part choice
 [1,]    1      6
 [2,]    1      2
 [3,]    1      9
 [4,]    2      2
 [5,]    2      3
 [6,]    2     18
 [7,]    3      3
 [8,]    3      6
 [9,]    3      8

现在,我想完全删除某些参与者。例如,那些在10以上做出至少一项选择的人。因此,在上面的示例中,由于参与者2在10以上做出了一项选择,因此我将其完全删除:最终数据应为:

      part choice
[1,]    1      6
[2,]    1      2
[3,]    1      9
[4,]    3      3
[5,]    3      6
[6,]    3      8

我该怎么办?

谢谢!

3 个答案:

答案 0 :(得分:4)

library(dplyr)
 study %>% 
   group_by(part) %>% 
   filter(max(choice)<10)
# A tibble: 6 x 2
# Groups:   part [2]
   part choice
  <dbl>  <dbl>
1     1      6
2     1      2
3     1      9
4     3      3
5     3      6
6     3      8

答案 1 :(得分:1)

removed = which(study[ , 2]>10);
study = study[!(study[ , 1] %in% study[removed, 1]), ];

study
     part choice
[1,]    1      6
[2,]    1      2
[3,]    1      9
[4,]    3      3
[5,]    3      6
[6,]    3      8

使用此代码,您甚至不需要安装任何软件包。

答案 2 :(得分:1)

使用R base,无需加载软件包。该示例使用变量名称代替位置,以更好地了解解决方案。

# Create object to be used in dataframe.
part   <- c(1,1,1,2,2,2,3,3,3)
choice <- c(6,2,9,2,3,18,3,6,8)
# Create dataframe.
study  <- data.frame(part, choice)

# Find rows in column [study$choice]
find_rows <- which(study$choice > 10)
# Find participant that matches [find_rows]
participant_to_be_deleted <- study[find_rows,1]

# Remove all rows that has found participant in [study$part].
result <- study[study$part!=participant_to_be_deleted,]