仅在某些情况下添加值

时间:2018-12-21 10:55:25

标签: r dataframe dplyr sample

我有一个数据框:

x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20)
y <- c(2, 2, 2, 0, 0, 0, 0, 0, 2, 2,  2, 2, 2, 2, 2, 2, 2, 2, 2, 2)
df <- data.frame(x, y)

现在我想更改x中的值,但是当y等于2时仅更改x中所有值的10%。例如

set.seed(999)
df[sample(which(df$y == 2), round(0.1 * length(which(df$y == 2)))), ]

     x y
 11 11 2
 14 14 2

在这种情况下,我想添加+1000。结果应类似于:

     x    y
 1   1    2
 2   2    2
 3   3    2
 4   4    0
 5   5    0
 6   6    0
 7   7    0
 8   8    0
 9   9    2
 10 10    2
 11 1011  2
 12 12    2
 13 13    2
 14 1014  2
 15 15    2
 16 16    2
 17 17    2
 18 18    2
 19 19    2
 20 20    2

我能够编辑子样本,但是我不知道如何以整洁的方式将结果添加到数据帧“ df”。感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

使用基数R的一种简单方法可能是

#Get indices when y = 2
inds <- df$y == 2

#set.seed(123)
#Get random indices whose value you need to change
inds_to_change <- sample(which(inds), round(0.1 * sum(inds)))

#Change the value
df$x[inds_to_change] <- df$x[inds_to_change] + 1000

df
#      x y
#1     1 2
#2     2 2
#3     3 2
#4     4 0
#5     5 0
#6     6 0
#7     7 0
#8     8 0
#9     9 2
#10 1010 2
#11   11 2
#12   12 2
#13   13 2
#14   14 2
#15   15 2
#16   16 2
#17 1017 2
#18   18 2
#19   19 2
#20   20 2