我有一个以下格式的数据框。
author year stages
1 A 1150 1
2 B 1200 1
3 C 1200 1
4 D 1300 1
5 D 1300 1
6 E 1390 3
7 F 1392 3
8 G 1400 3
9 G 1400 3
...
我想每年抖动,并少量创作组合。我希望不同作者在同一年的文档被独特的价值所困扰。例如,作者B和C的代币出现在同一年,但应该被不同的数量抖动。来自同一作者的所有代币,例如来自作者G的1400的两个代币应该被抖动相同的数量。
我已尝试过以下操作,但每行都会获得一个独特的抖动量。
data %>% group_by(author) %>% mutate(year = jitter(year, amount=.5))
此代码的输出如下。
author year stages
1 A 1150.400 1
2 B 1200.189 1
3 C 1200.222 1
4 D 1300.263 1
5 D 1299.788 1
6 E 1390.045 3
7 F 1391.964 3
8 G 1399.982 3
9 G 1399.783 3
但是,我想要以下内容,其中来自作者G的两个标记都应该移动相同的数量。关键的区别在于,对于作者G,所有代币都被移动了相同的数量。
author year stages
1 A 1150.400 1
2 B 1200.189 1
3 C 1200.222 1
4 D 1300.263 1
5 D 1299.788 1
6 E 1390.045 3
7 F 1391.964 3
8 G 1399.982 3
9 G 1399.982 3
答案 0 :(得分:4)
计算一个案例的抖动并将差异添加到所有案例中:
dat %>%
group_by(author) %>%
mutate(year = year + (year[1] - jitter(year[1], amount=.5)))
# author year stages
#1 A 1149.720 1
#2 B 1200.385 1
#3 C 1199.888 1
#4 D 1299.589 1
#5 D 1299.589 1
#6 E 1389.866 3
#7 F 1392.225 3
#8 G 1400.147 3
#9 G 1400.147 3