估算中值加抖动

时间:2019-04-14 12:42:02

标签: r sample jitter

我想有效地估算每个单元格中缺失值稍有不同的值。

例如:

df <- data_frame(x = rnorm(100), y = rnorm(100))
df[1:5,1] <- NA
df[1:5, 2] <- NA

df %<>% mutate_all(funs(ifelse(is.na(.), jitter(median(., na.rm = TRUE)), .))) 

但是,这在所有单元格中的插补编号都相同。 如何为每个单元添加不同的噪声? 当然,我可以循环执行此操作,但是我的数据帧很大,我想高效地执行此操作

1 个答案:

答案 0 :(得分:0)

我们可以将from random import randrange def get_random_line(afile, default=None): """Return a random line from the file (or default).""" line = default for i, aline in enumerate(afile, start=1): if randrange(i) == 0: # random int [0..i) line = aline return line with open('filename.txt') as f: print(get_random_line(f)) O(n)一起使用

O(1)