我想有效地估算每个单元格中缺失值稍有不同的值。
例如:
df <- data_frame(x = rnorm(100), y = rnorm(100))
df[1:5,1] <- NA
df[1:5, 2] <- NA
df %<>% mutate_all(funs(ifelse(is.na(.), jitter(median(., na.rm = TRUE)), .)))
但是,这在所有单元格中的插补编号都相同。 如何为每个单元添加不同的噪声? 当然,我可以循环执行此操作,但是我的数据帧很大,我想高效地执行此操作
答案 0 :(得分:0)
我们可以将from random import randrange
def get_random_line(afile, default=None):
"""Return a random line from the file (or default)."""
line = default
for i, aline in enumerate(afile, start=1):
if randrange(i) == 0: # random int [0..i)
line = aline
return line
with open('filename.txt') as f:
print(get_random_line(f))
与O(n)
一起使用
O(1)