我的数据包含一列订单日期。它还有一列交货日期。部分交货日期是在订单日期之前发生的日期(12/31/1990),这导致计算平均运输时间时出现问题。我想获取这些行的订单日期,并从统一分布中添加一个随机天数。
首先,我尝试编写一个可以应用于数据的函数,但结果并不是我想要的。我想要的是模拟交货日期最终在交货日期栏中。
func1 = function(x){
if(x[2]=="1990-12-31" && !is.na(x[2]))
x[2] = as.Date(x[1]) + floor(runif(1,min=0,max=30))
return (x)
}
示例数据:
x <- structure(list(orderDate = structure(c(15706, 15706, 15706, 15706,
15706), class = "Date"), deliveryDate = structure(c(15707, 15707,
7669, 15707, 7669), class = "Date")), .Names = c("orderDate",
"deliveryDate"), row.names = c(NA, 5L), class = "data.frame")
# orderDate deliveryDate
#1 2013-01-01 2013-01-02
#2 2013-01-01 2013-01-02
#3 2013-01-01 1990-12-31
#4 2013-01-01 2013-01-02
#5 2013-01-01 1990-12-31
答案 0 :(得分:1)
如果我没有弄错,x
是一个包含2列的数据框。可以通过if
:
ifelse
实施
x[[2]] <- structure(ifelse(x[[2]] == "1990-12-31" & !is.na(x[[2]]),
as.Date(x[[1]]) + sample(0:30, 1),
x[[2]]),
class = "Date")
或更快的替代品:
ind <- x[[2]] == "1990-12-31" & !is.na(x[[2]])
x[ind, 2] <- as.Date(x[ind, 1]) + sample(0:30, sum(ind), replace = TRUE)
使用您的示例数据集和相同的随机种子0,两个选项都会得到相同的结果:
# orderDate deliveryDate
#1 2013-01-01 2013-01-02
#2 2013-01-01 2013-01-02
#3 2013-01-01 2013-01-28
#4 2013-01-01 2013-01-02
#5 2013-01-01 2013-01-28
在第一种情况下,ifelse
单独返回整数(&#34; Date&#34;的内部表示),因此我们需要给出&#34; Date&#34;为了使它成为&#34;日期&#34;。