通过某些函数

时间:2016-09-18 06:41:49

标签: r date

我的数据包含一列订单日期。它还有一列交货日期。部分交货日期是在订单日期之前发生的日期(12/31/1990),这导致计算平均运输时间时出现问题。我想获取这些行的订单日期,并从统一分布中添加一个随机天数。

首先,我尝试编写一个可以应用于数据的函数,但结果并不是我想要的。我想要的是模拟交货日期最终在交货日期栏中。

func1 = function(x){
  if(x[2]=="1990-12-31" && !is.na(x[2]))
  x[2] = as.Date(x[1]) + floor(runif(1,min=0,max=30))
return (x)
}

示例数据:

x <- structure(list(orderDate = structure(c(15706, 15706, 15706, 15706, 
15706), class = "Date"), deliveryDate = structure(c(15707, 15707, 
7669, 15707, 7669), class = "Date")), .Names = c("orderDate", 
"deliveryDate"), row.names = c(NA, 5L), class = "data.frame")

#   orderDate deliveryDate
#1 2013-01-01   2013-01-02
#2 2013-01-01   2013-01-02
#3 2013-01-01   1990-12-31
#4 2013-01-01   2013-01-02
#5 2013-01-01   1990-12-31

1 个答案:

答案 0 :(得分:1)

如果我没有弄错,x是一个包含2列的数据框。可以通过if

实现向量化ifelse实施
x[[2]] <- structure(ifelse(x[[2]] == "1990-12-31" & !is.na(x[[2]]),
                           as.Date(x[[1]]) + sample(0:30, 1),
                           x[[2]]),
                    class = "Date")

或更快的替代品:

ind <- x[[2]] == "1990-12-31" & !is.na(x[[2]])
x[ind, 2] <- as.Date(x[ind, 1]) + sample(0:30, sum(ind), replace = TRUE)

使用您的示例数据集和相同的随机种子0,两个选项都会得到相同的结果:

#   orderDate deliveryDate
#1 2013-01-01   2013-01-02
#2 2013-01-01   2013-01-02
#3 2013-01-01   2013-01-28
#4 2013-01-01   2013-01-02
#5 2013-01-01   2013-01-28

在第一种情况下,ifelse单独返回整数(&#34; Date&#34;的内部表示),因此我们需要给出&#34; Date&#34;为了使它成为&#34;日期&#34;。