根据r中的一个日期生成日期列表

时间:2016-07-12 08:54:44

标签: r date add rows

我是R的新手,我发现很难生成一系列行,其中每个生成的行都有一个计算日期。

例如,从这样的数据集开始:

Name  date_birth
Greg  01/02/2015
Fred  02/02/2015

...生成以下内容:

Name date_birth age date_atage<br/>
Greg 01/02/2015   0     01/02/2015
Greg 01/02/2015   1     02/02/2015
Greg 01/02/2015   2     03/02/2015
Fred 02/02/2015   0     02/02/2015
Fred 02/02/2015   1     03/02/2015
Fred 02/02/2015   2     04/02/2015

我一直在研究像R-blogger,一般教学博客和这个网站这样的网站,我一直试图找出一个涉及Seq语句的循环语句,以便对每个人(例如Greg,Fred等)进行处理可以重复计算日期并将其放在各自的行中。你的第一个想法可能是在Excel中这样做更简单,但事实并非如此,因为我需要为超过800个人(即不仅仅是Greg和Fred)以及长达300天的年龄重复此事。

3 个答案:

答案 0 :(得分:3)

我们可以使用data.table

 library(data.table)
 setDT(df1)[, .(date_birth, date_at_age = format(seq(as.Date(date_birth, 
      "%d/%m/%Y"), length.out=3, by = "1 day"), "%d/%m/%Y")) ,
           by = Name][,age := seq_len(.N)-1 , by = Name][]
#   Name date_birth date_at_age age
#1: Greg 01/02/2015  01/02/2015   0
#2: Greg 01/02/2015  02/02/2015   1
#3: Greg 01/02/2015  03/02/2015   2
#4: Fred 02/02/2015  02/02/2015   0
#5: Fred 02/02/2015  03/02/2015   1
#6: Fred 02/02/2015  04/02/2015   2

答案 1 :(得分:0)

这是获取data.table带你的相同位置的一种很长的形式。

看看你如何在R中使用日期。我已采用原始格式并将其转换为日期(代码行2)。有关更多代码,请参阅http://strftime.org/

设置一些虚拟数据:

df = data.frame(name=c("Gregg", "Joan"), DOB=c("01/02/2015", "02/02/2015"), stringsAsFactors=F)

制作日期格式:

df$DOB = as.Date(df$DOB, format="%d/%m/%Y")

遍历每个名​​称,制作301个实例并向DoB添加日期

df = lapply(1:nrow(df), function(i){
   x = data.frame(name=rep(df[i, 1], times=301),
                  DoB=rep(df[i, 2], times=301),
                  age=0:300)
   x$newDate = x$DoB + x$age
   x
})

将列表转换为数据框:

df = do.call("rbind.data.frame", df)

检查输出:

head(df)

答案 2 :(得分:0)

设置

df <- cbind(c("Greg","Fred"),c("01/02/2015","02/02/2015"))
max_age <- 2
start_at <- 0

脚本

new_df <- data.frame(rep(NA,(max_age+1)*dim(df)[1])) 
new_df[,1] <- rep(df[,1],each=max_age-start_at+1) #Names
new_df[,2] <- rep(df[,2],each=max_age-start_at+1) #Birth date
new_df[,3] <- rep(seq(from=start_at,to=max_age),dim(df)[1]) #Age
library(lubridate)
new_df[,4] <- dmy(new_df[,2]) + days(new_df[,3]) #Date at age
colnames(new_df) <- c("names","date_birth","age","date_at_age")