使用日期序列扩展函数内的数据帧

时间:2013-07-06 00:48:03

标签: r plyr lubridate

我正在尝试获取数据框并将其扩展为函数内的面板数据。

require(lubridate)
require(plyr)

df <- data.frame(group = seq(1, 10))

f <- function(df, sdate, edate) {
  df <- ddply(df, .(group), transform, year = year(seq(ymd(sdate), ymd(edate), by = "year")))
  return(df)
}

f(df, "1945-1-1", "2013-1-1")

这会引发错误:Error in lapply(list(...), .num_to_date) (from #3) : object 'sdate' not found

似乎sdateedate正确传递并且在函数中具有正确的类型。

2 个答案:

答案 0 :(得分:3)

另一种方法是使用do.callcall在“sdate”和“edate”可见的环境中构建调用:

f <- function(df, sdate, edate) {
  df <- do.call("ddply",list(df, "group", transform, 
                       year = call("year",x= seq(ymd(sdate), 
                                          to = ymd(edate), by = "year"))))
  return(df)
}

f(df, "1945-1-1", "2013-1-1")
    group year
1       1 1945
2       1 1946
3       1 1947
4       1 1948
5       1 1949
6       1 1950
7       1 1951
8       1 1952

编辑

plyr式解决方案(Simpler)

您应该使用plyr::here

  

此功能捕获当前上下文,使其更易于使用   **具有进行特殊评估的功能,需要访问调用ddply的环境。

f <- function(df, sdate, edate) {
   ddply(df, .(group), plyr::here(transform), 
                             year = year(seq(ymd(sdate), ymd(edate), by = "year")))
}

答案 1 :(得分:1)

这就是范围界定的问题。 这是一个解决方法:

> f <- function(df, sdate, edate) {
+   df <- ddply(df, .(group), 
+               function(x) data.frame(year = year(seq(ymd(sdate), ymd(edate), by = "year"))))
+   return(df)
+ }
> 
> head(f(df, "1945-1-1", "2013-1-1"))
  group year
1     1 1945
2     1 1946
3     1 1947
4     1 1948
5     1 1949
6     1 1950