summary(DF)
>fx_code date fx_spot fx_fwd implied_fx_vol
AUD : 171 Min. :2000-01-31 Min. : 0.394 Min. :-320.000 Min. : 1.000
BRL : 171 1st Qu.:2003-07-31 1st Qu.: 1.623 1st Qu.: -2.615 1st Qu.: 7.180
CAD : 171 Median :2007-02-28 Median : 6.117 Median : 6.070 Median : 9.842
CHF : 171 Mean :2007-02-28 Mean : 449.477 Mean : 63.569 Mean :10.656
CLP : 171 3rd Qu.:2010-09-30 3rd Qu.: 43.475 3rd Qu.: 64.055 3rd Qu.:12.809
COP : 171 Max. :2014-03-31 Max. :12360.000 Max. :1438.800 Max. :62.810
(Other):4275 NA's :310 NA's :783
然后我用上一期的值
填写缺失值 DF2 <- ddply(DF, .(fx_code), na.locf)
summary(DF2)
> fx_code date fx_spot fx_fwd implied_fx_vol
Length:5301 Length:5301 Length:5301 Length:5301 Length:5301
Class :character Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character Mode :character
这会将所有内容转换为字符格式。关于如何解决这个问题的任何想法?&gt;提前谢谢
答案 0 :(得分:5)
1) na.locf
适用于动物园对象,矢量和矩阵,而不是data.frames,因此请尝试将其单独应用于每列,然后重新构建data.frame:< / p>
ddply(DF, .(fx_code), function(x) replace(x, TRUE, lapply(x, na.locf))
2)或者:
na.locf.data.frame <-
function(object, ...) replace(object, TRUE, lapply(object, na.locf, ...))
ddply(DF, .(a), na.locf)
3)如果DF
的日期在fx_code
内是唯一的,那么它可以表示为宽动物园对象,但不像动物园对象所基于的那样长在矩阵或向量上,所以它们的列必须都是同一个类。对于显示的数据框,如果日期在fx_code
中是唯一的,那么这将有效:
z <- read.zoo(DF, split = 1, index = 2)
na.locf(z)
例如,尝试使用它:
DF <- data.frame(a = c("a", "a", "b", "b"), b = Sys.Date() + 0:3, c = 1:4)
由于这是写na.locf
现在也适用于数据框。
答案 1 :(得分:1)
你也可以使用colwise(na.locf)(df)来避免类转换。