na.locf将数据从数字转换为字符

时间:2014-03-31 20:11:54

标签: r plyr zoo

    summary(DF)

>fx_code          date               fx_spot              fx_fwd         implied_fx_vol  
 AUD    : 171   Min.   :2000-01-31   Min.   :    0.394   Min.   :-320.000   Min.   : 1.000  
 BRL    : 171   1st Qu.:2003-07-31   1st Qu.:    1.623   1st Qu.:  -2.615   1st Qu.: 7.180  
 CAD    : 171   Median :2007-02-28   Median :    6.117   Median :   6.070   Median : 9.842  
 CHF    : 171   Mean   :2007-02-28   Mean   :  449.477   Mean   :  63.569   Mean   :10.656  
 CLP    : 171   3rd Qu.:2010-09-30   3rd Qu.:   43.475   3rd Qu.:  64.055   3rd Qu.:12.809  
 COP    : 171   Max.   :2014-03-31   Max.   :12360.000   Max.   :1438.800   Max.   :62.810  
 (Other):4275                                            NA's   :310        NA's   :783     

然后我用上一期的值

填写缺失值
    DF2 <- ddply(DF, .(fx_code), na.locf)
    summary(DF2)

>   fx_code              date             fx_spot             fx_fwd          implied_fx_vol    
 Length:5301        Length:5301        Length:5301        Length:5301        Length:5301       
 Class :character   Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character   Mode  :character     

这会将所有内容转换为字符格式。关于如何解决这个问题的任何想法?&gt;提前谢谢

2 个答案:

答案 0 :(得分:5)

1) na.locf适用于动物园对象,矢量和矩阵,而不是data.frames,因此请尝试将其单独应用于每列,然后重新构建data.frame:< / p>

ddply(DF, .(fx_code), function(x) replace(x, TRUE, lapply(x, na.locf))

2)或者:

na.locf.data.frame <- 
  function(object, ...) replace(object, TRUE, lapply(object, na.locf, ...))
ddply(DF, .(a), na.locf)

3)如果DF的日期在fx_code内是唯一的,那么它可以表示为宽动物园对象,但不像动物园对象所基于的那样长在矩阵或向量上,所以它们的列必须都是同一个类。对于显示的数据框,如果日期在fx_code中是唯一的,那么这将有效:

z <- read.zoo(DF, split = 1, index = 2)
na.locf(z)

例如,尝试使用它:

 DF <- data.frame(a = c("a", "a", "b", "b"), b = Sys.Date() + 0:3, c = 1:4)

注意

由于这是写na.locf现在也适用于数据框。

答案 1 :(得分:1)

你也可以使用colwise(na.locf)(df)来避免类转换。