rowSums但保持NA值

时间:2013-08-12 14:34:14

标签: r xts

我很确定这很简单,但似乎卡住了...我有两个xts向量已合并在一起,其中包含数值和NA。

我想获取每个索引周期的rowSums,但保留NA值。

以下是可重复的示例

set.seed(120)
dd <- xts(rnorm(100),Sys.Date()-c(100:1))
dd1 <- ifelse(dd<(-0.5),dd*-1,NA)
dd2 <- ifelse((dd^2)>0.5,dd,NA)
mm <- merge(dd1,dd2)
mm$m <- rowSums(mm,na.rm=TRUE)
tail(mm,10)

                 dd1        dd2        m
2013-08-02        NA         NA 0.000000
2013-08-03        NA         NA 0.000000
2013-08-04        NA         NA 0.000000
2013-08-05 1.2542692 -1.2542692 0.000000
2013-08-06        NA  1.3325804 1.332580
2013-08-07        NA  0.7726740 0.772674
2013-08-08 0.8158402 -0.8158402 0.000000
2013-08-09        NA  1.2292919 1.229292
2013-08-10        NA         NA 0.000000
2013-08-11        NA  0.9334900 0.933490

在2013年8月10日的上述示例中,我希望它会说NA而不是0,同样适用于2013年8月2日至4日。

有关在相关位置获取NAs的优雅方式的任何建议吗?

4 个答案:

答案 0 :(得分:6)

如果您有可变数量的列,您可以尝试这种方法:

mm <- merge(dd1,dd2)
mm$m <- rowSums(mm, na.rm=TRUE) * ifelse(rowSums(is.na(mm)) == ncol(mm), NA, 1)
# or, as @JoshuaUlrich commented:
#mm$m <- ifelse(apply(is.na(mm),1,all),NA,rowSums(mm,na.rm=TRUE))
tail(mm, 10)
#                  dd1        dd2        m
#2013-08-02        NA         NA       NA
#2013-08-03        NA         NA       NA
#2013-08-04        NA         NA       NA
#2013-08-05 1.2542692 -1.2542692 0.000000
#2013-08-06        NA  1.3325804 1.332580
#2013-08-07        NA  0.7726740 0.772674
#2013-08-08 0.8158402 -0.8158402 0.000000
#2013-08-09        NA  1.2292919 1.229292
#2013-08-10        NA         NA       NA
#2013-08-11        NA  0.9334900 0.933490

答案 1 :(得分:3)

使用[is.na(·)的逻辑索引来本地化两者都为NA的条目,然后将其替换为NA

试试这个:

> mm[is.na(mm$dd1) & is.na(mm$dd2), "m"] <- NA
> mm
                 dd1        dd2        m
2013-08-02        NA         NA       NA
2013-08-03        NA         NA       NA
2013-08-04        NA         NA       NA
2013-08-05 1.2542692 -1.2542692 0.000000
2013-08-06        NA  1.3325804 1.332580
2013-08-07        NA  0.7726740 0.772674
2013-08-08 0.8158402 -0.8158402 0.000000
2013-08-09        NA  1.2292919 1.229292
2013-08-10        NA         NA       NA
2013-08-11        NA  0.9334900 0.933490

答案 2 :(得分:1)

mm$m <- "is.na<-"(rowSums(mm, na.rm = TRUE), !rowSums(!is.na(mm)))

> tail(mm)
#                  dd1        dd2        m
# 2013-08-06        NA  1.3325804 1.332580
# 2013-08-07        NA  0.7726740 0.772674
# 2013-08-08 0.8158402 -0.8158402 0.000000
# 2013-08-09        NA  1.2292919 1.229292
# 2013-08-10        NA         NA       NA
# 2013-08-11        NA  0.9334900 0.933490

答案 3 :(得分:0)

我的解决办法是

library(magrittr)
mm <- mm %>% 
      transform(ccardNA = rowSums(!is.na(.))/rowSums(!is.na(.)), m = rowSums(., na.rm = TRUE)) %>%
      transform(m = ifelse(is.nan(ccardNA), NA, m), ccardNA = NULL) %>%
      as.xts()