返回NumericVector Rcpp意外行为中的NA值

时间:2015-04-26 15:36:09

标签: r rcpp na

我正在编写一个cpp函数来用下一个非na值替换任何NA值。代码在替换时正常工作,但是我想为那些没有后续非NA值的代码返回NA值。

例如:

fill_backward(c(1, NA, 2)) - > 1,2,2

fill_backward(c(1, NA, 2, NA)) - > 1,2,2,NA

#include <Rcpp.h>
using namespace Rcpp;
//' given NA values fill them with the next non-na value
//' @param x A numeric vector of values
//' @details
//' Works very well in context of dplyr to carry out last-observation-carried-foward
//' for different individuals. It will NOT replace leading NA's
//' @examples /dontrun {
//' fill_forward(c(1.0, NA, 2))
//' fill_forward(c(NA, 1, NA, 2))
//' library(dplyr)
//' df <- data_frame(id = c(1, 1, 2, 2), obs = c(1.2, 4.8, 2.5, NA))
//' df %>% group_by(id) %>% mutate(obs_locf = fill_forward(obs))
//' }
//' @export
// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
  int n = x.size();
  NumericVector out = no_init(n);
  for (int i = 0; i < n; ++i) {
    if (R_IsNA(x[i])) {
      for (int j = i+1; j < n; ++j) {
       if(R_IsNA(x[j])) {
         continue;
       } else {
         out[i] = x[j];
         break;
       } 
       //if never gets to another actual value
       out[i] = NumericVector::get_na();
      }
    } else { //not NA
      out[i] = x[i];
    }
  }
  return out;
}

目前fill_backward(c(NA, 1.0, NA, 2, NA, NA))返回:

[1] 1.000000e+00 1.000000e+00 2.000000e+00 [4] 2.000000e+00 2.156480e-314 -1.060998e-314

而不是1 1 2 2 NA NA

为了返回NA值,它是out[i] = NumericVector::get_na();

我也尝试了out[i] = REAL_NA和[i] = x [i]`,似乎没有任何效果。

最后,我对fill_forward实现使用了相同类型的实现,可以看到here,其中前导NA应该返回为NA - 并且它正确返回NA值,所以我完成了损失。

编辑:感谢@Roland的建议

2 个答案:

答案 0 :(得分:3)

您可以使用out值初始化NA

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
  int n = x.size();
  NumericVector out = NumericVector(n, NumericVector::get_na());
  for (int i = 0; i < n; ++i) {
    if (R_IsNA(x[i])) {
      for (int j = i+1; j < n; ++j) {
       if(R_IsNA(x[j])) {
         continue;
       } else {
         out[i] = x[j];
         break;
       } 
             }
    } else { //not NA
      out[i] = x[i];
    }
  }
  return out;
}

测试它:

fill_backward(c(NA, 1.0, NA, 2, NA, NA))
[1]  1  1  2  2 NA NA

我应该提一下,由于您使用了out[i] = NumericVector::get_na();,我们永远无法联系您continue

答案 1 :(得分:2)

zoo包已经完成了这项工作,并且做得很好而且速度很快:

R> suppressMessages(library(zoo))
R> zoo::na.locf(vec, fromLast=TRUE, na.rm=FALSE)
[1]  1  1  2  2 NA NA
R> 

并且RcppXts包允许您在C ++代码中访问zoo和xts代码,如果您愿意,可以包括na.locf功能via this access point