我正在编写一个cpp函数来用下一个非na值替换任何NA值。代码在替换时正常工作,但是我想为那些没有后续非NA值的代码返回NA值。
例如:
fill_backward(c(1, NA, 2))
- > 1,2,2
fill_backward(c(1, NA, 2, NA))
- > 1,2,2,NA
#include <Rcpp.h>
using namespace Rcpp;
//' given NA values fill them with the next non-na value
//' @param x A numeric vector of values
//' @details
//' Works very well in context of dplyr to carry out last-observation-carried-foward
//' for different individuals. It will NOT replace leading NA's
//' @examples /dontrun {
//' fill_forward(c(1.0, NA, 2))
//' fill_forward(c(NA, 1, NA, 2))
//' library(dplyr)
//' df <- data_frame(id = c(1, 1, 2, 2), obs = c(1.2, 4.8, 2.5, NA))
//' df %>% group_by(id) %>% mutate(obs_locf = fill_forward(obs))
//' }
//' @export
// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
int n = x.size();
NumericVector out = no_init(n);
for (int i = 0; i < n; ++i) {
if (R_IsNA(x[i])) {
for (int j = i+1; j < n; ++j) {
if(R_IsNA(x[j])) {
continue;
} else {
out[i] = x[j];
break;
}
//if never gets to another actual value
out[i] = NumericVector::get_na();
}
} else { //not NA
out[i] = x[i];
}
}
return out;
}
目前fill_backward(c(NA, 1.0, NA, 2, NA, NA))
返回:
[1] 1.000000e+00 1.000000e+00 2.000000e+00
[4] 2.000000e+00 2.156480e-314 -1.060998e-314
而不是1 1 2 2 NA NA
为了返回NA值,它是out[i] = NumericVector::get_na();
我也尝试了out[i] = REAL_NA
和[i] = x [i]`,似乎没有任何效果。
最后,我对fill_forward实现使用了相同类型的实现,可以看到here,其中前导NA应该返回为NA
- 并且它正确返回NA值,所以我完成了损失。
编辑:感谢@Roland的建议
答案 0 :(得分:3)
您可以使用out
值初始化NA
:
#include <Rcpp.h>
using namespace Rcpp;
// [[Rcpp::export]]
NumericVector fill_backward(NumericVector x) {
int n = x.size();
NumericVector out = NumericVector(n, NumericVector::get_na());
for (int i = 0; i < n; ++i) {
if (R_IsNA(x[i])) {
for (int j = i+1; j < n; ++j) {
if(R_IsNA(x[j])) {
continue;
} else {
out[i] = x[j];
break;
}
}
} else { //not NA
out[i] = x[i];
}
}
return out;
}
测试它:
fill_backward(c(NA, 1.0, NA, 2, NA, NA))
[1] 1 1 2 2 NA NA
我应该提一下,由于您使用了out[i] = NumericVector::get_na();
,我们永远无法联系您continue
。
答案 1 :(得分:2)
zoo包已经完成了这项工作,并且做得很好而且速度很快:
R> suppressMessages(library(zoo))
R> zoo::na.locf(vec, fromLast=TRUE, na.rm=FALSE)
[1] 1 1 2 2 NA NA
R>
并且RcppXts包允许您在C ++代码中访问zoo和xts代码,如果您愿意,可以包括na.locf
功能via this access point