从RCpp中的NumericVector中删除NA

时间:2014-04-19 17:10:42

标签: r rcpp

我是Rcpp的新手(也是C ++的新手)。我使用示例代码https://gist.github.com/kevinushey/4561281编写了一个代码来计算矩阵的行/列最大值/混合,如下所示:

#include <Rcpp.h>
using namespace Rcpp;

template <class T>
inline double do_max(T& x) {
  return max(x);
}

template <class T>
inline double do_min(T& x) {
  return min(x);
}

NumericVector colMaxsCpp(NumericMatrix& x) {
  int nRows = x.nrow();
  NumericVector out = no_init(nRows);

  for (int i=0; i<nRows;i++) {
    NumericMatrix::Row tmp = x(i,_);
    out[i]=do_max(tmp);
  }

  return out;
}

NumericVector colMinsCpp(NumericMatrix& x) {
  int nRows = x.nrow();
  NumericVector out = no_init(nRows);

  for (int i=0; i<nRows;i++) {
    NumericMatrix::Row tmp = x(i,_);
    out[i]=do_min(tmp);
  }

  return out;
}

NumericVector rowMaxsCpp(NumericMatrix& x) {
  int nCols = x.ncol();
  NumericVector out = no_init(nCols);

  for (int i=0; i<nCols;i++) {
    NumericMatrix::Column tmp = x(_,i);
    out[i]=do_max(tmp);
  }

  return out;
}

NumericVector rowMinsCpp(NumericMatrix& x) {
  int nCols = x.ncol();
  NumericVector out = no_init(nCols);

  for (int i=0; i<nCols;i++) {
    NumericMatrix::Column tmp = x(_,i);
    out[i]=do_min(tmp);
  }

  return out;
}

// [[Rcpp::export]]
NumericVector Max(NumericMatrix x, int dim) {
  if (dim==1) {
    return rowMaxsCpp(x);
  } else if (dim==2) {
    return colMaxsCpp(x);
  }
}

// [[Rcpp::export]]
NumericVector Min(NumericMatrix x, int dim) {
  if (dim==1) {
    return rowMinsCpp(x);
  } else if (dim==2) {
    return colMinsCpp(x);
  }
}

我想修改代码以处理NAdo_min函数中的do_maxdo_mindo_max函数使用类的template

我在网上看到NA_REALNA_INTEGER,但这些是特定于课程的。

(a)是否有NA类的通用template(例如上面的例子中)?

(b)此外,是否有任何可用的函数可以将变量x子集化为仅使用非NA元素,例如相当于max(x[!is.na(x)])中的min(x[!is.na(x)])R

(c)最后,上面的代码已被编写为处理数字matrix,但即使提供了整数matrix,它似乎也能工作(虽然输出转换为{{ 1}})。为什么会这样?

1 个答案:

答案 0 :(得分:3)

快速的:

a)是的,但我不确定它们是否已被矢量化。但是添加了一些模板化的NA特征。

b)是的,例如在

R> cppFunction('double mymax(NumericVector x) { \
                   IntegerVector x2 = wrap(na_omit(x)); \
                   return max(x2);}')
R> mymax(c(1L, 2L, NA, 4L))
[1] 4
R> 

c)整数总是以副本为代价“强制”为“数字”。

@Roland已经暗示na_omit。在b)中,我需要以某种方式帮助wrap()生成中间SEXP对象。