使用RcppArmadillo在矩阵的列上应用函数有效,但在行上应用时返回错误

时间:2019-02-24 13:28:33

标签: c++ rcpp armadillo rcpparmadillo

我在qSelectMbycol中编写了一个函数Rcpp,该函数在O(n)时间返回每列的第k个最大元素。此功能正常。如果我尝试执行相同的操作,但是处理的是行而不是列(函数qSelectMbyrow),它将返回错误"error: Mat::init(): requested size is not compatible with column vector layout"。有人认为我在做什么错吗?我将此文件另存为“ qselect.cpp”:

// [[Rcpp::depends(RcppArmadillo)]]
#define RCPP_ARMADILLO_RETURN_COLVEC_AS_VECTOR
#include <RcppArmadillo.h>
using namespace arma;

// [[Rcpp::export]]
arma::vec qSelectMbycol(arma::mat& M, const int k) {

  // ARGUMENTS
  // M: matrix for which we want to find the k-th largest elements of each column
  // k: k-th statistic to look up

  arma::mat Y(M.memptr(), M.n_rows, M.n_cols);
  // we apply over columns
  int c = M.n_cols;
  arma::vec out(c);
  int i;
  for (i = 0; i < c; i++) {
      arma::vec y = Y.col(i);
      std::nth_element(y.begin(), y.begin() + k - 1, y.end());
      out(i) = y(k-1); // the k-th largest value of each column
  }

  return out;

}

// [[Rcpp::export]]
arma::vec qSelectMbyrow(arma::mat& M, const int k) {

  // ARGUMENTS
  // M: matrix for which we want to find the k-th largest elements of each row
  // k: k-th statistic to look up

  arma::mat Y(M.memptr(), M.n_rows, M.n_cols);
  // we apply over rows
  int r = M.n_rows;
  arma::vec out(r);
  int i;
  for (i = 0; i < r; i++) {
    arma::vec y = Y.row(i); // this line throws the error "error: Mat::init(): requested size is not compatible with column vector layout"
    std::nth_element(y.begin(), y.begin() + k - 1, y.end());
    out(i) = y(k-1); // should give k-th largest value of each row
  }

  return out;

}

示例:

n=500
p=100
set.seed(1)
M=matrix(rnorm(n, mean = 100, sd = 1),n,1)
library(Rcpp)
library(RcppArmadillo)
Rcpp::sourceCpp('qselect.cpp')
qSelectMbycol(M,5) # works OK
qSelectMbyrow(M,5) # throws error "error: Mat::init(): requested size is not compatible with column vector layout"

我也尝试插入

  typedef std::vector<double> stdvec;

并将行设置向量y替换为

arma::vec y = arma::conv_to<stdvec>::from(Y.row(i)); 

在我的qSelectMbyrow函数中,尽管该函数随后运行,但与在列上应用相比,它运行缓慢,并且如果我运行100次,也会使我的R会话崩溃。

1 个答案:

答案 0 :(得分:3)

问题是arma::vec实际上是arma::colvec(请参阅the docs)。因此,我们可以通过更改来解决此问题

arma::vec y = Y.row(i);

(这是不兼容的,因为它认为您想要一个只有一列的矩阵,但您正试图给它一个只有一行的矩阵)

arma::rowvec y = Y.row(i);