rcppparallel引导程序

时间:2018-07-05 05:12:52

标签: bootstrap-modal rcpp armadillo rcppparallel

我认为,或者说希望,我有一个可解决的单一问题,或者也许有许多较小的问题,应该放弃。无论哪种方式,我对于Rcpp都是相对较新的,并且对并行计算一无所知,并且无法在线找到解决方案。

问题通常是,R或R中的``致命错误''卡在一个循环中,大约10分钟迭代需要5分钟,而非并行版本将在同一时间进行5K迭代。 / p>

由于该算法适合更大的项目,因此我需要调用其他几个函数,这些函数都在Rcpp中,因此我仅用“ arma”对象重写了它们,因为这似乎对其他人有所帮助。我还用我在Rcpp中编写的“热图”优化器运行了优化部分,再次专门在“ arma”中进行了改进,但没有进行改进-我也应该指出这是“ arma :: vec”返回的。

// [[Rcpp::depends("RcppArmadillo")]]
// [[Rcpp::depends("RcppParallel")]]
#include <RcppArmadillo.h>
#include <RcppParallel.h>
using namespace Rcpp;
using namespace std;
using namespace arma;
using namespace RcppParallel;

struct Boot_Worker : public Worker {

  //Generate Inputs
  // Source vector to keep track of the number of bootstraps
  const arma::vec Boot_reps;

  // Initial non-linear theta parameter values
  const arma::vec init_val;

  // Decimal date vector
  const arma::colvec T_series;

  // Generate the price series observational vector
  const arma::colvec Y_est;
  const arma::colvec Y_res;

  // Generate the optimization constants
  const arma::mat U;
  const arma::colvec C;

  const int N;

  // Generate Output Matrix
  arma::mat Boots_out;

  // Initialize with the proper input and output
  Boot_Worker( const arma::vec Boot_reps, const arma::vec init_val, const arma::colvec T_series, const arma::colvec Y_est, const arma::colvec Y_res, const arma::mat U, const arma::colvec C, const int N, arma::mat Boots_out)
    : Boot_reps(Boot_reps), init_val(init_val), T_series(T_series), Y_est(Y_est), Y_res(Y_res), U(U), C(C), N(N), Boots_out(Boots_out) {}

  void operator()(std::size_t begin, std::size_t end){
    //load necessary stuffs from around

    Rcpp::Environment stats("package:stats");
    Rcpp::Function constrOptim = stats["constrOptim"];
    Rcpp::Function SDK_pred_mad( "SDK_pred_mad");

    arma::mat fake_data(N,2);
    arma::colvec index(N);

    for(unsigned int i = begin; i < end; i ++){

      // Need a nested loop to create and fill the fake data matrix

      arma::vec pool = arma::regspace(0, N-1) ;
      std::random_shuffle(pool.begin(), pool.end());
      for(int k = 0; k <= N-1; k++){
        fake_data(k, 0) = Y_est[k] + Y_res[ pool[k] ];
        fake_data(k, 1) = T_series[k];
      }

      // Call the optimization
      Rcpp::List opt_results = constrOptim(Rcpp::_["theta"]    = init_val,
                                           Rcpp::_["f"]     = SDK_pred_mad,
                                           Rcpp::_["data_in"] = fake_data,
                                           Rcpp::_["grad"] = "NULL",
                                           Rcpp::_["method"] = "Nelder-Mead",
                                           Rcpp::_["ui"] = U,
                                           Rcpp::_["ci"] = C );

      /// fill the output matrix ///

      // need to create an place holder arma vector for the parameter output
      arma::vec opt_param = Rcpp::as<arma::vec>(opt_results[0]);
      Boots_out(i, 0) = opt_param[0];
      Boots_out(i, 1) = opt_param[1];
      Boots_out(i, 2) = opt_param[2];
      // for the cost function value at optimization
      arma::vec opt_value = Rcpp::as<arma::vec>(opt_results[1]);
      Boots_out(i, 3) = opt_value[0];
      // for the number of function calls (?)
      arma::vec counts = Rcpp::as<arma::vec>(opt_results[2]);
      Boots_out(i, 4) = counts[0];
      // for thhe convergence code
      arma::vec convergence = Rcpp::as<arma::vec>(opt_results[3]);
      Boots_out(i, 5) = convergence[0];

    }

  }

};

// [[Rcpp::export]]
arma::mat SDK_boots_test(arma::vec init_val, arma::mat data_in, int boots_n){

  //First establish theta_sp, estimate and residuals
  const int N = arma::size(data_in)[0];

  // Create the constraints for the constrained optimization
  // Make a boundry boundry condition matrix of the form Ui*theta - ci >= 0
  arma::mat U(6, 3);

  U(0, 0) = 1;
  U(1, 0) = -1;
  U(2, 0) = 0;
  U(3, 0) = 0;
  U(4, 0) = 0;
  U(5, 0) = 0;

  U(0, 1) = 0;
  U(1, 1) = 0;
  U(2, 1) = 1;
  U(3, 1) = -1;
  U(4, 1) = 0;
  U(5, 1) = 0;

  U(0, 2) = 0;
  U(1, 2) = 0;
  U(2, 2) = 0;
  U(3, 2) = 0;
  U(4, 2) = 1;
  U(5, 2) = -1;

  arma::colvec C(6);
  C[0] = 0;
  C[1] =  -data_in(N-1, 9)-0.5;
  C[2] = 0;
  C[3] = -3;
  C[4] = 0;
  C[5] = -50;

  Rcpp::Function SDK_est( "SDK_est");
  Rcpp::Function SDK_res( "SDK_res");

  arma::vec Y_est = as<arma::vec>(SDK_est(init_val, data_in));
  arma::vec Y_res = as<arma::vec>(SDK_res(init_val, data_in));

  // Generate feed items for the Bootstrap Worker
  arma::vec T_series = data_in( span(0, N-1), 9);

  arma::vec Boots_reps(boots_n+1);

  // Allocate the output matrix
  arma::mat Boots_out(boots_n, 6);

  // Pass input and output the Bootstrap Worker
  Boot_Worker Boot_Worker(Boots_reps, init_val, T_series, Y_est, Y_res, U, C, N, Boots_out);

  // Now finnaly call the parallel for loop
  parallelFor(0, Boots_reps.size(), Boot_Worker);

  return Boots_out;
}

因此,我写回了我的“热算法”来解决优化问题,这完全是在Rcpp-armadillo中进行的,这是因为将约束写入优化器中,从而大大简化了代码。另外,我删除了随机化,因此只需要解决相同的优化即可。只是看看这是否是唯一的问题。毫无疑问,我仍然遇到同样的“致命错误”。

这里是代码:

// [[Rcpp::depends("RcppArmadillo")]]
// [[Rcpp::depends("RcppParallel")]]
#include <RcppArmadillo.h>
#include <RcppParallel.h>
#include <random>
using namespace Rcpp;
using namespace std;
using namespace arma;
using namespace RcppParallel;

struct Boot_Worker : public Worker {

  //Generate Inputs
  // Source vector to keep track of the number of bootstraps
  const arma::vec Boot_reps;

  // Initial non-linear theta parameter values
  const arma::vec init_val;

  // Decimal date vector
  const arma::colvec T_series;

  // Generate the price series observational vector
  const arma::colvec Y_est;
  const arma::colvec Y_res;

  const int N;

  // Generate Output Matrix
  arma::mat Boots_out;

  // Initialize with the proper input and output
  Boot_Worker( const arma::vec Boot_reps, const arma::vec init_val, const arma::colvec T_series, const arma::colvec Y_est, const arma::colvec Y_res, const int N, arma::mat Boots_out)
    : Boot_reps(Boot_reps), init_val(init_val), T_series(T_series), Y_est(Y_est), Y_res(Y_res), N(N), Boots_out(Boots_out) {}

  void operator()(std::size_t begin, std::size_t end){
    //load necessary stuffs from around

    Rcpp::Function SDK_heat( "SDK_heat");

    arma::mat fake_data(N,2);
    arma::colvec index(N);

    for(unsigned int i = begin; i < end; i ++){

      // Need a nested loop to create and fill the fake data matrix

      //arma::vec pool = arma::shuffle( arma::regspace(0, N-1) );

      for(int k = 0; k <= N-1; k++){
        fake_data(k, 0) = Y_est[k] + Y_res[ k ];
        //fake_data(k, 0) = Y_est[k] + Y_res[ pool[k] ];
        fake_data(k, 1) = T_series[k];
      }

      // Call the optimization

      arma::vec opt_results = Rcpp::as<arma::vec>(  SDK_heat(Rcpp::_["data_in"]    = fake_data, Rcpp::_["tol"]     = 0.1) );


      /// fill the output matrix ///

      // need to create an place holder arma vector for the parameter output
      Boots_out(i, 0) = opt_results[0];
      Boots_out(i, 1) = opt_results[1];
      Boots_out(i, 2) = opt_results[2];
      // for the cost function value at optimization
      Boots_out(i, 3) = opt_results[3];

    }

  }

};

// [[Rcpp::export]]
arma::mat SDK_boots_test(arma::vec init_val, arma::mat data_in, int boots_n){

  //First establish theta_sp, estimate and residuals
  const int N = arma::size(data_in)[0];


  Rcpp::Function SDK_est( "SDK_est");
  Rcpp::Function SDK_res( "SDK_res");

  const arma::vec Y_est = as<arma::vec>(SDK_est(init_val, data_in));
  const arma::vec Y_res = as<arma::vec>(SDK_res(init_val, data_in));

  // Generate feed items for the Bootstrap Worker
  const arma::vec T_series = data_in( span(0, N-1), 9);

  arma::vec Boots_reps(boots_n+1);

  // Allocate the output matrix
  arma::mat Boots_out(boots_n, 4);

  // Pass input and output the Bootstrap Worker
  Boot_Worker Boot_Worker(Boots_reps, init_val, T_series, Y_est, Y_res, N, Boots_out);

  // Now finnaly call the parallel for loop
  parallelFor(0, Boots_reps.size(), Boot_Worker);

  return Boots_out;
}

1 个答案:

答案 0 :(得分:2)

查看您的代码,我看到以下内容:

struct Boot_Worker : public Worker {
  [...]      
  void operator()(std::size_t begin, std::size_t end){
    //load necessary stuffs from around

    Rcpp::Environment stats("package:stats");
    Rcpp::Function constrOptim = stats["constrOptim"];
    Rcpp::Function SDK_pred_mad( "SDK_pred_mad");

    [...]

      // Call the optimization
      Rcpp::List opt_results = constrOptim(Rcpp::_["theta"]    = init_val,
                                           Rcpp::_["f"]     = SDK_pred_mad,
                                           Rcpp::_["data_in"] = fake_data,
                                           Rcpp::_["grad"] = "NULL",
                                           Rcpp::_["method"] = "Nelder-Mead",
                                           Rcpp::_["ui"] = U,
                                           Rcpp::_["ci"] = C );

您正在从多线程C ++上下文中调用R函数。那就是你should not do。 R是单线程的,因此将导致不确定的行为或崩溃:

  

API限制

     

在并行工作程序中编写的代码不应以任何方式调用R或Rcpp API。这是因为R是单线程的,并且与其数据结构的并发交互可能导致崩溃和其他未定义的行为。这是Writing R Extensions的官方指南:

     
    

从线程代码中调用任何R API都是“仅供专家使用”:他们将需要阅读源代码以确定它是否是线程安全的。特别是,不得从线程代码中调用使用堆栈检查机制的代码。

  

此外,即使在单线程上下文中从C ++调用R也不是提高性能的最佳方法。使用提供直接C(++)接口的优化库应该更有效。一种可能是nlopt,c.f.的开发版本。 this issue进行讨论并引用示例。此外,std::random_shuffle不仅在C ++ 14中已弃用,并且已从C ++ 17中删除,而且它也是not thread-safe

在第二个示例中,您说函数SDK_heat实际上是用C ++实现的。在这种情况下,您可以直接调用它:

  • 删除导入相应的R函数,即Rcpp::Function SDK_heat( "SDK_heat");
  • 确保编译器知道C ++函数的声明,并且链接器具有实际的函数:
    • 快速又肮脏:将函数定义复制到cpp定义之前的BootWorker文件中。
    • 有关更简洁的方法,请参见Rcpp attributes vignette
    • 中的“ 1.10共享代码”部分
  • 像其他任何C ++函数一样调用函数,即使用具有与函数声明兼容的类型的位置参数。

所有这一切都假定您正在使用sourceCpp,如您使用[[Rcpp::depends(...)]]所示。您将达到一种复杂性,需要从中构建软件包。