如何在Cilk Plus中组织非线程安全资源池(每个工作者一个资源)?

时间:2015-07-19 12:12:58

标签: c++ multithreading parallel-processing cilk cilk-plus

我有一个我希望使用Cilk Plus并行化的串行代码;主循环在不同的数据集上重复调用处理函数,因此迭代是相互独立的,除了使用非线程安全资源,它被封装到一个类中(比如nts)由外部库提供,该库采用文件名并对其进行I / O操作。

如果我使用的是OpenMP,我会创建一个包含尽可能多的资源的资源池,并根据线程ID访问这些资源:

std::vector<nts> nts_pool;
for (std::size_t i{0}; i < omp_get_num_threads(); ++i)
    nts_pool.push_back(nts{});

nts_pool[omp_get_thread_num()].do_stuff();  // from inside the task

使用Cilk Plus,我可以使用__cilkrts_get_nworkers()__cilkrts_get_worker_number() API做同样的事情,但是从英特尔论坛的多个帖子中,我发现这被认为是问题的错误解决方案,正确的解决方案是使用持有者hyperobject。

现在,持有者解决方案看起来确实不错,除了我真的想要创建尽可能多的视图,因为我有工作线程。也就是说,对于3个工作线程,我希望有3个对象而不是更多。理由是,正如我所说,资源由第三方库提供,构建起来非常昂贵,之后我将不得不处理结果文件,因此越少越好。

不幸的是,我发现不是根据每个工作人员查看并保持它直到同步,而是根据我不理解的逻辑以某种方式创建和销毁视图,并且没有似乎是影响这种行为的一种方式。

是否有可能让持有者按照我想要的方式行事,如果没有,那么对我的问题来说,什么是惯用的Cilk Plus解决方案呢?

这是我用来调查持有者的程序,请注意,它在一次运行期间在我的测试机器上创建了多达50个视图,这些视图是随机分配和销毁的:

#include <iostream>
#include <atomic>

#include <cilk/cilk.h>
#include <cilk/holder.h>
#include <cilk/reducer_ostream.h>
#include <cilk/cilk_api.h>

cilk::reducer_ostream *hyper_cout;

class nts {
public:
    nts() : tag_{std::to_string(++id_)} {
        *hyper_cout << "NTS constructor: " << tag_ << std::endl;
    }
    ~nts() {
        *hyper_cout << "NTS destructor: " << tag_ << std::endl;
    }
    void print_tag() {
        *hyper_cout << "NTS tag: " << tag_ << std::endl;
    }
    static void is_lock_free() {
        *hyper_cout << "Atomic is lockfree: " << id_.is_lock_free() << std::endl;
    }
private:
    const std::string tag_;
    static std::atomic_size_t id_;
};

std::atomic_size_t nts::id_{0};

class nts_holder {
public:
    void print_tag() { nts_().print_tag(); }
private:
    cilk::holder<nts> nts_;
};

int main() {

    __cilkrts_set_param("nworkers", "4");

    cilk::reducer_ostream cout{std::cout};
    hyper_cout = &cout;

    *hyper_cout << "Workers: " <<  __cilkrts_get_nworkers() << std::endl;
    nts::is_lock_free();

    nts_holder ntsh;
    ntsh.print_tag();

    for (std::size_t i{0}; i < 1000; ++i) {
        cilk_spawn [&] () {
            ntsh.print_tag();
        } ();
    }

    cilk_sync;

    return 0;

}

1 个答案:

答案 0 :(得分:1)

对于这个特定问题,持有人是一个诱人而低效的解决方案。如果您的程序使用每个工作一个插槽的插槽阵列是正确的,那么在这种情况下使用__cilkrts_get_nworkers()__cilkrts_get_worker_number() API确实没有错。我们总是不鼓励他们使用它们;我更喜欢编写Cilk Plus代码而忽略了数字工作者,因为它通常以这种方式扩展得更好。但是,有些情况,包括这个,每个工人创建一个插槽是最好的策略。