为什么GNU Parallel扩展似乎使算法变慢?

时间:2013-07-24 09:40:35

标签: c++ parallel-processing g++ stl-algorithm

我想按照本指南操作: http://gcc.gnu.org/onlinedocs/libstdc++/manual/bk01pt12ch31s03.html

以下是一些示例代码:

#include <numeric>
#include <vector>
#include <iostream>
#include <chrono>

using namespace std;
int main()
{
    vector<int> in(1000);
    vector<double> out(1000);
    iota(in.begin(), in.end(), 1);

    auto t = std::chrono::high_resolution_clock::now();
    for(int i = 0; i < 100000; ++i)
        accumulate(in.begin(), in.end(), 0);

    auto t2 = std::chrono::high_resolution_clock::now();

    cout << std::chrono::duration_cast<std::chrono::milliseconds>(t2 - t).count()  << endl;

    return 0;
}

我有以下结果:

~:$ g++ test.cpp -std=c++11
~:$ ./a.out 
900
~:$ g++ test.cpp -D_GLIBCXX_PARALLEL -std=c++11 -fopenmp -march=native 
~:$ ./a.out 
1026

进行多次运行时,这两种运行几乎同时停留。 我也试过其他算法,比如排序,生成,查找,转换...... 我有一个i7,启用了超线程(4个逻辑核心)。 我运行g ++ - 4.8.1

由于

1 个答案:

答案 0 :(得分:2)

我认为你需要尝试一些更重的东西。您所做的就是将int添加到一起。创建线程等的开销会更大。尝试将int替换为std::string并运行以下代码并比较输出:

int main()
{
    vector<string> in(100000);

    auto t = std::chrono::high_resolution_clock::now();
    accumulate(in.begin(), in.end(), string(), [](string s1, string s2){ return s1 += s2 + "a" + "b";});
    auto t2 = std::chrono::high_resolution_clock::now();

    cout << std::chrono::duration_cast<std::chrono::milliseconds>(t2 - t).count()  << endl;
}