提高shared_ptr解除引用成本

时间:2011-11-02 21:27:11

标签: c++ boost shared-ptr

我试图比较原始指针,boost shared_ptr和boost weak_ptr之间的性能。在解除引用部分,我期望shared_ptr和raw_ptr相等,但结果显示shared_ptr大约慢两倍。对于测试,我正在创建一个带有指针或共享指针的数组,然后在这样的循环中取消引用:

int result;
for(int i = 0; i != 100; ++i)
{
  for(int i = 0; i != SIZE; ++i)
    result += *array[i];
}

测试的完整代码可以在这里找到: https://github.com/coolfluid/coolfluid3/blob/master/test/common/utest-ptr-benchmark.cpp

可以在此处找到没有断言的优化构建的测试计时: http://coolfluidsrv.vki.ac.be/cdash/testDetails.php?test=145592&build=7777

感兴趣的值是“DerefShared time”和“DerefRaw time”

我猜测试可能会有所不同,但我没有弄清楚差异来自哪里。分析显示来自shared_ptr的operator *内联,它似乎需要更多时间。我仔细检查了升压断言是否已关闭。

如果有人能解释可能产生的差异,我将非常感激。

额外的独立测试: https://gist.github.com/1335014

1 个答案:

答案 0 :(得分:10)

正如Alan Stokes在评论中所说,这是由于缓存效应造成的。共享指针包括引用计数,这意味着它们在内存中的物理尺寸大于原始指针。当存储在连续的数组中时,每个缓存行的指针数量会减少,这意味着循环必须比使用原始指针更频繁地进入主存储器。

您可以在原始指针测试中分配SIZE*2整数,但也可以通过i+=2而不是++i更改取消引用循环来观察此行为。这样做在我的测试中产生了大致相同的结果。我的原始测试代码如下。

#include <iostream>
#include <boost/timer.hpp>

#define SIZE 1000000

typedef int* PtrT;

int do_deref(PtrT* array)
{
    int result = 0;
    for(int i = 0; i != 1000; ++i)
    {
        for(int i = 0; i != SIZE*2; i+=2)
            result += *array[i];
    }

    return result;
}

int main(void)
{
    PtrT* array = new PtrT[SIZE*2];
    for(int i = 0; i != SIZE*2; ++i)
        array[i] = new int(i);
    boost::timer timer;
    int result = do_deref(array);
    std::cout << "deref took " << timer.elapsed() << "s" << std::endl;
    return result;
}

顺便说一下,使用boost::make_shared<int>(i)而不是PtrT(new int(I))将引用计数和对象一起分配到内存中而不是分开的位置。在我的测试中,这将共享指针解除引用的性能提高了大约10-20%。代码如下:

#include <iostream>
#include <boost/timer.hpp>
#include <boost/shared_ptr.hpp>
#include <boost/make_shared.hpp>
#define SIZE 1000000

typedef boost::shared_ptr<int> PtrT;

int do_deref(PtrT* array)
{
    int result = 0;
    for(int j = 0; j != 1000; ++j)
    {
        for(int i = 0; i != SIZE; ++i)
            result += *array[i];
    }

    return result;
}

int main(void)
{
    PtrT* array = new PtrT[SIZE];
    for(int i = 0; i != SIZE; ++i)
        array[i] = boost::make_shared<int>(i);
    boost::timer timer;
    int result = do_deref(array);
    std::cout << "deref took " << timer.elapsed() << "s" << std::endl;
    return result;
}

我的结果(x86-64 Unbuntu 11 VM):

Original Raw: 6.93
New Raw: 12.9
Original Shared: 12.7
New Shared: 10.59