我试图比较原始指针,boost shared_ptr和boost weak_ptr之间的性能。在解除引用部分,我期望shared_ptr和raw_ptr相等,但结果显示shared_ptr大约慢两倍。对于测试,我正在创建一个带有指针或共享指针的数组,然后在这样的循环中取消引用:
int result;
for(int i = 0; i != 100; ++i)
{
for(int i = 0; i != SIZE; ++i)
result += *array[i];
}
测试的完整代码可以在这里找到: https://github.com/coolfluid/coolfluid3/blob/master/test/common/utest-ptr-benchmark.cpp
可以在此处找到没有断言的优化构建的测试计时: http://coolfluidsrv.vki.ac.be/cdash/testDetails.php?test=145592&build=7777
感兴趣的值是“DerefShared time”和“DerefRaw time”
我猜测试可能会有所不同,但我没有弄清楚差异来自哪里。分析显示来自shared_ptr的operator *内联,它似乎需要更多时间。我仔细检查了升压断言是否已关闭。
如果有人能解释可能产生的差异,我将非常感激。
额外的独立测试: https://gist.github.com/1335014
答案 0 :(得分:10)
正如Alan Stokes在评论中所说,这是由于缓存效应造成的。共享指针包括引用计数,这意味着它们在内存中的物理尺寸大于原始指针。当存储在连续的数组中时,每个缓存行的指针数量会减少,这意味着循环必须比使用原始指针更频繁地进入主存储器。
您可以在原始指针测试中分配SIZE*2
整数,但也可以通过i+=2
而不是++i
更改取消引用循环来观察此行为。这样做在我的测试中产生了大致相同的结果。我的原始测试代码如下。
#include <iostream>
#include <boost/timer.hpp>
#define SIZE 1000000
typedef int* PtrT;
int do_deref(PtrT* array)
{
int result = 0;
for(int i = 0; i != 1000; ++i)
{
for(int i = 0; i != SIZE*2; i+=2)
result += *array[i];
}
return result;
}
int main(void)
{
PtrT* array = new PtrT[SIZE*2];
for(int i = 0; i != SIZE*2; ++i)
array[i] = new int(i);
boost::timer timer;
int result = do_deref(array);
std::cout << "deref took " << timer.elapsed() << "s" << std::endl;
return result;
}
顺便说一下,使用boost::make_shared<int>(i)
而不是PtrT(new int(I))
将引用计数和对象一起分配到内存中而不是分开的位置。在我的测试中,这将共享指针解除引用的性能提高了大约10-20%。代码如下:
#include <iostream>
#include <boost/timer.hpp>
#include <boost/shared_ptr.hpp>
#include <boost/make_shared.hpp>
#define SIZE 1000000
typedef boost::shared_ptr<int> PtrT;
int do_deref(PtrT* array)
{
int result = 0;
for(int j = 0; j != 1000; ++j)
{
for(int i = 0; i != SIZE; ++i)
result += *array[i];
}
return result;
}
int main(void)
{
PtrT* array = new PtrT[SIZE];
for(int i = 0; i != SIZE; ++i)
array[i] = boost::make_shared<int>(i);
boost::timer timer;
int result = do_deref(array);
std::cout << "deref took " << timer.elapsed() << "s" << std::endl;
return result;
}
我的结果(x86-64 Unbuntu 11 VM):
Original Raw: 6.93
New Raw: 12.9
Original Shared: 12.7
New Shared: 10.59