我正在测试我的计算机以获得有关数据对齐的速度。测试很简单,处理相同的缓冲区一次获取2个字节的数据,一次4个字节,而不是8个字节。使用2字节访问处理剩余的(如果存在的)几个字节。 测试的详细信息为here。
我的问题是当我在循环中执行它时,我得到完全相同的printf结果的时间过去 - 显然不可能是真的,并且当我在循环开始时设置断点时确认 - 然后新的结果似乎是正确。所以我认为这必须做一些关于编译器优化的事情(但我为g ++设置-O0标志)但我不知道到底是什么,我不明白。
g ++ 4.4.7 Ubuntu 12.10 NetBeans AMDx64
那我该怎么办?
for (int i = 0; i < 10; i++) {
int* itab=new int[1000*256]; //1MiB table
double elapsed=0;
boost::timer* t=new boost::timer();
Munge16(itab, 250);
elapsed = t->elapsed();
printf("Munge8 elapsed:%d\n", elapsed);
t->restart();
delete t;
elapsed=0;
delete itab;
}
结果:
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
Munge8逝去:1721468076
断点在这里:
for (int i = 0; i < 10; i++) {
breakpoint >> int* itab=new int[1000*256]; //1MiB table
Munge8逝去:1721528944
Munge8逝去:1721529048
Munge8逝去:1721529174
Munge8逝去:1721529281
Munge8逝去:1721529496
Munge8逝去:1721529554
Munge8逝去:1721529643
Munge8逝去:1721529756
Munge8已逝去:1721529808
Munge8逝去:1721529896
有一个解决方案,但我仍然不明白为什么boost :: timer会给我这么奇怪的结果。
工作解决方案是使用gettimeofday
中的<time.h>
函数。
class Timer {
private:
timeval startTime;
public:
void start(){
gettimeofday(&startTime, NULL);
}
double stop(){
timeval endTime;
long seconds, useconds;
double duration;
gettimeofday(&endTime, NULL);
seconds = endTime.tv_sec - startTime.tv_sec;
useconds = endTime.tv_usec - startTime.tv_usec;
duration = seconds + useconds/1000000.0;
return duration;
}
long stop_useconds(){
timeval endTime;
long useconds;
gettimeofday(&endTime, NULL);
useconds = endTime.tv_usec - startTime.tv_usec;
return useconds;
}
static void printTime(double duration){
printf("%5.6f seconds\n", duration);
}
};
试验:
//test
for (int i = 0; i < 10; i++) {
void *vp = malloc(1024*sizeof(int));
memset((int *)vp, 0, 1024);
void* itab = malloc(sizeof(int)*1024*256); //1MiB table
if (itab) {
memset ( (int*)itab, 0, 1024*256*sizeof (int) );
float elapsed;
boost::timer t;
Timer timer = Timer();
timer.start();
Munge64(itab, 1024*256);
double duration = timer.stop();
long lt = timer.stop_useconds();
timer.printTime(duration);
cout << t.elapsed() << endl;
elapsed = t.elapsed();
cout << ios::fixed << setprecision(10) << elapsed << endl;
cout << ios::fixed << setprecision(10) << t.elapsed() << endl;
printf("Munge8 elapsed:%ld useconds\n", lt);
elapsed = 0;
free(vp);
free(itab);
//printf("Munge8 elapsed:%d\n", elapsed);
}
}
结果:
0.000100秒
0&lt;&lt; ??????????
40 <&lt; ????????????????
40 <&lt; ???????????????????????????????????
Munge8已过去:100次使用
0.000100秒
0
40
40
Munge8已过去:100次使用
0.000099秒
0
40
40
Munge8已过去:99次使用
答案 0 :(得分:0)
你不应该使用boost :: timer - http://www.boost.org/doc/libs/1_54_0/libs/timer/doc/original_timer.html#Class计时器
在POSIX上测量CPU时间 - 而不是挂钟时间。
考虑使用boost :: chrono或std :: chrono - 你想要看看steady_clock - 当你想要将自己与系统挂钟漂移或移位隔离时,实现定时器时的其他时钟。