这是“算法”,但是当我想测量执行时间时它会给我零。为什么呢?
#define ARRAY_SIZE 10000
...
clock_t start, end;
start = clock();
for( i = 0; i < ARRAY_SIZE; i++)
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );
那我该怎么办来衡量时间?
答案 0 :(得分:14)
两件事:
10000
在现代计算机上并不是很多。因此,该循环的运行时间可能不到一毫秒 - 小于clock()
的精度。因此它将返回零。
如果您没有使用non_parallel
的结果,那么整个循环将由编译器进行优化。
最有可能的是,你只需要一个更昂贵的循环。尝试将ARRAY_SIZE
增加到更大的范围。
这是我的机器上有一个更大阵列尺寸的测试:
#define ARRAY_SIZE 100000000
int main(){
clock_t start, end;
double *non_parallel = (double*)malloc(ARRAY_SIZE * sizeof(double));
double *vec = (double*)malloc(ARRAY_SIZE * sizeof(double));
start = clock();
for(int i = 0; i < ARRAY_SIZE; i++)
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );
free(non_parallel);
free(vec);
return 0;
}
<强>输出:强>
Number of seconds: 0.446000
答案 1 :(得分:5)
这是一种实际计算秒数的不可靠方法,因为clock()
函数的精度非常低,并且你的循环没有做很多工作。你可以让你的循环做得更多,以便它运行更长时间,或者使用更好的计时方法。
更高精度的方法是特定于平台的。对于Windows,请参阅How to use QueryPerformanceCounter?,对于linux,请参阅High resolution timer with C++ and Linux?