我最近尝试制作一个计算FLOPS的简单程序。由于c++
足够快,所以我认为值得尝试获得接近结果
当我使用Notepad ++插件NppExec
编译它时,它工作正常,但我没有构建它。当我在CodeBlocks中构建和运行时,它会继续迭代,并且不会完成该过程。所以我回到记事本++并再次编译,然后这次当我运行它工作正常,迭代只是过了一秒。
#include<iostream>
#include<conio.h>
#include<ctime>
#include<iomanip>
using namespace std;
int main(){
float a=1.0,b=2.0,var,j;
double flop;
clock_t start,end;
cout<<"\n Iterating...";
start=clock();
for(j=0;j<999999999;j++){ // Iterates 999999999 times
var=a*b+a/b; // <-- 5 Flops, or am I wrong?
}
end=clock();
cout<<"\n\n Calculating...";
double secs=((float)(end-start))/CLOCKS_PER_SEC;
flop=999999; // Actually is 999999999, but integer overflow in expression
flop=5*(flop*1000+999); // In the brackets I make the value to same as 999999999
// Multiply with 5 and basically get Flops here
flop/=secs; // To get the Flops in second, multiply with time elapsed
string prefix,fstr;
if(flop/1000000000>=1||flop/1000000000<1){
flop/=1000000000;
prefix="GFLOPS";
}
else if(flop/1000000000000>=1){
flop/=1000000000000;
prefix="TFLOPS";
}
cout<<"\n\n\n Floating-points Operations Per Second\n\n > "<<setprecision(3)<<flop<<" "<<prefix;
getch();
return 0;
}
如果您知道如何使结果更精确,请继续,任何答案都将不胜感激!
答案 0 :(得分:1)
此代码存在许多问题。 首先,您正在使用float
变量(j
)来维护具有严格终止条件j<999999999
的循环计数器。这可能是循环可能永远运行的原因。 j
的类型应为整数类型,例如int
。
第二,循环中的触发器数量取决于您使用的编译器,传递给编译器的编译器选项以及目标体系结构。解决这个问题的最好方法是查看生成的汇编代码。
第三次,由于编译器优化导致结果无效,第一次调用clock
和第二次调用clock
可能会被重新排序。您必须通过查看汇编代码确保它们没有重新排序。确保这一点的方法取决于编译器。
第四,这是什么意思?
flop=999999; // Actually is 999999999, but integer overflow in expression
编译器是否告诉您999999999
会导致溢出?如果是,那么你如何在循环终止条件下使用它?究竟是什么错误?
第五,这个
if(flop/1000000000>=1||flop/1000000000<1){
应该是这样的
if(flop/1000000000>=1){
第六次,整个循环可能会被编译器优化掉,因为在循环之后你没有使用var
。你应该在最后打印var
的值,这样就不会发生。
第七,表达式a*b+a/b
具有常量值。实际上,每次迭代都会为var
分配相同的值。编译器可能会将此优化为单个常量赋值。在这种情况下,将发出零触发器。
第八,这里的评论应该说除以不是乘法。
flop/=secs; // To get the Flops in second, multiply with time elapsed
第九,此条件if(flop/1000000000000>=1)
应该在此条件之前if(flop/1000000000>=1)
第十,在这行代码中,它被称为浮点
cout<<"\n\n\n Floating-points Operations Per Second\n\n
第十一次,这个数字999999999
应该在函数开头定义为常量,以便更容易更改。
最后,用于计算运行时间的方法最简单,在很多情况下都足够好。但是有更复杂的方法要准确得多。