我有一个c ++代码,它计算int数据类型的阶乘,添加浮点数据类型和每个函数的执行时间如下:
long Sample_C:: factorial(int n)
{
int counter;
long fact = 1;
for (int counter = 1; counter <= n; counter++)
{
fact = fact * counter;
}
Sleep(100);
return fact;
}
float Sample_C::add(float a, float b)
{
return a+b;
}
int main(){
Sample_C object;
clock_t start = clock();
object.factorial(6);
clock_t end = clock();
double time =(double)(end - start);// finding execution time of factorial()
cout<< time;
clock_t starts = clock();
object.add(1.1,5.5);
clock_t ends = clock();
double total_time = (double)(ends -starts);// finding execution time of add()
cout<< total_time;
return 0;
}
现在,我希望将“GFLOP”用于“添加”功能。所以,请建议我如何计算它。因为,我对GFLOPs完全不熟悉,所以请告诉我,我们可以为只有foat数据类型的函数计算GFLOP吗? GFLOPs值随着不同的功能而变化吗?
答案 0 :(得分:0)
如果我有兴趣估计加法操作的执行时间,我可以从以下程序开始。但是,我仍然只相信这个程序产生的数量最多只能在10到100之间(即我不太相信这个程序的输出)。
#include <iostream>
#include <ctime>
int main (int argc, char** argv)
{
// Declare these as volatile so the compiler (hopefully) doesn't
// optimise them away.
volatile float a = 1.0;
volatile float b = 2.0;
volatile float c;
// Preform the calculation multiple times to account for a clock()
// implementation that doesn't have a sufficient timing resolution to
// measure the execution time of a single addition.
const int iter = 1000;
// Estimate the execution time of adding a and b and storing the
// result in the variable c.
// Depending on the compiler we might need to count this as 2 additions
// if we count the loop variable.
clock_t start = clock();
for (unsigned i = 0; i < iter; ++i)
{
c = a + b;
}
clock_t end = clock();
// Write the time for the user
std::cout << (end - start) / ((double) CLOCKS_PER_SEC * iter)
<< " seconds" << std::endl;
return 0;
}
如果您知道您的特定架构如何执行此代码,那么您可以尝试从执行时间估计FLOPS,但FLOPS的估计(在此类操作上)可能不会非常准确。
对此程序的改进可能是用宏实现替换for
循环,或者确保编译器扩展为内联循环。否则,您可能还会在测量中包含循环索引的加法运算。
我认为错误可能不会随问题大小线性扩展。例如,如果您尝试计时的操作时间缩短了1e9到1e15倍,那么您可以获得对GFLOPS的合理估计。但是,除非你确切知道你的编译器和架构在你的代码中做了什么,否则我不会有信心用C ++这样的高级语言来估计GFLOPS,也许汇编可能会更好(只是预感)。
我并不是说它无法完成,但为了准确估算,您可能需要考虑很多事情。