我拥有IPP 6,现在我查了已经有IPP 8了。在最新的CPU上比较IPP 6,7和8有什么基准吗?特别是对于1D基本运算(mul,add,complex),FFT和IIR滤波。
答案 0 :(得分:2)
你可以自己做实验。 IPP提供了性能测量实用程序,通常是" ps * .exe"在ipp \ tools \ perfsys目录中。很难说它在IPP 6.x时是怎么回事,但它应该是类似的。 " ps * .exe"对于不同的CPU优化,可执行文件允许根据每个元素的时钟来衡量特定的IPP功能性能(当然,越低越好)。这些性能的基本选项。测试是" - ?"," -e"显示测试中的所有功能," -T"仅打开特定的CPU优化," -r"将输出保存到csv文件中。
假设您要为AVX,SSE41和SSE3 CPU测量ippsIIR64f_32s_Sfs函数。您需要三次启动ps_ipps.exe(这是一维域性能测试):
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TAVX (you'll get csv file with AVX optimization results)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE41 (SSE4.1 perf. data will be appended to csv)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE3" (SSE3 performance data will be appended).
然后grep csv文件以获取所需的函数/参数组合,例如
find "ippsIIR64f,32s,Sfs,32768,6,numBq_DF1" ps_ipps.csv
例如,我得到了
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=2048,1.30,cpMac,512,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=8,1.56,cpMac,613,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=4,5.61,cpMac,2.21e+003,-
这意味着,SSE3为5.61个时钟,SSE4.1为1.56个时钟,AVX为1.30个时钟。 CPU必须支持您要测量的最高指令集。 至于IPP 7和8,您可以下载"试用和购买"英特尔产品的英特尔产品版本(Composer或Parallel Studio)可以做基准测试。