如何使用INTEL fortran获得8核系统的最佳性能

时间:2010-11-22 02:52:03

标签: intel-fortran

请让我知道如何设置INTEL fortran编译器选项以获得IA32和X64位的8核系统的最佳性能。实际上我想执行一个fortran程序并利用8核心系统中所有可用CPU时间的优势。现在程序只占用了13%的CPU时间。

2 个答案:

答案 0 :(得分:1)

您可以在本教程中了解英特尔FORTRAN的自动向量化和引导式自动并行化功能:http://software.intel.com/sites/products/documentation/hpc/composerxe/en-us/start/win/tutorial_comp_for_win.pdf

如果您正在进行线性代数,求解器,FFT,如果将问题映射到Intel Math Kernel Libraries调用中,您可能会获得最佳结果:http://software.intel.com/en-us/articles/intel-mkl/ 已经多线程,矢量化和缓存优化。

如果您正在进行媒体/信号处理,您可以将问题映射到Intel Performance Primitives库中的调用:http://software.intel.com/en-us/articles/intel-ipp/

快乐的黑客攻击!

答案 1 :(得分:0)

在我的特定应用程序中,计算网络模型包含几个循环,运行20k次迭代,每次迭代访问多个嵌套if's,只需在编译器中启用/ Q2级优化就足以减少计算时间大幅度地,同时保持CPU负载约15%。 在类似的说明中,我注意到将优化设置提升到最后一级(/ Q3),确实做了你所要求的(在满载时运行所有CPU),但计算时间根本没有减少。 因此,如果一个问题很小,并且几个测试和处理能力的案例是唯一的瓶颈,那么打开多个Fortran解决方案并同时运行这些案例可能是一个好主意。