我们有一个主要执行数值计算的单线程应用程序。
我们在以下机器上运行此应用程序:
(1)Dell 2插槽(E5-2667 v2)服务器,内存为32 GB(1833 Mhz)
(2)具有32x8 GB RAM(1600 Mhz)的IBM 8 Socket(E7-8891 v2)服务器
应用程序受CPU限制。以下是芯片的比较:
http://ark.intel.com/compare/75273,75259
我们震惊地看到8 socket服务器比2 socket服务器慢大约6倍!
我们不确定E5是否针对浮点计算进行了更优化(以不会出现在时钟速度或缓存中的方式)。或者,它可能与8套接字服务器访问内存的方式有关(更多的跃点访问RAM)。或者,也许它是别的东西。任何人都可以了解这里发生的事情吗?
更多细节: 当我们进行这种性能比较时,机器只运行这一个单线程任务。我们只是测试比较两台机器的单核性能。我们在linux环境中运行一个已编译的c ++程序。我们预计两台机器的性能相似,因为E7和E5芯片的时钟速度,高速缓存大小和内存大致相似。