我想使用以下信息计算mflop / s / core的实际数量:
我测量了1个节点中每个核心的实际内存带宽量,即4371 MB / s。
如果我在节点上只使用一个核心(在这种情况下节点的整个内存可用于该核心),我还在一个节点上测量了mflop / s / core,结果是2094.45。所以我测量了该核心可用的内存带宽= 10812.3 MB / s
所以现在我想计算当核心具有实际内存带宽(4371MB / s)时的实际mflop / s / core。
如果我按照这样计算它,你认为这是正确的吗?
实际mflop / s / core =(mflop / s / core *实际内存bw)/已用内存带宽
任何帮助都将不胜感激。