标签: c++ c hpc
我发现自己在并行计算应用程序中受带宽限制,并且我在执行期间对程序进行了分析。关键数据预计会在一个连续的行中,但内存转储显示它总是完全或大部分在1根RAM上结束。如果我们有60GB / s的RAM,那就没问题了,但我们没有。
有人必须解决多渠道分配的问题。这在HPC中是一个常见的问题。