我已经建立了一个包含1个头节点和3个计算节点的小型集群。我的客户端计算机是Windows 2016 Server,我用它来提交Workbook卸载作业。我的问题 - HPC非常慢;如果我在本地计算机上运行该作业,它的运行速度比HPC集群上的运行速度快〜大约快10倍!我的节点配置如下:
Headnode:2vCPU和RAM 8GB
计算节点:1vCPU和RAM 4GB
我怀疑这个问题可能与节点和网络之间的通信有关。或者完全不同的东西。有人可以帮忙吗?
提前致谢!
答案 0 :(得分:0)
从我的HPC工作:由于群集中的互连(网络交换机),我经历了很多性能下降。可能是您的互连速度不够快,无法真正利用硬件。由于数据必须传送到其他节点,因此连接速度较慢会妨碍您的速度/性能。目前,大多数HPC系统都具有某种特殊的网络互连,速度极快(通常是infiniband),允许节点快速地相互发送数据。我建议您检查网络交换机,确保它不低于1千兆以太网速度。
以下是我的某个出版物的链接:https://www.raspberrypi.org/magpi/benchmarking-raspberry-pi-cluster/
接下来,您可以看到以太网带宽有多低会妨碍我的群集的性能。