在研究利用GPU的GPU和应用程序时,经常使用术语“内存带宽受限”和“计算受限”,而没有严格定义它们(或解释它们是什么)
关于这个问题,我有两个问题。
如果应用程序受内存带宽限制,是否意味着该应用程序将以更高的内存访问速度更快地运行(瓶颈是内存访问带宽)?而且,如果应用程序的计算受到限制,是否意味着如果它具有更多的计算资源或更快的计算,它将显示出更高的性能?就像减少单个操作的等待时间并拥有更多的ALU单元一样
如果我的理解是正确的,那么今天的大多数应用程序都是受内存带宽限制的,而不是受计算限制的。自从GPU广泛使用以来,情况是否一直如此?