作为我研究的一部分,我使用ScaLAPACK
计算了不同带状系统的并行解决方案。我有兴趣报告实现的加速是矩阵的等级, r 及其带宽 b 的函数。
如何更好地实现这一目标?
这是我选择的两个值的Universe:
{10,000 25,000 50,000 75,000 100,000 500,000 1,000,000 5,000,000 10,000,000}
中的 r
{2 4 8 16 32 64 128 256 512 1024}
b
我使用的群集共有64个核心,因此 p 位于{1, ..., 64}
。
我计算了加速和效率, s 和 e ,作为 p , r的函数和 b 。
我的目标是以某种方式显示基于 r 和 b 的加速效果。我在考虑创建(r,b)空间的某种表面投影。但是如何在一个值中恢复加速行为?
我的建议是使用达到的和理想的(线性)加速来计算Pearson相关系数,然而,这似乎不起作用,因为它没有考虑“加速甜点”的存在因较小的 r 值而出现。
任何提示?
提前致谢!
答案 0 :(得分:1)
在考虑了这个问题之后,我决定报告,最佳实现的加速乘以Pearson线性相关系数。
这样的情节如下:
每个实例(r,b)实现的最佳加速比由“接近线性”的方式加权,Pearson线性相关系数包含的信息。由于前者是[-1,1]中定义的值,因此,对于远离线性的加速,我们将得到0,而当预期时,负值将显示减速。在附图中,我们可以看到并行求解器确实会对小带宽值产生适当的可扩展性,并且随着此值的增加会变得更糟。
如果你们有任何提示或任何更正,请告诉我们;)