我坚持并行执行以下代码:
double[][] a, b, c;
double d;
double[] e;
for (int i = 1; i < x; i++) {
double f = 0.0;
for (int j = 0; j < y; j++) {
double a1 = a[i-1][j];
double a2 = a[i][j];
double a3 = a1 * a2;
d -= a3;
c[i][j] = c[i - 1][j] + a3;
f += c[i][j] * a3;
}
e[i] = d + f;
for (int j = 0; j < y; j++) {
a[i][j] = e[i] * b[i][j]
}
}
第二个内部循环取决于第一个内部循环(由于e[i]
),因此它们必须顺序执行,但是在每个内部循环中,都可以在y
上并行化计算。
问题在于它们都在外部变量上读写。可以并行(概念上)并行编写,因为每个内部循环将其部分结果汇总到全局变量中。
x
的顺序为10000和y
250。在此示例中,简化了内部循环处理,但实际上计算量更大。
这里的问题是如何并行化读取和写入外部变量的循环?
由于d
和f
,以下尝试无法编译:
double[][] a, b, c;
double d;
double[] e;
for (int i = 1; i < x; i++) {
double f = 0.0;
IntStream.range(0, y).parallel().forEach(j -> {
double a1 = a[i-1][j];
double a2 = a[i][j];
double a3 = a1 * a2;
d -= a3;
c[i][j] = c[i - 1][j] + a3;
f += c[i][j] * a3;
});
e[i] = d + f;
IntStream.range(0, y).parallel().forEach(j -> {
a[i][j] = e[i] * b[i][j];
});
}
答案 0 :(得分:1)
要并行化子循环,必须首先了解每个子循环的结果。
第一个循环的结果是:
d
的增量f
c[i]
子数组要计算它们,您可以创建一个自定义类型来保存这3个值,然后执行可变归约以计算所有3个值。由于缺少更好的名称,我将称呼自定义类型ResultContainer
。
类似地,第二个循环的结果是数组a[i]
。这很简单,因为很容易从Stream
构建数组。
这将因此:
for (int i0 = 1; i0 < x; i0++) {
final int i = i0; // tmp store as final for use in lambda
ResultContainer result = IntStream.range(0, y).parallel()
.collect(() -> new ResultContainer(y), (resultContainer, j) -> {
double a1 = a[i - 1][j];
double a2 = a[i][j];
double a3 = a1 * a2;
double cij = c[i - 1][j] + a3;
resultContainer.add(-a3, cij * a3, j, cij);
}, ResultContainer::add);
d += result.d;
e[i] = d + result.f;
c[i] = result.ci;
a[i] = IntStream.range(0, y).parallel().mapToDouble(j -> e[i] * b[i][j]).toArray();
}
具有我们的自定义类型:
class ResultContainer {
double d;
double f;
double[] ci;
public ResultContainer(int y) {
this.d = 0;
this.f = 0;
ci = new double[y];
}
public void add(double d, double f, int j, double cij) {
this.d += d;
this.f += f;
ci[j] = cij;
}
public void add(ResultContainer resultContainer2) {
d += resultContainer2.d;
f += resultContainer2.f;
for (int j = 0; j < ci.length; j++) {
// note that one of the two is always 0 here
ci[j] += resultContainer2.ci[j];
}
}
}