Question

我想与APARAPI并行实现一个熵功能。在该函数中，我需要计算向量中的不同键，但它无法正确执行。

假设我们只有3个不同的值。这是我的代码：

final int[] V = new int[1024];
// Initialization for V values
final int[] count = new int[3];
Kernel kernel = new Kernel(){
    @Override
    public void run(){
        int gid = getGlobalId();
        count[V[gid]]++;
    }
};
kernel.execute(Range.create(V.length));
kernel.dispose();

运行此代码段后，当我打印count []值时，它给出了1,1,1。似乎count[V[gid]]++每个V [gid]只执行一次。

感谢。

Answer 1

所以这就是问题所在。 ++运算符实际上是三个操作：读取当前值，递增它，写入新值。在Aparapi中，您可能同时运行1024个GPU线程。这意味着他们将读取值，可能在值为0时同时读取，然后将其增加到1，然后所有1024个线程将写入1.因此它按预期运行。

您要做的是称为Map-reduce功能。你刚刚跳过了很多步骤。您需要记住Aparapi是一个没有线程安全的系统，因此您必须编写算法来适应这种情况。这就是Map-reduce的用武之地，以下是如何做到这一点。我刚刚写了它并将其添加到新家的Aparapi存储库，详情如下。

int size = 1024;
final int count = 3;
final int[] V = new int[size];

//lets fill in V randomly...
for (int i = 0; i < size; i++) {
    //random number either 0, 1, or 2
    V[i] = (int) (Math.random() * 3);
}

//this will hold our values between the phases.
int[][] totals = new int[count][size];

///////////////
// MAP PHASE //
///////////////
final int[][] kernelTotals = totals;
Kernel mapKernel = new Kernel() {
    @Override
    public void run() {
        int gid = getGlobalId();
        int value = V[gid];
        for(int index = 0; index < count; index++) {
            if (value == index)
                kernelTotals[index][gid] = 1;
        }
    }
};
mapKernel.execute(Range.create(size));
mapKernel.dispose();
totals = kernelTotals;

//////////////////
// REDUCE PHASE //
//////////////////
while (size > 1) {
    int nextSize = size / 2;
    final int[][] currentTotals  = totals;
    final int[][] nextTotals = new int[count][nextSize];
    Kernel reduceKernel = new Kernel() {
        @Override
        public void run() {
            int gid = getGlobalId();
            for(int index = 0; index < count; index++) {
                nextTotals[index][gid] = currentTotals[index][gid * 2] + currentTotals[index][gid * 2 + 1];
            }
        }
    };
    reduceKernel.execute(Range.create(nextSize));
    reduceKernel.dispose();

    totals = nextTotals;
    size = nextSize;
}
assert size == 1;

/////////////////////////////
// Done, just print it out //
/////////////////////////////
int[] results = new int[3];
results[0] = totals[0][0];
results[1] = totals[1][0];
results[2] = totals[2][0];

System.out.println(Arrays.toString(results));

请记住，虽然看起来效率低下但实际上在更大的数字上运行得相当好。这个算法适用于

size = 1048576.

使用新大小，我的系统会在大约一秒钟内计算出以下结果。

[349602, 349698, 349276]

最后一点，您可能需要考虑转移到aparapi.com处于更活跃的项目。它包含几个错误的修复程序，以及上面链接的旧库中的许多额外功能和性能增强功能。它也在maven中心有大约十几个版本。所以它更容易使用。我刚刚在这个答案中编写了代码，但决定在新的Aparapi存储库的示例部分中使用它，您可以在the following link in the new Aparapi repository找到它。

用Aparapi计算向量中的不同值

1 个答案: