当我尝试使用Alea GPU查找第100,000个素数时发生异常。如果我试图找到一个较小的素数,该算法工作正常,例如第10,000个素数。
我使用的是Alea v3.0.4,NVIDIA GTX 970,Cuda 9.2驱动程序。
我是GPU编程的新手。任何帮助将不胜感激。
long[] primeNumber = new long[1]; // nth prime number to find
int n = 100000; // find the 100,000th prime number
var worker = Gpu.Default; // GTX 970 CUDA v9.2 drivers
long count = 0;
worker.LongFor(count, n, x =>
{
long a = 2;
while (count < n)
{
long b = 2;
long prime = 1;
while (b * b <= a)
{
if (a % b == 0)
{
prime = 0;
break;
}
b++;
}
if (prime > 0)
{
count++;
}
a++;
}
primeNumber[0] = (a - 1);
}
);
以下是例外情况:
发生System.Exception HResult = 0x80131500消息= [CUDAError] CUDA_ERROR_LAUNCH_FAILED来源= Alea StackTrace:at Alea.CUDAInterop.cuSafeCall@2939.Invoke(String message)at Alea.CUDAInterop.cuSafeCall(cudaError_enum结果)at A.cf5aded17df9f7cc4c132234dda010fa7.Copy@918-22.Invoke(Unit _arg9)
在Alea.Memory.Copy(FSharpOption1 streamOpt, Memory src, IntPtr srcOffset, Memory dst, IntPtr dstOffset, FSharpOption
1 lengthOpt)
在 Alea.ImplicitMemoryTrackerEntry.cdd2cd00c052408bcdbf03958f14266ca(FSharpFunc2 c600c458623dca7db199a0e417603dff4, Object cd5116337150ebaa6de788dacd82516fa) at Alea.ImplicitMemoryTrackerEntry.c6a75c171c9cccafb084beba315394985(FSharpFunc
2 c600c458623dca7db199a0e417603dff4,Object cd5116337150ebaa6de788dacd82516fa)at Alea.ImplicitMemoryTracker.HostReadWriteBarrier(Object instance)at Alea.GlobalImplicitMemoryTracker.HostReadWriteBarrier(对象实例) at A.cf5aded17df9f7cc4c132234dda010fa7.clo@2359-624 .Invoke(Object arg00)at Microsoft.FSharp.Collections.SeqModule.Iterate [T](FSharpFunc2 action, IEnumerable
1源代码)在Alea.Kernel.LaunchRaw(LaunchParam lp, FSharpOption1 instanceOpt, FSharpList
1 args)at Alea.Parallel.Device.DeviceFor.For(Gpu gpu,Int64 fromInclusive,Int64 toExclusive,Action1 op) at Alea.Parallel.GpuExtension.LongFor(Gpu gpu, Int64 fromInclusive, Int64 toExclusive, Action
1 op)at 测试GPU.Program.Execute(Int32 t)in C:\ Users .. \ source \ repos \ TestingGPU \ TestingGPU \ Program.cs:第148行 在TestingGPU.Program.Main(String [] args)
工作解决方案:
static void Main(string[] args)
{
var devices = Device.Devices;
foreach (var device in devices)
{
Console.WriteLine(device.ToString());
}
while (true)
{
Console.WriteLine("Enter a number to check if it is a prime number:");
string line = Console.ReadLine();
long checkIfPrime = Convert.ToInt64(line);
Stopwatch sw = new Stopwatch();
sw.Start();
bool GPUisPrime = GPUIsItPrime(checkIfPrime+1);
sw.Stop();
Stopwatch sw2 = new Stopwatch();
sw2.Start();
bool CPUisPrime = CPUIsItPrime(checkIfPrime+1);
sw2.Stop();
Console.WriteLine($"GPU: is {checkIfPrime} prime? {GPUisPrime} Time Elapsed: {sw.ElapsedMilliseconds.ToString()}");
Console.WriteLine($"CPU: is {checkIfPrime} prime? {CPUisPrime} Time Elapsed: {sw2.ElapsedMilliseconds.ToString()}");
}
}
[GpuManaged]
private static bool GPUIsItPrime(long n)
{
//Sieve of Eratosthenes Algorithm
bool[] isComposite = new bool[n];
var worker = Gpu.Default;
worker.LongFor(2, n, i =>
{
if (!(isComposite[i]))
{
for (long j = 2; (j * i) < isComposite.Length; j++)
{
isComposite[j * i] = true;
}
}
});
return !isComposite[n-1];
}
private static bool CPUIsItPrime(long n)
{
//Sieve of Eratosthenes Algorithm
bool[] isComposite = new bool[n];
for (int i = 2; i < n; i++)
{
if (!isComposite[i])
{
for (long j = 2; (j * i) < n; j++)
{
isComposite[j * i] = true;
}
}
}
return !isComposite[n-1];
}
答案 0 :(得分:2)
您的代码看起来不正确。给定一个并行的for循环方法(LongFor),Alea将生成“n”个线程,索引“x”用于标识线程号是什么。因此,例如像For(0,n,x =&gt; a [x] = x)这样的简单例子;使用“x”用{0,1,2,....,n - 1}初始化[]。但是,您的内核代码不会在代码中的任何位置使用“x”。因此,您运行相同的代码“n”次,绝对没有区别。为什么然后在GPU上运行?我认为你想做的是在线程“x”中计算“x”是否为素数。有了结果,设置bool prime [x] = true或false。然后,在内核之后,在内核之后,添加一个同步调用,然后使用单个线程(例如,x == 0)进行测试以通过prime []并从数组中选择最大的素数。否则,'primeNumber [0] =(a - 1)会发生很多冲突;'通过GPU上的n线程。我无法想象你会如何得到正确的结果。最后,您可能希望确保使用一些Alea调用,即prime []永远不会复制到GPU或从GPU复制。但是,我不知道你是怎么在Alea那样做的。编译器可能足够聪明,知道prime []仅用于内核代码。