在CUDA中同时传递内核?

时间:2016-02-08 11:35:44

标签: random cuda

假设我的设备有2880个cuda核心。

我想运行蒙特卡罗模拟,其中:

  • 2000个主题分别运行样本
  • 880个线程正在生成随机数

这是因为:

  • 我只想要2000个样本,因此其他880个将闲置
  • 我知道生成随机数可能很慢

因此,我想制作一个由880个线程连续补充的随机数池,2000个样本线程可以在需要时进行补充。

这可能吗?如果是,请提供一个例子。

1 个答案:

答案 0 :(得分:1)

严格地说,你提出的建议在CUDA中似乎是不可能的,正如其他人指出的那样,这肯定不是一个好主意。您可能希望首先学习一本书或在线课程,以熟悉GPU编程概念。

更重要的是,如果你想直接潜水,here's an MC pi example解决了CUDA,OpenACC和Thrust。