我在主机代码中使用cuFFT库调用它们工作正常,但我想从内核调用cuFFT库。早期版本的CUDA没有这种支持,但动态并行性可能吗?
如果有任何关于如何实现这一目标的例子,那就太棒了。
答案 0 :(得分:6)
尽管在Kepler(cc 3.5)卡上引入了动态并行,但cuFFT仍然是主机API,目前无法使用cuFFT在设备代码中创建或执行FFT运算。
答案 1 :(得分:0)
没有办法从GPU内核调用API。您必须从主机呼叫它们。如果你想在不通过DEVICE的情况下运行FFT - >主持人 - >设备继续您的详细说明,唯一的解决方案是编写一个在设备功能中执行FFT的内核。实际上我这样做是因为我需要并行运行更多的FFT而不将数据再次传递给HOST。如果您找到/有其他解决方案,请告诉我。网上有很多关于如何实现这个目标的例子: - https://hackage.haskell.org/package/pure-fft-0.2.0/docs/Numeric-FFT.html