我正在GPU上构建强化学习模型,因此我正在使用chainer,它的后端为cupy。 (take 10 (fibonacci))
=> (1 1 2 3 5 8 13 21 34 55)
旨在与cupy
相同,只是它在GPU上运行。
我早些时候问this question关于如何在numpy
中进行标量的快速位移,答案很简单:我需要对实际的numpy
对象进行位移而不是放在numpy.uint64
对象上。如果我可以将移位方法转移到numpy.array
以获得相同的加速,那就太好了。
但是,cupy
文档要求标量必须位于GPU上,而不是CPU(source)上。这意味着我...
如果我想对标量值进行成千上万的移位,尽管这在cupy
中花费的时间少于一秒钟,但是在numpy
中花费的时间太长了。 如何加快cupy
中标量的位移?