标签: c++ cuda
我有一个共享库,其中包含一个进行计算的函数。共享库在python中与ctypes模块一起使用,在其中我传递了一些变量和指向共享库缓冲区的指针。共享库中的计算将用一些数据填充指向缓冲区的指针。我想知道是否可以在共享库中实现CUDA来执行并行计算。
有人对如何执行此操作有建议吗?我是CUDA的新手。
谢谢!