标签: cuda thrust
我查看了分析结果并看到thrust::min_element()调用cudaMalloc(),因此使用了额外的内存。在缩减之后我不需要数组数据,因此更愿意找到最小元素。有可能吗?
thrust::min_element()
cudaMalloc()
答案 0 :(得分:1)
Thrust的减少只使用O(1)临时存储(实际上是O(#processors)),但如果您坚持自己管理分配,则可以implement your own custom allocation scheme。
O(1)
O(#processors))