标签: image-processing cuda hough-transform
我希望提高Circle Hough Transform算法的性能,因此我已经使用了CUDA。我目前正在全球记忆中使用原子操作进行投票,我知道投票可能很慢。但是,我不确定如何将投票和这些投票的坐标位置存储在共享内存中,以便我可以将结果复制回全局内存。
有没有人就如何做到这一点获得任何建议/意见,以达到CHT的最大性能?
非常感谢大家的时间。