标签: algorithm cuda parallel-processing
任何人都知道如何并行实现二项式系数计算? 任何多核或CUDA资源都会有所帮助,谢谢。
答案 0 :(得分:1)
我会先做以下几点。
第一个和最后一个操作可能需要自定义内核。第二个操作可以使用推力和inclusive_scan操作来完成。
修改的
至于缺点,如上面评论中所提到的,即使在合理大的n大小的64位整数中也会出现严重问题。但这是您需要使用的基本算法。