应用错误收集

我正在使用大小为8000万的键值int数组进行sort_by_key。该设备是 GTX 560 Ti ，具有 2GB VRAM。什么时候可用（免费） sort_by_key为1200MB之前的内存，它完成了200ms中的排序。但是，当可用内存降至600MB时，sort_by_key为。{ 相同的键值数组需要1.5-3s！

我在 Compute Visual Profiler 下运行该程序。我发现了GPU sort_by_key之前的最后一个内核之间的时间戳跳跃1.5-3s 和sort_by_key内的第一个内核调用（这是一个 RakingReduction）。

我怀疑在sort_by_key内部正在进行内存分配，在它调用它的第一个内部内核之前。 sort_by_key的记忆需求是可用的（即使可用内存为600MB），因为 sort_by_key有效，即使速度较慢。我看到了电脑发生这种情况时冻结1秒。我也看到CPU出现问题 物理内存图表，如果我保持 Process Explorer 打开。

我能做些什么来使sort_by_key同样快速地工作什么时候可用内存较小？此外，之间发生了什么导致内存崩溃和临时的设备和主机冷冻？

推力：由于内存分配，sort_by_key变慢

1 个答案: