标签: memory parallel-processing gpu openacc
我在C ++上有程序,它的内存消耗非常奇怪,因此当我使用-ta = multicore(并且所有周期都在多核上运行)时,我的程序“吃”了约700MB,而当我使用-ta = tesla时:管理下,我内存不足,消耗〜7GB,这怎么可能? cuda统一内存中发生了什么?也许是std :: vector有罪吗?我当时以为内存消耗可以增加一倍,但不能达到10倍。