标签: c++ memory cuda
由于内存限制,我有一个最大1000万个变量的程序。我需要赚到2000万但内存相同。
那么在C ++中最好的方法是什么?
有没有图书馆?
并且半数据类型的计算消耗的时间更短吗?
还提到Cuda是否支持半数据类型