标签: python tensorflow
我跟踪了训练期间的gpu使用情况,并进行了conv2d操作,结果显示:
conv2d
我尝试使用(3*3*3*16 + 32*450*450*3+ 32*448*448*16) * 4/(1024**2)来计算此操作的确切内存需求,该内存等于466.16MB。显然,TensorFlow为Conv2d分配了318MB的更多内存。 TF为什么要这么做?
(3*3*3*16 + 32*450*450*3+ 32*448*448*16) * 4/(1024**2)
Conv2d
答案 0 :(得分:0)
conv2d的内部实现可能需要使用与输出大小无关的临时存储。