解决我的问题的一种方法是首先获取我的变量的值(GPU复制到CPU),然后使用feed_dict(CPU复制到GPU)提供值。但这涉及将数据从GPU复制到CPU然后复制回来,这比仅在CPU中计算要慢。我希望在没有数据复制的情况下这样做。
解决我的问题的另一种方法是直接在我正在使用的变量上构建图形。但是我有数百个变量,我需要为每个变量构建图形。所有图表都在不同的变量上执行相同的计算。这甚至更慢,因为我需要构建数百个图表。
有没有办法在Tensorflow中优雅地解决这个问题?在Theano中,这个问题自然得到解决,因为Theano接受CPU张量和GPU张量作为函数参数。
谢谢!