我正在编写自定义Tensorflow操作系统。我需要将自定义数据结构(在CPU上构建)发送到GPU以在CUDA内核中使用。但是,我的理解是,通过Tensorflow管理内存,只能动态分配Tensors,对吗?如果是这样的话:
a)如何在CPU上分配临时张量,我可以从自定义数据结构中写入数据?
b)如何将这个张量记忆到GPU以与CUDA内核一起使用?
我使用NF_INET_PRE_ROUTING
看到allocate_temp
,但文档不存在。
基本上我需要等同于AllocatorAttributes
和mutable_cpu_data
的Caffe。