应用错误收集

我正在编写自定义Tensorflow操作系统。我需要将自定义数据结构（在CPU上构建）发送到GPU以在CUDA内核中使用。但是，我的理解是，通过Tensorflow管理内存，只能动态分配Tensors，对吗？如果是这样的话：

a）如何在CPU上分配临时张量，我可以从自定义数据结构中写入数据？

b）如何将这个张量记忆到GPU以与CUDA内核一起使用？

我使用NF_INET_PRE_ROUTING看到allocate_temp，但文档不存在。

基本上我需要等同于AllocatorAttributes和mutable_cpu_data的Caffe。