我一直在尝试编写自定义操作,并希望修改输入张量。我浏览了代码并在op_kernel.cc
但是返回类型是值,而不是引用。我尝试对此进行修改,但效果未反映在输入中。
如果打算按值返回,那么为什么作者使用record_tensor_reference(tensor)
增加引用计数?。
(p.s。我已经重新考虑了代码,因此我不一定需要在op中更改输入。但我仍然希望得到答案)
答案 0 :(得分:0)
如果输入数据在CPU上,并且运算符在GPU上注册,则tf会将输入复制到GPU内存,因此mutable_input的返回指针指向GPU的部分。因此效果无法反映在输入中。