标签: c++ cudnn
我有两个NHWC格式的张量。这两个张量的大小均为(1、32、32、256)32是高度和宽度。通道数为256。 1是批次大小。我想沿着通道维度将这两个张量连接起来,这样得到的张量将是(1,32,32,512)。有什么办法可以使用cudnn api来执行此操作,还是必须编写一个cuda内核来执行此操作?我没有使用tensorflow。