我目前有以下张量:
images
,形状为[batch, height, width, channels]
的典型图像块bboxes
,包含形状为[batch, num.boxes, 4]
的边界框我想使用框的 batch 裁剪图像的 batch ,所以我认为我可以使用类似tf.image.crop_and_resize
的东西。
如文档(link here中所述),该函数采用这两个参数,但方式略有不同:
[batch, height, width, depth]
的图像张量,完美[num.boxes, 4]
的 boxes 张量,无批量尺寸[num.boxes]
的box_ind[i] = j
表示第i个框属于批次中的图像 j 。假设我正确理解了输入参数,如何调整我的 bboxes 张量以适合该功能以及如何提供索引?
我曾考虑过使用reshape(bboxes, [-1, 4])
之类的方法来重塑它,但是我找不到生成box_ind
张量的正确方法。
预先对这个愚蠢的问题表示抱歉,谢谢您的帮助。