Tensorflow-提供正确的image.crop_and_resize输入参数

时间:2018-10-26 06:56:28

标签: python tensorflow neural-network keras

我目前有以下张量:

  • images,形状为[batch, height, width, channels]的典型图像块
  • bboxes,包含形状为[batch, num.boxes, 4]的边界框

我想使用框的 batch 裁剪图像的 batch ,所以我认为我可以使用类似tf.image.crop_and_resize的东西。

如文档(link here中所述),该函数采用这两个参数,但方式略有不同:

  • 一个形状为[batch, height, width, depth]图像张量,完美
  • 一个形状为[num.boxes, 4] boxes 张量,批量尺寸
  • 形状为[num.boxes]
  • box_ind 张量应该(理论上)包含某个盒子所属的图像,例如box_ind[i] = j表示第i个框属于批次中的图像 j

假设我正确理解了输入参数,如何调整我的 bboxes 张量以适合该功能以及如何提供索引?

我曾考虑过使用reshape(bboxes, [-1, 4])之类的方法来重塑它,但是我找不到生成box_ind张量的正确方法。 预先对这个愚蠢的问题表示抱歉,谢谢您的帮助。

0 个答案:

没有答案