我知道这个问题之前曾被问过几次,但除了几位作者写的一些软件包外,我在google上找不到多少。在任何情况下都有任何计划在张量流中包含roi池层(正式),因为它是对象检测和其他任务的重要组件,并且在使用tensorflow时无法访问它是一种痛苦。
欢迎任何评论或替代实施(如果经过验证)。
答案 0 :(得分:10)
我能够通过上面的论文找到我的问题的答案。您可以使用tf.image.crop_and_resize函数裁剪网络的任何部分并调整其大小。类似于ROI池,您可以裁剪边界框(按下采样步骤的数量向下缩放,例如VGG16中的32)并将其调整为NxN(例如VGG16中的7x7),然后可以将其输入完全连接层。