答案 0 :(得分:0)
使用反向传播来识别对激活最有贡献的像素,并设置合理的阈值来识别哪些像素属于对象。
默认算法执行此操作然后计算所选像素的轴对齐边界框(因为它非常简单)。您需要运行另一个允许任意方向的边界框算法。维基百科有一些想法(link)。
关于如何获得有趣的像素,你可以在tensorflow代码中查看它。
答案 1 :(得分:0)
定向边界框是一个非常有趣的主题,它已被基于深度学习的对象检测方法所忽略,并且很难找到数据集。
最近我发现一篇非常有趣的论文/数据集/挑战(特别是因为他们关注定向框)可以在这里找到:
http://captain.whu.edu.cn/DOTAweb/index.html
他们不会分享他们修改Fater-RCNN的代码(也没有在论文中提供太多细节)来使用定向边界框,但数据集本身和表示讨论非常有用。