我已经创建了一个用于分类的集合(每个图像的平均值或预测值),或者用于语义分割(平均值 - 或每个像素的预测值),但我真的不知道如何继续对象检测..我的猜测是提取我所有网络的所有区域提议,然后在最好的 X 上运行我的分类器,最后平均所有边界框的预测。但是,我应该如何使用Object Detection API之后的架构呢?
我猜区域提案可以使用extract_proposal_features
提取,然后重新插入到模型中,但我认为这样做的唯一方法就是创建一个具有自己的predict
的完整新模型方法等,处理我的Ensemble的所有模型。我错过了其他明显/简单的方法吗?
答案 0 :(得分:2)
这是基本的想法,是的(Resnet论文对如何为更快的R-CNN做了很好的解释)。很遗憾,我们还没有发布代码来自动化这个整合过程(并且没有任何计划)。当然可能;你必须自己手动设置它。