应用错误收集

大家。

我试图理解“使用有区别训练的基于部分的模型进行物体检测”。

由于像手一样的物体表现出明显的视点变化，因此作者开发了混合模型来处理这种情况问题。请参见图1作为插图。 enter image description here

图1.使用双组分自行车模型获得的检测。这些例子说明了变形混合模型的重要性。在这个模型中的第一个组件捕获自行车的侧面视图，而第二组件正面和近正面视图。侧向部件可以变形以匹配“前轮”。

我对如何使用这种混合模型来检测物体有一些疑问。相关说明在3.3节。作者说：“为了使用混合模型检测物体，我们使用匹配上述算法用于找到独立产生高得分假设的根位置对于每个组件。“这是否意味着使用每个组件来独立地找到对象？以2组件自行车模型为例，我们将使用每个组件来检测自行车在图像中独立？

对于论文的训练部分，根据我的理解，训练数据由图像组成带有标签的边界框。请参见图2。 enter image description here 图2左侧是训练图像的示例。右侧是训练的结果，包括模型结构，过滤器和变形成本。我的问题是实现了模型的可变形部分的数量通过培训或设置先进？例如，图2中的人模型具有5个可变形部分。数字5 是通过培训得到的？

我也试图通过阅读作者的源代码来找到答案。我检查了所有训练过的车型，比如汽车，人，鸟，瓶等。在这些文件中，有一个名为“filters”的字段，它是一个结构数组大小为1乘54.根据我的理解，这54个过滤器是根过滤器和部分过滤器。我对吗？我对54的数量感到困惑？如何获得这个号码？哪一个是根过滤器哪一个是这54个过滤器中的部分过滤器？

我将在本周五发表关于你论文的演讲。如果可能的话，你能帮我一个忙吗？那天之前的这封电子邮件？我知道这个请求有点粗鲁。 :-)。无论如何，非常感谢。

计算机视觉：经过特殊训练的可变形零件模型

0 个答案: