大家。
我试图理解“使用有区别训练的基于部分的模型进行物体检测”。
由于像手一样的物体表现出明显的视点变化,因此作者开发了混合模型来处理这种情况 问题。请参见图1作为插图。
图1.使用双组分自行车模型获得的检测。这些例子 说明了变形混合模型的重要性。在这个模型中的第一个组件 捕获自行车的侧面视图,而第二组件正面和近正面视图。 侧向部件可以变形以匹配“前轮”。
我对如何使用这种混合模型来检测物体有一些疑问。相关说明 在3.3节。作者说:“为了使用混合模型检测物体,我们使用匹配 上述算法用于找到独立产生高得分假设的根位置 对于每个组件。“这是否意味着使用每个组件来独立地找到对象? 以2组件自行车模型为例,我们将使用每个组件来检测自行车 在图像中独立?
对于论文的训练部分,根据我的理解,训练数据由图像组成 带有标签的边界框。请参见图2。 图2左侧是训练图像的示例。右侧是训练的结果,包括模型 结构,过滤器和变形成本。我的问题是实现了模型的可变形部分的数量 通过培训或设置先进?例如,图2中的人模型具有5个可变形部分。数字5 是通过培训得到的?
我也试图通过阅读作者的源代码来找到答案。我检查了所有训练过的车型,比如汽车, 人,鸟,瓶等。在这些文件中,有一个名为“filters”的字段,它是一个结构数组 大小为1乘54.根据我的理解,这54个过滤器是根过滤器和部分过滤器。 我对吗?我对54的数量感到困惑?如何获得这个号码?哪一个是根过滤器 哪一个是这54个过滤器中的部分过滤器?
我将在本周五发表关于你论文的演讲。如果可能的话,你能帮我一个忙吗? 那天之前的这封电子邮件?我知道这个请求有点粗鲁。 :-)。无论如何,非常感谢。