在阅读本文时,我遇到了自上而下和自下而上的方法
图像处理上的“ https://arxiv.org/abs/1611.08050”。
本段中我对自上而下的方法含糊不清: “自上而下的方法:应用单独训练的人体检测器(基于我们之前讨论的物体检测技术),找到每个人,然后对每个检测进行姿态估计。”
但是,由此无法理解自下而上的方法: “自下而上的方法可以直接从像素级图像证据中识别人的姿势。它们可以解决上述两个问题:当您从整个图片中获取信息时,可以区分人员,还可以将运行时间与人员数量脱钩至少在理论上是这样。” 请帮助我理解这些概念。谢谢。
两个段落均来自此博客:“ https://medium.com/neuromation-blog/neuronuggets-understanding-human-poses-in-real-time-b73cb74b3818”
答案 0 :(得分:0)
图片中有两个人。全人类有15个关节(关键点)
在此示例中,自顶向下方法需要两次姿势估计。
在此示例中,姿势估计器并不关心图片中有多少人。他们只考虑如何将每个关节分类到每个人。
在一般情况下,自上而下的方法比自下而上的方法要消耗更多的时间,因为自上而下的方法需要通过人体检测器的结果进行N倍的姿势估计。