应用错误收集

在阅读本文时，我遇到了自上而下和自下而上的方法
图像处理上的“ https://arxiv.org/abs/1611.08050”。

本段中我对自上而下的方法含糊不清： “自上而下的方法：应用单独训练的人体检测器（基于我们之前讨论的物体检测技术），找到每个人，然后对每个检测进行姿态估计。”

但是，由此无法理解自下而上的方法： “自下而上的方法可以直接从像素级图像证据中识别人的姿势。它们可以解决上述两个问题：当您从整个图片中获取信息时，可以区分人员，还可以将运行时间与人员数量脱钩至少在理论上是这样。” 请帮助我理解这些概念。谢谢。

图片中有两个人。全人类有15个关节（关键点）

在此示例中，自顶向下方法需要两次姿势估计。

在此示例中，姿势估计器并不关心图片中有多少人。他们只考虑如何将每个关节分类到每个人。

在一般情况下，自上而下的方法比自下而上的方法要消耗更多的时间，因为自上而下的方法需要通过人体检测器的结果进行N倍的姿势估计。