使用阈值进行面部识别时难以理解

时间:2015-04-18 03:30:10

标签: face-recognition threshold

这是一个基于理解的问题,使用阈值方法进行面部识别。我用非专业术语来理解我们如何使用以下步骤识别具有阈值的面部:

  1. 使用前k个特征脸形成本征空间
  2. 项目培训面临着本征空间
  3. 在本征空间上投射测试面
  4. 计算测试面与本征空间中训练面之间的距离
  5. 选择最接近测试面的训练面
  6. 检查距离是否超过识别阈值
  7. 我理解这个过程一直到第6步。我收集到阈值是保留数据的百分比,但我不明白为什么我们会改变这个值。即。为什么我们会让它更小/更大,我们怎么知道我们应该做什么呢? 任何解释都将不胜感激。

1 个答案:

答案 0 :(得分:0)

你真的认为典型的外行人会理解使用“本征空间”这个词的描述吗?此外,这不是一个真正的软件问题,因此在技术上是偏离主题的。

你所询问的概念由“检测理论”描述。

检测理论的基础涉及进行测量的传感器系统。这些测量结果会对环境造成一些干扰。在理想的世界中,除非实际存在感兴趣的东西,否则测量将是一定的。但现实世界并非如此。在现实世界中,即使没有任何感兴趣的东西,也会有被测量的干扰(称为噪声或背景),并且这些测量将具有一些分布。如果存在某些东西,它引起的干扰会叠加在背景上,而测量值则是两者的总和(通常无法区分它们)。

因此,当我们的传感器进行测量时,需要一些决策标准来确定是否存在实际感兴趣的东西。通常,测量值以数值表示(直接或在处理之后)。调用检测(或进行面部识别时匹配)的一个常用标准是计算某些数值测量值,并在测量值超过某个其他选定值(阈值)时调用检测。

每个阈值与四个条件概率相关联:检测概率或真阳性(当存在要匹配的事物时调用匹配),虚警概率(当没有任何内容匹配时调用匹配),概率假阴性(当存在某些东西时不会调用存在的东西),并且是真正的否定(在没有任何东西时不会调用存在的东西)。

概率取决于背景分布和感兴趣的实际干扰的分布。在理想世界中,我们总是做出正确的呼叫,即检测概率为100%,真阴性概率为100%,误报概率或假阴性为零。现实世界不是那种,所以我们想要的概率不是100%,我们不想要的概率也不是零。

更改阈值,并且所有概率都会更改(以分布确定的方式)。通常,阈值是根据相关的检测概率和误报概率来指定的(使用这两个信息位,并且某些模型指定分布,可以导出其他概率)。例如,可以选择阈值以给出90%的检测概率(即,如果实际存在干扰,我们有90%的机会正确地调用它),误报率为10 ^ -6(如果我们召唤一个探测器,在一百万个中有一个机会实际上没有感兴趣的东西)。另一方面,如果我们愿意接受相同误报率的所有检测中的一半,我们会使用较低的阈值。

检测概率和误报率的选择很重要,但这是一种平衡行为。使检测概率太低,并且我们错过了太多的事件(例如,每天都没有识别出X%的坏人)。使误报率过高,我们会得到太多的错误命中(例如,每天一次误击一次而不是每天一次误击) - 这是很昂贵的,因为每次误报都必须通过其他手段进行调查。