如何使用ip camera集成面部和物体识别?

时间:2017-12-19 16:28:43

标签: camera face-recognition object-recognition

设置一个舞台,在一个地区有200 +模拟摄像机到中央监控站,但这些摄像机没有识别面部或物体。是否可以对这些相机实施面部检测?这些相机必须具备哪些先决条件?如何加载这些相机发送和处理的图像?

1 个答案:

答案 0 :(得分:2)

由于您的问题并未解决特定的编码问题,而是着重于解决模式识别任务的一般概念,因此我想给您一些必须考虑的步骤的概述。正如您已经注意到的,我写了一些有关模式识别(PR)的文章。好吧,除了模式分析(实际上是步骤2)之外,这就是您想要做的。

让我们从这样的PR管道开始:

1。信号采集

要分析信号,首先必须有一个信号。收集此信号是第一步,让我告诉您一件事:在这里没有太多要做,但是有很多错误。对您来说,当您要访问模拟摄像机的视频信号时,首先要做的是A / D转换,这样您就可以使用数字信号了。我对摄像机的视频质量没有任何印象,但请记住一件事:输入到特征提取(FE)工具中的信号几乎肯定会在每个FE步骤中都是一帧。因此,请检查帧的质量而不是整个视频的质量,这可能会给您造成错误的印象。除此之外,您无法真正影响信号采集。我没有写任何有关如何从摄像机访问模拟视频的信息,仅仅是因为没有有关其环境的信息。

2。信号预处理

现在,当您有一些数字信号时(当然也可以使用模拟信号来完成此操作,但是为了简单起见,我将仅在此处介绍数字预处理),您希望从中获得最大的收益。这是什么意思?您收集(或观察到)的每个信号X基本上都是真实的(未中断)信号S和某种噪声N的混合:

X = S + N

理想情况下,您想拥有的是S。如果设法降低噪声N,则可以减少其对总信号X的贡献。因此,在预处理过程中,您通常会进行某种过滤。对于图像,例如,您可以在单个帧上应用中值滤波器,以处理盐和皮特噪声。但是信号处理可以有许多不同的应用,您必须阅读有关特定任务的主题。长话短说:您想通过减少噪声,伪像,...来提高信号质量。

3。特征提取/分类

现在您的信号质量足够好(这是一个假设,对于您的特定设置我一无所知)。您现在要进行特征提取。这是什么?只有一个视频帧包含很多信息。假设您的分辨率为720×576像素,那么已经有超过400.000个值,这甚至不是很好的图像质量。第一件事:并不是每个像素都对您想要做的事情很有趣。现在,我将只考虑人脸识别任务:您想要显示人脸的像素。所有其他像素对您来说都不那么有趣。您现在必须做两件事,首先检测一张脸,然后对其进行进一步处理以检测人。对于一般的面部检测,有不同的方法,例如模式匹配,纹理匹配或卷积神经网络(CNN)。成功检测到面部之后,您该如何处理面部?同样,您有不同的选择,例如特征面,尺度不变特征变换(SIFT)或CNN。

此外,您的分类算法需要培训。训练算法意味着针对特定目标优化其参数。这真的很棘手:不仅需要样本数据(可以从相机中收集数据),而且还需要标签。对于面部检测,您可以获得一些不错的预训练算法,这些算法也应适用于您的数据。但是,对于人脸识别,您需要每个想要检测的人的样本。并且您必须注释它们。您将需要大量这些摄像头,理想情况下,这些摄像头还将用于识别。同样,有预训练的模型,但是您仍然必须向这些预训练的模型展示您想识别的新面孔。


整个流水线假设您具有足够的输入信号质量,我不确定。如果是这样,它将为您提供有关执行任务所需步骤的快速指南。如果步骤1成功,则步骤2不再重要。第3步将是最具挑战性的,因为您必须拥有一些训练数据。

我没有写任何有关不同国家/地区隐私权法律的内容。我只是希望您尊重您可能面临的任何限制!