我使用opencv人脸检测器编写了一个多视图人脸检测代码。我正在图像上运行五个探测器(针对不同的姿势角训练)并且使用它们的权重来检测图像中的面部。我使用TBB parallel_for使代码并行,但它的性能提高了1.7倍。我想问一下是否有更好的方法可以同时运行五个探测器?
我在具有16核的群集上运行我的代码。我认为线程的数量(在我的情况下是5个)太少,无法利用完整的功率。
有什么建议吗?
谢谢,
答案 0 :(得分:1)
可能会遇到一些问题:
英特尔(R)VTune(TM)放大器等分析器有时可以帮助追踪这些问题。 Amplifier存在商业许可和non-commercial许可。 [免责声明:我为英特尔工作。]