场景边界检测

时间:2019-11-21 05:23:20

标签: machine-learning image-processing deep-learning computer-vision artificial-intelligence

我正在研究场景边界检测,并且已经完成了以下工作

常规方法:在这种方法中,我使用了SSIM和Pearson系数来比较两个帧之间的相似度

优势

  1. 在突然切入过渡上效果很好
  2. 执行速度快

缺点  -错误,用于检测渐变(淡入,淡出,擦除,溶解,快速模糊)

Deep SBD :在此,我实现了deepSBD。代码和论文的链接为https://github.com/abramjos/Scene-boundary-detection

优势

  1. 在突然剪切和渐变时效果很好(淡入,淡出,擦除,溶解)

缺点

  1. 训练中包括手动闪光,例如,当在两帧之间出现密集闪光时,由于错误检测增加,因此检测错误。摔角时摔跤录像或突然的阳光。
  2. 快速模糊运动
  3. 长期解散

Transnet :之后,我们实现了Transnet。代码和论文的链接为https://github.com/soCzech/TransNet

它用正确的渐进式检测代替​​了一些错误的检测,但引入了新的问题:

  1. 错误地将帧之间的重叠检测为镜头变化
  2. 错误地将帧之间的过渡过度检测为镜头变化

注意:在最后,我们将deepSBD和TransNet结合在一起,因此没有检测到的东西很少,但是由于以下原因导致虚假检测的增加

  1. 密集闪光
  2. 快速运动模糊
  3. 过渡过渡
  4. 两帧之间重叠

如果没有出现上述问题,则2-3小时视频的总体准确度预计为95%,如果出现上述问题,则为70%。

有什么方法可以解决误检测。

0 个答案:

没有答案