我正在研究场景边界检测,并且已经完成了以下工作
常规方法:在这种方法中,我使用了SSIM和Pearson系数来比较两个帧之间的相似度
优势
缺点 -错误,用于检测渐变(淡入,淡出,擦除,溶解,快速模糊)
Deep SBD :在此,我实现了deepSBD。代码和论文的链接为https://github.com/abramjos/Scene-boundary-detection
优势
缺点
Transnet :之后,我们实现了Transnet。代码和论文的链接为https://github.com/soCzech/TransNet
它用正确的渐进式检测代替了一些错误的检测,但引入了新的问题:
注意:在最后,我们将deepSBD和TransNet结合在一起,因此没有检测到的东西很少,但是由于以下原因导致虚假检测的增加
如果没有出现上述问题,则2-3小时视频的总体准确度预计为95%,如果出现上述问题,则为70%。
有什么方法可以解决误检测。