我正在处理视频中的帧。该视频覆盖有几个半透明的框,我的目标是找到这些框的坐标。这些框是视频中唯一的固定点-相机在移动,颜色强度发生变化,没有固定参考。问题在于这些盒子是半透明的,因此它们也随视频而变化,尽管变化不大。似乎背景扣除和跟踪都没有解决此问题的正确工具。
尽管如此,我还是尝试使用cv2附带的背景减法器以及一些使用帧和阈值之间的差异的自家方法。不幸的是,由于盒子透明,这些功能不起作用。
作为参考,以下是前50帧之间的平均差异:
这是cv2背景减法器KNN返回的内容:
我已经尝试了阈值,考虑的帧数,各种轮廓算法,模糊/锐化等。我还尝试了文档布局分析中的技术。
我想知道是否由于不知道正确的关键字而缺少某些内容。我不希望有人在这里给我完美的解决方案,但是任何关于在哪里寻找外观/尝试哪种方法的指针都值得赞赏。我也不受cv2的约束,任何在python中工作的东西都可以。