我开始在一个项目中,我需要为电影和视频构建自定义注释工具。有些人(不是技术头脑)需要弹出我创建的GUI,打开视频文件或切碎视频文件导致的帧目录,然后使用窗口(很像QuickTime或VLC播放器,等等,即具有简单滑动条的视频窗口,允许用户随意来回移动)。在这个窗口中,用户将能够点击有趣的点,给它们语义标签和元数据(例如图中的其他点是否被点遮挡),然后基本上“按下去”并开始跟踪器。跟踪器将逐帧跟踪点,用户可以按空格键或其他内容来前后移动。这个想法是允许人类在跟踪器混淆的任何时候进行干预,但希望跟踪器运行良好,人类不必在整个数千帧视频序列中手动标记每一帧。
我打算用Python完成所有这些,(a)因为它是我最熟悉的非平凡编程语言,(b)我可以轻松访问OpenCV Python(用于图像处理算法)和PyQt似乎有一个足够强大的GUI工具箱用于我想做的事情。(c)同一个项目的其他一些方面正在由其他程序员开发,以便在Python和MySQL数据库中工作。 Python似乎是将所有内容简化为一致的自然选择。
我有经验使用计算机视觉算法进行跟踪,我有理由相信我可以找出简单的PyQt GUI设备,使点可点击,按钮,输入简单的文本数据等。但是,我遇到麻烦的部分理解是如何使用滑块实际构建我自己的视频窗口,滑块根据帧的数字向前移动,或者实际操作视频文件。在使用Python编程时,我可以在PyQt中利用像VLC这样的其他电影播放器吗?任何描述类似电影/视频编辑GUI以及如何在家中开发它们的建议或链接都将不胜感激。