他们通过组合CNN和RNN构建了一个CRNN网络,制作了一个视频分类器,可以区分足球比赛和电视广告。
我的问题是分类或只是决定这个输入视频是否包含作弊行为(考试作弊),所以根据本教程,我应该通过一组作弊和非作弊图像训练CNN,然后我会通过通过该网络的一系列帧输出一系列(骗子/非骗子)标志,最后用该输出训练或测试RNN。
CNN在这种情况下表现也很好,因为我会利用自己和我的团队充当骗子和非欺骗者来获取大型数据集来训练CNN,这意味着同一个人会扮演骗子的角色非骗子,这可能导致混乱!
我的最后一个问题是,我可以使用教程中声明的方法进行行为分类吗? ..或CNN能否成功区分作弊和非作弊帧?
答案 0 :(得分:0)
实际上,使用相同的人作骗子和非骗子的剪辑将改进训练。 NN必须学会通过动作来区分,而不是欺骗者的身体特征。
我希望这对你来说相当不错。但是,根据特定行为,您可能需要使用视频序列而不是单个帧来描述某些行为。有时,作弊包括一系列请求和响应,而不是单个框架中包含的数据。
这有帮助吗?