标签: machine-learning computer-vision feature-extraction
我搜索了许多关于视频中运动特征提取的内容,我意识到使用定向梯度直方图和定向光流直方图描述视频达到了最先进的水平!
但我不能深刻理解它是如何运作的?! ..我想我可以为每个帧使用HOG描述符并使用光流跟踪结果,然后将两个直方图描述符附加在同一个特征向量中。
这样看来是对的吗?! ..还是有另一种常见的已知方法在一个精确的特征向量中合并HOG和HOF描述符?!