我试图确定一个人坐姿的质量。 (例如,直立=好/蹲着=不好)并带有摄像头。
第一次尝试:
- 图像获取(带有OpenCV python绑定)
- 创建带有标签图像的数据集,分为好/坏
- 特征检测(FAST)
- 在具有该特征(ANN_MLP)的数据集上训练神经网络
结果还可以,但有一些限制:
- 与网络摄像机的移动,位移,其他人,物体等相同。
- 无法确定FAST功能是否适合
- 对于机器学习来说还很陌生,并且希望使用TensorFlow尝试更复杂的方法:
第二次尝试:
我尝试通过Tensorflow PoseNet进行人体姿势检测
并得到一个可以确定人体部位位置概率的微型示例工作。因此,现在的挑战是从PoseNet的输出中检测人的坐姿质量。
什么是继续进行的好方法:
训练第二个TF模型以获取人体部位的概率
位置作为输入和输出的好/坏姿势? (因此PoseNet用作精美特征检测器)
- 重新设计PoseNet模型以适应我的输出需求并对其进行重新培训吗?
- 从PoseNet转移学习(我只是读过它,但不知道它在这里如何或是否适用)?
- 还是完全不同的方法?