我需要决定开始研究哪个semestral项目。我有机会在3D空间中进行实时模式识别,但我没有以前的经验。我想问一下,在3D空间中实现可用的模式识别系统有多难。想象一下类似于第2号绘图,程序可以告诉它,它是2号 - 但是在3D和实时中。我会使用Leap Motion,它为开发人员提供有关手指和手掌位置,速度,各种矢量等的大量数据。我想记录然后检测各种手势(模式),如“竖起大拇指”,“和平标志“,”中指“等 问题是我不知道,这有多难。
我在大学的第二年 - 线性代数,数学分析,统计学和其他一些数学应该不是问题。 我应该能够在c#,java,R,Prolog和Haskell中编程。
答案 0 :(得分:1)
长话短说:2D中强大的模式识别并非易事,尝试将其扩展到3D可能非常困难。该领域的许多问题仍未得到很好的解决。无论如何,你需要尽可能地缩小问题的范围。
这是一个想法:尝试将场景分为平面拟合,长方体和椭圆体。从该分割开始,也许使用“词袋”方法在物体之间建立一些关系,尝试识别一些物体:沙滩球,白板等。
另一种可能性是制作最强大的算法,可以在各种条件下跟踪形状独特的对象。例如,识别并计算房间内可乐瓶的数量。 (这可能只能在传感器的1-2米范围内工作。)如果您改变照明,将可乐瓶移动到不同的房间,或者让某人随身携带可乐瓶,您会很快发现这可能是一个棘手的问题。
最后一次检查,Leap传感器不适合图案/形状识别,除非你的数据只是手和手指的位置。 Kinect v2将为您提供原始3D数据以及用于骨架跟踪,手势识别等的漂亮库。
只需几个月的时间就能完成这样的任务,很高兴能够解决一个很酷的问题,但要确保沿途的中间解决方案至少有些用处。另外,请尽早定义公差,参数,识别率和其他详细信息 - 将其写下来。这将有助于跟踪进度。