我有一个数据集,其中包含在给定时间在室内环境中行走的人的位置。 我没有关于环境的任何信息,只有数据集。 该表的结构如下:
(ID, X, Y, time)
其中ID是包含ID的主键,X和Y是坐标,而时间是时间戳。 数据收集的频率为每0.2秒1个元素。
在开始对路径,速度等进行任何分析之前,我想从数据集中消除噪声,但是我不确定应该使用哪种方法。 我已经读过有关使用DBSCAN之类的集群功能的信息,对于给定的参数,它似乎可以做些什么,但是由于它是基于密度的集群,因此我认为这不是最佳解决方案。另一方面,ST-DBSCAN考虑了时间,因此看起来更合适,但仍然基于密度。
在这样的情况下,是否有更好的方法来过滤噪声?还是DBSCAN是正确的方法?
答案 0 :(得分:2)
如果您将数据视为二维时间序列,则可以应用此处列出的一种算法:https://github.com/rob-med/awesome-TS-anomaly-detection