无监督学习将两组分开

时间:2018-10-10 06:20:04

标签: machine-learning k-means unsupervised-learning

我目前正在研究公共交通系统的乘客噪声分离。我只有未标记的数据,这意味着我无法进行监督学习。

数据包括MAC地址检测,位置和时间...

我处理数据并将它们分为四个特征

我有四个功能,例如每个相同MAC地址的MAC检测数量,每个相同MAC所经过的距离,每个MAC的持续时间以及每个MAC的速度。

我尝试了KMeans聚类,结果似乎还可以。

  1. 我不确定应该使用哪种学习方法来最好地将乘客身上的两种噪音分开?

  2. 评估模型的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

我认为K-Means是您所暗示的聚类练习的一种合理的学习方法。根据您要完成的工作(例如查找异常值),如果您在时间序列中有此数据,我也将考虑使用STL。