如果我不使用DTW作为距离度量标准,则tslearn.clustering.TimeSeriesKMeans和sklearn.cluster.KMeans是否彼此等效?
如果不能告诉我这两个软件包之间的主要区别是什么?
答案 0 :(得分:4)
主要区别仅在于您可以在tslearn Kmeans中将“ dtw”作为度量标准,这有助于聚类不同长度的时间序列数据,而在sklearn中,如果您的时间序列数据长度不同,则会出错,主要是因为将每个时间戳记视为一个新功能,当您的数据不是矩阵格式时,它会认为它是错误的格式。
有趣的是,tslearn本身在后台使用sklearn。
但是,tslearn在聚类除2以外的不同“ n_clusters”的数据时可能会发出问题,例如说3。 / it有时仅预测2个标签。 here I mentioned make 4 clusters but it gave only 2 labels