标签: cluster-analysis
让我们考虑一下我们有n个时间序列,并使用SAX(符号聚合近似)方法将它们转换为符号表示。因此,例如,时间序列可以表示为“ adbcaabed”。现在,我们计算这些符号之间的距离并创建一个距离矩阵,然后将它们聚类,例如通过层次聚类。
例如,对于不同数量的聚类或不同数量的符号,如何评估聚类结果?
考虑属于每个集群的时间序列并使用传统的集群有效性指标(例如DBI或Dunn)是否正确? (因为它们处理数字数据,并且是欧几里德距离的最佳选择。)