我对机器学习的知识非常有限。我正在寻找一种可以帮助我通过这些点的一些历史数据将数据点组合在一起的特定聚类算法。想想这个例子: 有n个气象站(例如200个),我有n个气象站的每小时温度数据5年。所以数据看起来像
timestamp, station_1, station_2, ...
1900-01-01 00:00:00, 80, 60, 81, ...
1900-01-01 01:00:00, 82, 59, 83
我正在寻找一种将气象站组合在一起的聚类算法,因此在群集中,站点温度非常关闭。例如,80和81接近,而80和60不接近。
另外,如果算法也可以告诉/计算如何关闭'是集群中心的数据点,这将是伟大的......
答案 0 :(得分:1)
不要期望找到完全所需的算法。
自定义适合您问题的算法。这就是数据科学嗡嗡声的故事,需要进行实验和定制,而不是希望获得交钥匙解决方案。
您对所需内容有非常具体的了解。您必须将此想法放入代码并将其插入某些算法中。例如,考虑具有最大范数的完整链接聚类。这可能是你上面解释的,但我认为它不会有用。