从2010年到2014年,我有700小时的燃气消耗时间序列。一次意甲代表一家公司的消费。 有些消费量不断增加,其他消费量仅为4个月,有些则消费量较高。因此,我想根据消费曲线的形状对它们进行聚类。
我尝试了R套餐“kml”,但我没有取得好成绩。我也试过“kmlShape”包,但似乎我有太多的数据,每次R退出..
我想知道是否使用快速傅里叶变换然后进行聚类可能是一个好主意?我的目标是真正区分消费不变的群体和消费量可变的群体。 然后我想把变量消费者聚集在峰值函数和它们完全消失的时候。
我也尝试计算每个客户的平均值和方差,然后用k-mean聚类,但不是很好,我可以看到2个集群,一个有650个客户端,另一个有50个...
感谢
答案 0 :(得分:0)
以下是我所拥有的三个例子,我有700条曲线,有些是高变量,有些是非常常量。
我想根据它们的形状对它们进行聚类,以便有一个消耗量非常恒定的组,另一个消耗量高度可变的组,并尝试根据峰值出现的时间对它进行聚类