我正在尝试使用时间序列技术对客户的消费行为进行聚类。客户购买令牌并在需要时使用它们(每天最多4个令牌)。 这是客户经过的时间序列的样本(x =首次订购后的天数,y =每天消耗的代币数量),其外观类似于下图。
我尝试使用派生变量(两个事件之间的中值延迟,延迟的标准偏差,令牌总数,第一次消耗与最后一次消耗之间的时间,每个消耗事件消耗的平均令牌数量...)进行聚类。我使用了K均值,这给了我一些不错的结果,但还不足以发现数据中的所有模式。我看过一些有关在这种情况下使用动态时间规整的论文,但我从未使用过这种算法。 使用此类算法对此类时间序列进行聚类是否有任何材料(演示)?
答案 0 :(得分:0)
是的
这里有很多有用的技术。
文献中最明显的方法是采用DTW的HAC。