我的pandas数据框的列为(Date,SKUID,SALES) 日期:4年数据 SKUID:多个ID 销售:每天对应编号的销售
我希望对每个SKU的时间序列进行聚类,以便可以通过为每个聚类创建模型来预测每个序列,即给定聚类中的每个SKU。
要对时间序列进行聚类,我使用的是TSFRESH软件包,我将从中提取每个序列的特征,然后对这些特征进行聚类。
但是我一直坚持获取相关功能。
#to extract relevant features
f = tsfresh.extract_features( df, column_id = "SKUID", column_sort = "DATE" )
#f gives me a dataframe having row as each SKUID and columns as features (around 600)
y=df[['SKUID','Sales']]
f_1=impute(f)
tsfresh.feature_selection.relevance.calculate_relevance_table(f_1,y,ml_task='auto')
错误是“ DataFrame”对象没有属性“ dtype”
我想返回可以在下一步中聚类的相关功能。
还有其他方法可以实现吗? 可以使用其他任何算法来获取相关功能吗?