使用TSFRESH提取相关特征

时间:2018-12-11 07:40:19

标签: pandas time-series cluster-analysis feature-selection

我的pandas数据框的列为(Date,SKUID,SALES) 日期:4年数据 SKUID:多个ID 销售:每天对应编号的销售

我希望对每个SKU的时间序列进行聚类,以便可以通过为每个聚类创建模型来预测每个序列,即给定聚类中的每个SKU。

要对时间序列进行聚类,我使用的是TSFRESH软件包,我将从中提取每个序列的特征,然后对这些特征进行聚类。

但是我一直坚持获取相关功能。

#to extract relevant features
f = tsfresh.extract_features( df, column_id = "SKUID", column_sort = "DATE" )

#f gives me a dataframe having row as each SKUID and columns as features (around 600)
y=df[['SKUID','Sales']]

f_1=impute(f)

tsfresh.feature_selection.relevance.calculate_relevance_table(f_1,y,ml_task='auto')

错误是“ DataFrame”对象没有属性“ dtype”

我想返回可以在下一步中聚类的相关功能。

还有其他方法可以实现吗? 可以使用其他任何算法来获取相关功能吗?

0 个答案:

没有答案