按月年份分组的featuretools时间序列数据

时间:2018-07-02 16:00:47

标签: featuretools

我有时间序列数据,其中有申请号,贷款额。如何使用Featuretools软件包按应用程序计数和平均贷款额进行分组,而又不将月份年份的关系添加回主要实体?

我已经使用pandas完成了此操作,但是我正在尝试探索featuretools软件包,并且想知道它是否具有按功能分组。

下面是熊猫版本的示例:我想使用featuretools复制它。

#Creating a copy of the existing data frame
new_df=df[:] 

#Creating values
new_df['year'] = new_df['DATE'].dt.year
new_df['month'] = new_df['DATE'].dt.month

#Sorting Values
new_df=new_df.drop_duplicates().sort_values(by=['var_1','var2','year','month'])

#Counting Distinct variable across 4 variables then taking cummulative sum across 2 variables and storing it in a new data frame
new_df_count_cummulative=new_df.groupby(['var_1','var_2','year','month']).var_3.nunique().groupby(['var_1','var_2']).cumsum()

0 个答案:

没有答案