我有时间序列数据,其中有申请号,贷款额。如何使用Featuretools软件包按应用程序计数和平均贷款额进行分组,而又不将月份年份的关系添加回主要实体?
我已经使用pandas完成了此操作,但是我正在尝试探索featuretools软件包,并且想知道它是否具有按功能分组。
下面是熊猫版本的示例:我想使用featuretools复制它。
#Creating a copy of the existing data frame
new_df=df[:]
#Creating values
new_df['year'] = new_df['DATE'].dt.year
new_df['month'] = new_df['DATE'].dt.month
#Sorting Values
new_df=new_df.drop_duplicates().sort_values(by=['var_1','var2','year','month'])
#Counting Distinct variable across 4 variables then taking cummulative sum across 2 variables and storing it in a new data frame
new_df_count_cummulative=new_df.groupby(['var_1','var_2','year','month']).var_3.nunique().groupby(['var_1','var_2']).cumsum()