我有一个按日期时间排序的带有“标题”的数据框。 我想按日期将这些“标题”分组。 所以我的计划是创建一个每天都有所有“标题”的系列。然后,我想将此系列附加到以日期为列名的新数据框。
由于列的大小不同,我使用了pd.concat()将系列添加到Dataframe中。但这也不行。
示例: Input Dataframe ,Output Dataframe
df_sorted = df.sort_values('dates', ascending=False)
df_added = pd.DataFrame()
df1 = pd.DataFrame()
k = 0
for i in range(0, len(df_sorted)):
if (df_sorted.iloc[i]['dates'] == df_sorted.iloc[i+1]['dates']):
continue
else:
df1[df_sorted.iloc[i]['dates']] = df_sorted.iloc[k:i+1]['headlines']
df_added = pd.concat([df_added,df1], axis=1)
df1 = pd.DataFrame()
k = i + 1