我想每天对数据进行分组并计算每日的平均情绪。
我对 pandas 数据框存在问题,因为我无法将 datestamp 中的日期列转换为使用express testapp
函数。这是我的数据示例:
groupby()
答案 0 :(得分:1)
我认为需要resample
-它会创建完整的DatatimeIndex
:
df['date'] = pd.to_datetime(df['date'])
df1 = df.resample('D',on='date')['sentiment'].mean()
#if want remove NaNs rows
df1 = df.resample('D',on='date')['sentiment'].mean().dropna()
或者groupby
,将mean
与date
s或floor
聚合以获取删除时间:
df2 = df.groupby(df['date'].dt.date)['sentiment'].mean()
#DatetimeIndex in output
df2 = df.groupby(df['date'].dt.floor('d'))['sentiment'].mean()