我正在尝试迭代一个熊猫数据框,在这里我将dateTimeIndex作为索引,为每条添加的推文添加Twitter文本和情感(因此分为三列)。我是python的新手,正在寻找每天的整体情绪(因此,每行只有一天,具有整体情绪。我在这里正确使用'groupby'吗?有没有一种有效的方法可以完成了吗?
答案 0 :(得分:1)
是的,您可以使用groupby
后接适当的功能来获取整体情绪。例如,如果您想每天获取情感的 sum ,则您的python将如下所示:
df.groupby('dateTimeIndex')['sentiment'].sum()
这是假设您的dateTimeIndex仅包含日期(例如:2019-07-23),而不包含时间(例如:2019-07-23 10): 00)。
如果dateTimeIndex 同时包含日期和时间,则可以使用dt.date
函数按日期分组。
df.groupby(df['dateTimeIndex'].dt.date)['sentiment'].sum()