我的数据框有多个重复的实例,按日期排序。它看起来像这样:
我正在尝试按日期合并行以匹配"关键字",并总结"视图"计数。
我希望获得的结果如下:
有人能暗示我如何在Python中实现这一目标吗?谢谢。
数据框:
df = pd.DataFrame([["3/8/14", "adapter", 2], ["3/8/14", "adapter", 5], ["3/8/14", "charger", 1],
["13/8/14", "adapter", 1], ["13/8/14", "battery-case", 0]],
columns=['Date', 'Keyword', 'Views'])
答案 0 :(得分:4)
你想要一个群组!
import pandas as pd
df = pd.DataFrame([["3/8/14", "adapter", 2], ["3/8/14", "adapter", 5], ["3/8/14", "charger", 1],
["13/8/14", "adapter", 1], ["13/8/14", "battery-case", 0]],
columns=['Date', 'Keyword', 'Views'])
print df
# Date Keyword Views
# 0 3/8/14 adapter 2
# 1 3/8/14 adapter 5
# 2 3/8/14 charger 1
# 3 13/8/14 adapter 1
# 4 13/8/14 battery-case 0
df2 = df.groupby(['Date','Keyword'],as_index=False).agg({'Views': 'sum'})
print df2
# Date Keyword Views
# 0 13/8/14 adapter 1
# 1 13/8/14 battery-case 0
# 2 3/8/14 adapter 7
# 3 3/8/14 charger 1