我在下面的数据框中包含了下表:
cost cost cost val1 val1 val1
user_id 1 2 3 1 2 3
timestamp
01/01/2011 1 100 3 5
01/02/2013 20 8
01/07/2012 19 57
01/11/2014 3100 49
21/12/2012 240 30
14/09/2013 21 63
01/12/2013 3200 51
我想知道如何获得另一个数据帧,其中只包含所有用户ID的所有相同字段的总和(例如字段的总和'用户1,2和3的费用)但是按升序重新排序的日期。
用于获取上表的代码是:
import pandas as pd
newnames = ['timestamp','user_id', 'cost', 'val1','val2', 'val3','code']
df = pd.read_csv('mytest.csv', names = newnames, header = False, parse_dates=True, dayfirst=True)
df['timestamp'] = pd.to_datetime(df['timestamp'], dayfirst=True)
pivoted = df.pivot('timestamp', 'user_id')
df.groupby('user_id')[['cost', 'val1','val2', 'val3']].sum()
提前感谢您的帮助。