我在Python工作,我有来自纽约市的Uber数据的Pandas DataFrame。 DataFrame的一部分如下所示:
Year Week_Number Total_Dispatched_Trips
2015 51 1,109
2015 5 54,380
2015 50 8,989
2015 51 1,025
2015 21 10,195
2015 38 51,957
2015 43 266,465
2015 29 66,139
2015 40 74,321
2015 39 3
2015 50 854
就像现在一样,同一周每年出现多次。我想总结" Total_Dispatched_Trips"的值。每年每周一次。我希望每周只出现一次。 (因此第51周不能在2015年等多次出现)。我该怎么做呢?我的数据集超过3k行,所以我不想手动执行此操作。
提前致谢。
答案 0 :(得分:1)
okidoki就在这里,借用Convert number strings with commas in pandas DataFrame to float
import locale
from locale import atof
locale.setlocale(locale.LC_NUMERIC, '')
df['numeric_trip'] = pd.to_numeric(df.Total_Dispatched_trips.apply(atof), errors = 'coerce')
df.groupby(['Year', 'Week_number']).numeric_trip.sum()