第3列中的总和值与第2列和第1列中的唯一值相关

时间:2018-01-03 20:46:15

标签: python pandas sorting sum grouping

我在Python工作,我有来自纽约市的Uber数据的Pandas DataFrame。 DataFrame的一部分如下所示:

    Year Week_Number    Total_Dispatched_Trips      
    2015    51          1,109
    2015    5           54,380
    2015    50          8,989
    2015    51          1,025
    2015    21          10,195
    2015    38          51,957
    2015    43          266,465
    2015    29          66,139
    2015    40          74,321
    2015    39          3
    2015    50          854

就像现在一样,同一周每年出现多次。我想总结" Total_Dispatched_Trips"的值。每年每周一次。我希望每周只出现一次。 (因此第51周不能在2015年等多次出现)。我该怎么做呢?我的数据集超过3k行,所以我不想手动执行此操作。

提前致谢。

1 个答案:

答案 0 :(得分:1)

okidoki就在这里,借用Convert number strings with commas in pandas DataFrame to float

import locale
from locale import atof
locale.setlocale(locale.LC_NUMERIC, '')

df['numeric_trip'] = pd.to_numeric(df.Total_Dispatched_trips.apply(atof), errors = 'coerce')
df.groupby(['Year', 'Week_number']).numeric_trip.sum()