我有一个看起来像这样的pandas DataFrame:
date sku qty
0 2015-10-30 ABC 1
1 2015-10-30 DEF 1
2 2015-10-30 ABC 2
3 2015-10-31 DEF 1
4 2015-10-31 ABC 1
... ... ... ...
如何提取特定sku
的所有数据并按日期汇总qty
。例如,ABC
SKU?
2015-10-30 3
2015-10-31 1
... ...
我得到的最接近的是与sales.groupby(['date', 'sku']).sum()
进行的层次分组。
答案 0 :(得分:2)
如果您将使用所有(或几个)storm-kafka-client
,则:
sku
输出:
agg_df = df.groupby(['sku','date']).qty.sum()
# extract some sku data
agg_df.loc['ABC']
如果您只关心date
2015-10-30 3
2015-10-31 1
Name: qty, dtype: int64
,那么最好先对其进行过滤
ABC
输出将与上面相同。