我有以下数据:
NativeActivity
我正在尝试进行分组,因此我需要执行以下操作:
Invoice NoStockCode Description Quantity CustomerID Country
536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom
536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom
536365 84406B CREAM CUPID HEARTS COAT HANGER 8 17850 United Kingdom
我想获取输出
df.groupby(['InvoiceNo','CustomerID','Country'])['NoStockCode','Description','Quantity'].apply(list)
相反,我得到了:
|Invoice |CustomerID |Country |NoStockCode |Description |Quantity
|536365| |17850 |United Kingdom |85123A, 71053, 84406B |WHITE HANGING HEART T-LIGHT HOLDER, WHITE METAL LANTERN, CREAM CUPID HEARTS COAT HANGER |6, 6, 8
我尝试了agg和其他方法,但是还无法使所有列都作为列表加入。我不需要使用列表功能,但最后,我希望其他列成为列表。
答案 0 :(得分:2)
我现在无法复制您的代码,但我认为:
print (df.groupby(['InvoiceNo','CustomerID','Country'],
as_index=False)['NoStockCode','Description','Quantity']
.agg(lambda x: list(x)))
会给您预期的输出
答案 1 :(得分:1)
IIUC
df.groupby(['Invoice','CustomerID'],as_index=False)['Description','NoStockCode'].agg(','.join)
Out[47]:
Invoice CustomerID Description \
0 536365 17850 WHITEHANGINGHEARTT-LIGHTHOLDER,WHITEMETALANTER...
NoStockCode
0 85123A,71053,84406B
答案 2 :(得分:1)
尝试使用以下变化形式:
df.groupby('company').product.agg([('count', 'count'), ('NoStockCode', ', '.join), ('Descrption', ', '.join), ('Quantity', ', '.join)])
答案 3 :(得分:1)
您可以将pd.pivot_table
与aggfunc=list
一起使用:
import pandas as pd
df = pd.DataFrame({'Country': ['United Kingdom', 'United Kingdom', 'United Kingdom'],
'CustomerID': [17850, 17850, 17850],
'Description': ['WHITE HANGING HEART T-LIGHT HOLDER',
'WHITE METAL LANTERN',
'CREAM CUPID HEARTS COAT HANGER'],
'Invoice': [536365, 536365, 536365],
'NoStockCode': ['85123A', '71053', '84406B'],
'Quantity': [6, 6, 8]})
result = pd.pivot_table(df, index=['Invoice','CustomerID','Country'],
values=['NoStockCode','Description','Quantity'],
aggfunc=lambda x: ', '.join(map(str, x)))
print(result)
收益
Description NoStockCode Quantity
Invoice CustomerID Country
536365 17850 United Kingdom WHITE HANGING HEART T-LIGHT HOLDER, WHITE META... 85123A, 71053, 84406B 6, 6, 8
请注意,如果Quantity
是int
,则在调用str
之前需要将它们转换为', '.join
。这就是为什么在上面使用map(str, x)
的原因。