我关注Dataframe
:
fk name
0 105 Coca-Cola1
1 105 Coca-Cola1
2 106 Coca-Cola2
3 115 Coca-Cola5
4 115 Coca-Cola5
5 115 Coca-Cola5
6 108 Coca-Cola8
7 105 Coca-Cola1
我想计算出现次数:
[[105, Coca-Cola1, 3],
[106, Coca-Cola2, 1],
[115, Coca-Cola5, 3],
[108, Coca-Cola8, 1]]
知道怎么做到这一点吗?
答案 0 :(得分:6)
您可以使用groupby
汇总size
,然后reset_index
,最后使用DataFrame.values
numpy.ndarray.tolist
转换为numpy array
:
df = df.groupby(['fk','name']).size().reset_index().values.tolist()
print (df)
[[105, 'Coca-Cola1', 3],
[106, 'Coca-Cola2', 1],
[108, 'Coca-Cola8', 1],
[115, 'Coca-Cola5', 3]]
如果订单重要,请将参数sort=False
添加到groupby
:
df = df.groupby(['fk','name'], sort=False).size().reset_index().values.tolist()
print (df)
[[105, 'Coca-Cola1', 3],
[106, 'Coca-Cola2', 1],
[115, 'Coca-Cola5', 3],
[108, 'Coca-Cola8', 1]]