我有一个简单的问题。 如果我有多个具有相同NAME但行数不同的行,那么只有一个pandas函数可以添加它们吗?
NAME QTY
A 2
A 5
A 6
A total = 13?
答案 0 :(得分:1)
尝试pivot table。如果您的数据框名为df
:
df = pd.pivot_table(df, index=['NAME'],values=['QTY'],aggfunc='sum')
答案 1 :(得分:0)
有各种方法可以做到这一点。但简单来说就是分组和分组。聚合
from pyspark.sql.functions import sum
df.groupBy('NAME').agg(sum('QTY')).show()