每组的新变量 - 熊猫

时间:2016-07-08 10:30:53

标签: python r pandas

我爱R.但现在我需要大熊猫。 在R我可以做:

data %>% group_by(sym) %>% mutate(s = mean(price))

它不是聚合!它是每个组不同的新变量。 我尝试了大熊猫的一切 - “分组”想要聚合或分割我的数据!我只想计算新变量。

1 个答案:

答案 0 :(得分:2)

我们可以尝试

import pandas as pd
data['s'] = data['price'].groupby(data['sym']).transform('mean')
print(data)
#   price sym           s
#0    125   A  129.000000
#1    133   A  129.000000
#2     50   B   77.333333
#3     62   B   77.333333
#4    120   B   77.333333

或者@MaxU提到

data['s'] = data.groupby('sym')['price'].transform('mean')

数据

data = pd.DataFrame({'sym': ['A', 'A', 'B', 'B', 'B'], 'price': [125, 133, 50, 62, 120]})