根据其他列的加权值创建新的熊猫列

时间:2019-03-07 17:01:52

标签: python pandas calculated-columns composite

我正在尝试通过合计较早列中的加权值来创建新列。

示例

 v1    v2   v3  
  1    2    3
  4    3    6
  3    2    1

weights = [0.801,0.796,0.637] 

我想将v1乘以weights [0],然后将v2乘以weights [1],依此类推,并创建一个新列,作为这些操作的总和

使输出为

 v1       v2      v3    v_tot 
0.801   1.592   -1.911  0.482
3.204   2.388   -3.822  1.77
2.403   1.592   -0.637  3.358

我尝试创建新的df

data2 = data3.mul(weights_a)

这可行,但是当我尝试创建新列

data2['v_tot'] = data2.loc[:,:].sum()

新列已创建,但其中充满了nan值。

有人可以提供一些建议吗?

3 个答案:

答案 0 :(得分:2)

(不确定v3中为什么会有负值)尝试:

df_new=df.mul(weights,axis=1)
df_new['v_tot']=df_new.sum(axis=1)
print(df_new)

      v1     v2     v3  v_tot
0  0.801  1.592  1.911  4.304
1  3.204  2.388  3.822  9.414
2  2.403  1.592  0.637  4.632

答案 1 :(得分:1)

s = """
 v1    v2   v3  
  1    2    3
  4    3    6
  3    2    1
"""
df = pd.read_csv(pd.compat.StringIO(s), delim_whitespace=True)

weights = [0.801,0.796,0.637]

df['v_tot'] = (df * weights).sum(axis=1)
df

输出:

   v1  v2  v3  v_tot
0   1   2   3  4.304
1   4   3   6  9.414
2   3   2   1  4.632

P.S。而且,如果您也想让DataFrame也具有加权值:

dfw = df * weights
dfw['v_tot'] = dfw.sum(axis=1)
dfw

输出:

      v1     v2     v3  v_tot
0  0.801  1.592  1.911  4.304
1  3.204  2.388  3.822  9.414
2  2.403  1.592  0.637  4.632

答案 2 :(得分:0)

尝试:

data2['v_tot'] = data2.sum(axis=1)