我正在尝试通过合计较早列中的加权值来创建新列。
示例
v1 v2 v3
1 2 3
4 3 6
3 2 1
weights = [0.801,0.796,0.637]
我想将v1乘以weights [0],然后将v2乘以weights [1],依此类推,并创建一个新列,作为这些操作的总和
使输出为
v1 v2 v3 v_tot
0.801 1.592 -1.911 0.482
3.204 2.388 -3.822 1.77
2.403 1.592 -0.637 3.358
我尝试创建新的df
data2 = data3.mul(weights_a)
这可行,但是当我尝试创建新列
data2['v_tot'] = data2.loc[:,:].sum()
新列已创建,但其中充满了nan值。
有人可以提供一些建议吗?
答案 0 :(得分:2)
(不确定v3
中为什么会有负值)尝试:
df_new=df.mul(weights,axis=1)
df_new['v_tot']=df_new.sum(axis=1)
print(df_new)
v1 v2 v3 v_tot
0 0.801 1.592 1.911 4.304
1 3.204 2.388 3.822 9.414
2 2.403 1.592 0.637 4.632
答案 1 :(得分:1)
s = """
v1 v2 v3
1 2 3
4 3 6
3 2 1
"""
df = pd.read_csv(pd.compat.StringIO(s), delim_whitespace=True)
weights = [0.801,0.796,0.637]
df['v_tot'] = (df * weights).sum(axis=1)
df
输出:
v1 v2 v3 v_tot
0 1 2 3 4.304
1 4 3 6 9.414
2 3 2 1 4.632
P.S。而且,如果您也想让DataFrame也具有加权值:
dfw = df * weights
dfw['v_tot'] = dfw.sum(axis=1)
dfw
输出:
v1 v2 v3 v_tot
0 0.801 1.592 1.911 4.304
1 3.204 2.388 3.822 9.414
2 2.403 1.592 0.637 4.632
答案 2 :(得分:0)
尝试:
data2['v_tot'] = data2.sum(axis=1)