我有一个pandas DataFrame,类似于:
col1 col2 col3 col5
NaN 1 2 8
2 NaN 4 8
4 NaN 4 8
我想做两件事:
1)合并第1列和第2列:
newcol1 col3 col5
1 2 8
2 4 8
4 4 8
我尝试过使用.concat,但这只是连接行。我似乎无法使用具有NaN值的标准+
运算符。
2)从新的第1列和第3列中减去第5列,所以我最终得到:
newcol1 col3
-7 -6
-6 -4
-4 -4
尝试这样做:
dataframe[['newcol1', 'col2']] - dataframe['col5']
和
dataframe[['newcol1', 'col2']].subtract(dataframe['col5'])
但不起作用。
答案 0 :(得分:12)
要获取新列,您可以使用fillna
(或combine_first
):
df['newcol1'] = df.col1.fillna(df.col2)
然后对于减法,使用sub
并指定axis=0
,因为我们要在匹配标签时考虑行索引(而不是默认的列索引):
>>> df[['newcol1', 'col3']].sub(df['col5'], axis=0)
newcol1 col3
0 -7 -6
1 -6 -4
2 -4 -4
答案 1 :(得分:6)
这是一种方法。
您可以newcol1
sum(axis=1)
In [256]: df['newcol1'] = df[['col1', 'col2']].sum(axis=1)
In [257]: df
Out[257]:
col1 col2 col3 col5 newcol1
0 NaN 1 2 8 1
1 2 NaN 4 8 2
2 4 NaN 4 8 4
然后在df.sub()
axis=0
In [258]: df[['newcol1', 'col3']].sub(df['col5'], axis=0)
Out[258]:
newcol1 col3
0 -7 -6
1 -6 -4
2 -4 -4
答案 2 :(得分:1)
In [58]:
df['newcol'] = df[['col1','col2']].sum(axis=1) - df['col5']
df['col3'] = df['col3'] - df['col5']
df
Out[58]:
col1 col2 col3 col5 newcol
0 NaN 1 -6 8 -7
1 2 NaN -4 8 -6
2 4 NaN -4 8 -4
然后您可以删除col1和col2:
In [59]:
df = df.drop(['col1','col2'],axis=1)
df
Out[59]:
col3 col5 newcol
0 -6 8 -7
1 -4 8 -6
2 -4 8 -4