我的数据框的值类似于
A B
1 4
2 6
3 9
我需要通过添加A列和B列的值来添加新列,例如
A B C
1 4 5
2 6 8
3 9 12
我相信这可以使用lambda函数完成,但我无法弄清楚如何去做。
答案 0 :(得分:52)
很简单:
std::cout << "test";
printf("another test";
答案 1 :(得分:32)
最简单的方法是使用DeepSpace答案。但是,如果您真的想使用匿名函数,可以使用apply:
df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
答案 2 :(得分:22)
您可以使用sum
函数来实现评论中提到的@EdChum:
df['C'] = df[['A', 'B']].sum(axis=1)
In [245]: df
Out[245]:
A B C
0 1 4 5
1 2 6 8
2 3 9 12
答案 3 :(得分:17)
在Anton的答案中再做一点,您可以添加如下所有列:
df['sum'] = df[list(df.columns)].sum(axis=1)
答案 4 :(得分:6)
从Pandas版本0.16.0起,您可以使用assign
,如下所示:
df = pd.DataFrame({"A": [1,2,3], "B": [4,6,9]})
df.assign(C = df.A + df.B)
# Out[383]:
# A B C
# 0 1 4 5
# 1 2 6 8
# 2 3 9 12
您可以通过以下方式添加多个列:
df.assign(C = df.A + df.B,
Diff = df.B - df.A,
Mult = df.A * df.B)
# Out[379]:
# A B C Diff Mult
# 0 1 4 5 3 4
# 1 2 6 8 4 12
# 2 3 9 12 6 27
答案 5 :(得分:4)
你可以这样做:
df['C'] = df.sum(axis=1)
如果您只想做数值:
df['C'] = df.sum(axis=1, numeric_only=True)
答案 6 :(得分:1)
我想添加一条注释来响应错误消息n00b,但我没有足够的声誉。所以我的评论是一个答案,以防它对任何人有帮助...
n00b说:
我收到以下警告:试图在DataFrame的切片副本上设置一个值。尝试改用.loc [row_indexer,col_indexer] =值
他收到此错误的原因是,在创建df['C']
之前,他对数据框进行的任何操作都会在数据框中创建视图,而不是复制视图。 DeepSpace建议的简单计算df['C'] = df['A'] + df['B']
并未引起该错误。
答案 7 :(得分:1)
可以使用loc
In [37]: df = pd.DataFrame({"A":[1,2,3],"B":[4,6,9]})
In [38]: df
Out[38]:
A B
0 1 4
1 2 6
2 3 9
In [39]: df['C']=df.loc[:,['A','B']].sum(axis=1)
In [40]: df
Out[40]:
A B C
0 1 4 5
1 2 6 8
2 3 9 12
答案 8 :(得分:0)
关于n00b的评论:“我收到以下警告:试图在DataFrame的切片副本上设置一个值。尝试改用.loc [row_indexer,col_indexer] = value。”
我遇到了同样的错误。就我而言,这是因为我试图对这样创建的数据框执行列添加:
df_b = df[['colA', 'colB', 'colC']]
而不是:
df_c = pd.DataFrame(df, columns=['colA', 'colB', 'colC'])
df_b是df中切片的副本
df_c是一个新的数据框。所以
df_c['colD'] = df['colA'] + df['colB']+ df['colC']
将添加列,并且不会引发任何警告。如果使用.sum(axis = 1),则相同。
答案 9 :(得分:0)
您只需添加以下内容即可解决该问题: df ['C'] = df ['A'] + df ['B']