通过添加其他列

时间:2015-12-01 15:26:17

标签: python python-2.7 pandas

我的数据框的值类似于

A B
1 4
2 6
3 9

我需要通过添加A列和B列的值来添加新列,例如

A B C
1 4 5
2 6 8
3 9 12

我相信这可以使用lambda函数完成,但我无法弄清楚如何去做。

10 个答案:

答案 0 :(得分:52)

很简单:

std::cout << "test";
printf("another test";

答案 1 :(得分:32)

最简单的方法是使用DeepSpace答案。但是,如果您真的想使用匿名函数,可以使用apply:

df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)

答案 2 :(得分:22)

您可以使用sum函数来实现评论中提到的@EdChum:

df['C'] =  df[['A', 'B']].sum(axis=1)

In [245]: df
Out[245]: 
   A  B   C
0  1  4   5
1  2  6   8
2  3  9  12

答案 3 :(得分:17)

在Anton的答案中再做一点,您可以添加如下所有列:

df['sum'] = df[list(df.columns)].sum(axis=1)

答案 4 :(得分:6)

从Pandas版本0.16.0起,您可以使用assign,如下所示:

df = pd.DataFrame({"A": [1,2,3], "B": [4,6,9]})
df.assign(C = df.A + df.B)

# Out[383]: 
#    A  B   C
# 0  1  4   5
# 1  2  6   8
# 2  3  9  12

您可以通过以下方式添加多个列:

df.assign(C = df.A + df.B,
          Diff = df.B - df.A,
          Mult = df.A * df.B)
# Out[379]: 
#    A  B   C  Diff  Mult
# 0  1  4   5     3     4
# 1  2  6   8     4    12
# 2  3  9  12     6    27

答案 5 :(得分:4)

你可以这样做:

df['C'] = df.sum(axis=1)

如果您只想做数值:

df['C'] = df.sum(axis=1, numeric_only=True)

答案 6 :(得分:1)

我想添加一条注释来响应错误消息n00b,但我没有足够的声誉。所以我的评论是一个答案,以防它对任何人有帮助...

n00b说:

  

我收到以下警告:试图在DataFrame的切片副本上设置一个值。尝试改用.loc [row_indexer,col_indexer] =值

他收到此错误的原因是,在创建df['C']之前,他对数据框进行的任何操作都会在数据框中创建视图,而不是复制视图。 DeepSpace建议的简单计算df['C'] = df['A'] + df['B']并未引起该错误。

看看Returning a view versus a copy文档。

答案 7 :(得分:1)

可以使用loc

In [37]:  df = pd.DataFrame({"A":[1,2,3],"B":[4,6,9]})

In [38]: df
Out[38]:
   A  B
0  1  4
1  2  6
2  3  9

In [39]: df['C']=df.loc[:,['A','B']].sum(axis=1)

In [40]: df
Out[40]:
   A  B   C
0  1  4   5
1  2  6   8
2  3  9  12

答案 8 :(得分:0)

关于n00b的评论:“我收到以下警告:试图在DataFrame的切片副本上设置一个值。尝试改用.loc [row_indexer,col_indexer] = value。”

我遇到了同样的错误。就我而言,这是因为我试图对这样创建的数据框执行列添加:

df_b = df[['colA', 'colB', 'colC']]

而不是:

df_c = pd.DataFrame(df, columns=['colA', 'colB', 'colC'])

df_b是df中切片的副本
df_c是一个新的数据框。所以

df_c['colD'] = df['colA'] + df['colB']+ df['colC']

将添加列,并且不会引发任何警告。如果使用.sum(axis = 1),则相同。

答案 9 :(得分:0)

您只需添加以下内容即可解决该问题: df ['C'] = df ['A'] + df ['B']