通过在两个现有列上使用lambda函数在Panda中创建新列

时间:2015-11-12 20:26:01

标签: python pandas lambda multiple-columns calculated-columns

我可以通过定义用户功能然后使用apply在Panda中添加新列。但是,我想使用 lambda ;有办法吗?

例如,df有两列ab。我想创建一个新列c,它等于ab之间的最长长度。

有些事情:

df['c'] = df.apply(lambda x, len(df['a']) if len(df['a']) > len(df['b']) or len(df['b']) )

一种方法:

df = pd.DataFrame({'a':['dfg','f','fff','fgrf','fghj'], 'b' : ['sd','dfg','edr','df','fghjky']})

df['c'] = df.apply(lambda x: max([len(x) for x in [df['a'], df['b']]]))
print df
      a       b   c
0   dfg      sd NaN
1     f     dfg NaN
2   fff     edr NaN
3  fgrf      df NaN
4  fghj  fghjky NaN

1 个答案:

答案 0 :(得分:11)

您可以使用功能map并按功能选择np.where more info

print df
#     a     b
#0  aaa  rrrr
#1   bb     k
#2  ccc     e
#condition if condition is True then len column a else column b
df['c'] = np.where(df['a'].map(len) > df['b'].map(len), df['a'].map(len), df['b'].map(len))
print df
#     a     b  c
#0  aaa  rrrr  4
#1   bb     k  2
#2  ccc     e  3

下一个解决方案是函数apply,参数axis=1

  

axis = 1或'columns':将函数应用于每一行

df['c'] = df.apply(lambda x: max(len(x['a']), len(x['b'])), axis=1)