使用带有lambda函数的DataFrame.apply将返回的元组/列表分配给多个列

时间:2016-05-26 17:01:35

标签: python pandas

我有一个函数,它接受一个输入并返回两个值的列表

def my_func(x):
    return [x+1, x+2]

假设我有一个简单的数据框

df = pd.DataFrame({'x':[1,2,3,4,5]})

我想将my_func应用于列'x'的每个值,然后将返回的值分别保存在列'y'和列'z'中,如:

(df['y'], df['z']) = df.apply(lambda row: my_func(row.x), axis = 1)

显然这不起作用..

最好的方法是什么?

编辑:正如@Andy Hayden在下面指出的那样,在这种情况下我可以简单地使用

df['y'], df['z'] = myfunc(df.x)

那是因为myfunc在这里做了一个非常简单的向量计算。如果它更复杂怎么办?

dict = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e', 6:'f'}
def my_func(x):
    return [dict[x], dict[x+1]]

所以,dict[x]不再适用于整个系列,我想我必须使用apply?然后,如何将结果放入数据帧的两个单独的列

1 个答案:

答案 0 :(得分:3)

我认为你不需要在这里申请:

In [11]: df["y"], df["z"] = my_func(df.x)

In [12]: df
Out[12]:
   x  y  z
0  1  2  3
1  2  3  4
2  3  4  5
3  4  5  6
4  5  6  7