我有一个函数,它接受一个输入并返回两个值的列表
def my_func(x):
return [x+1, x+2]
假设我有一个简单的数据框
df = pd.DataFrame({'x':[1,2,3,4,5]})
我想将my_func应用于列'x'的每个值,然后将返回的值分别保存在列'y'和列'z'中,如:
(df['y'], df['z']) = df.apply(lambda row: my_func(row.x), axis = 1)
显然这不起作用..
最好的方法是什么?
编辑:正如@Andy Hayden在下面指出的那样,在这种情况下我可以简单地使用
df['y'], df['z'] = myfunc(df.x)
那是因为myfunc
在这里做了一个非常简单的向量计算。如果它更复杂怎么办?
dict = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e', 6:'f'}
def my_func(x):
return [dict[x], dict[x+1]]
所以,dict[x]
不再适用于整个系列,我想我必须使用apply
?然后,如何将结果放入数据帧的两个单独的列
答案 0 :(得分:3)
我认为你不需要在这里申请:
In [11]: df["y"], df["z"] = my_func(df.x)
In [12]: df
Out[12]:
x y z
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7