Question

我需要使用lambda函数来逐行计算。例如，创建一些数据帧

import pandas as pd
import numpy as np

def myfunc(x, y):
    return x + y

colNames = ['A', 'B']
data = np.array([np.arange(10)]*2).T

df = pd.DataFrame(data, index=[range(0, 10)], columns=colNames)

使用＆＃39; myfunc＆＃39;这确实有效

df['D'] = (df.apply(lambda x: myfunc(x.A, x.B), axis=1))

但是第二种情况不起作用！

df['D'] = (df.apply(lambda x: myfunc(x.colNames[0], x.colNames[1]), axis=1))

给出错误

AttributeError: ("'Series' object has no attribute 'colNames'", u'occurred at index 0')

我真的需要使用第二种情况（使用列表访问colNames），这会产生错误，有关如何执行此操作的任何线索？

感谢

Answer 1

使用df.apply()时，DataFrame的每一行都将作为pandas系列传递给lambda函数。然后，框架的列将成为系列的索引，您可以使用series[label]访问值。

所以这应该有效：

df['D'] = (df.apply(lambda x: myfunc(x[colNames[0]], x[colNames[1]]), axis=1))

熊猫 - ＆＃39;系列＆＃39;对象没有属性＆＃39; colNames＆＃39;何时使用apply（）

1 个答案: