Pandas中Python Lamba函数的澄清/冥想

时间:2017-01-26 22:23:56

标签: python pandas lambda

我终于摆脱了SPSS的束缚,正在陶醉于熊猫和Python的自由(喜欢它)。但是,我试图更清楚地了解python Lambda函数如何在Pandas中进行交互。它似乎突然出现了很多。这是一个例子,我希望能消除这种模糊。

从字符串拆分创建新数据框后:

 bs = fh['basis'].str.split(',',expand = True)

我想通过添加" b"来重命名所有变量。到数字标题。这有效:

 n = list(bs)
 for x in n:
     bs.rename(columns={x : 'b' + str(x)},inplace = True)

但是我怀疑一个lambda函数会更好。但是,这不起作用:

 bs.rename(columns=lambda x: x = 'b' + str(x), inplace=True)

我认为lambda是一个函数,所以如果我传入一个列标题,我可以追加一个' b'它。但是" ="抛出错误。任何快速观察将非常感激。 干杯!

3 个答案:

答案 0 :(得分:6)

我使用add_prefix()

In [5]: bs = pd.DataFrame(np.random.rand(3,5))

In [6]: bs
Out[6]:
          0         1         2         3         4
0  0.521593  0.088293  0.623103  0.099417  0.983149
1  0.009741  0.465654  0.414261  0.024086  0.039543
2  0.476219  0.918162  0.900815  0.126549  0.112388

In [7]: bs.add_prefix('b')
Out[7]:
         b0        b1        b2        b3        b4
0  0.521593  0.088293  0.623103  0.099417  0.983149
1  0.009741  0.465654  0.414261  0.024086  0.039543
2  0.476219  0.918162  0.900815  0.126549  0.112388

答案 1 :(得分:5)

使用'b'转换为str后,只需将列添加到astype,就可以更轻松地完成此任务:

In [2]:
df = pd.DataFrame(columns=np.arange(5))
df

Out[2]:
Empty DataFrame
Columns: [0, 1, 2, 3, 4]
Index: []

In [4]:
df.columns = 'b' + df.columns.astype(str)
df.columns

Out[4]:
Index(['b0', 'b1', 'b2', 'b3', 'b4'], dtype='object')

答案 2 :(得分:1)

AHHHH!当然我认为它甚至可以提交它。

 bs.rename(columns=lambda x: 'b' + str(x), inplace=True)

当然是答案。等号是多余的,无论是在":"是函数将返回或"等于"。这是正确的想法吗?