我终于摆脱了SPSS的束缚,正在陶醉于熊猫和Python的自由(喜欢它)。但是,我试图更清楚地了解python Lambda函数如何在Pandas中进行交互。它似乎突然出现了很多。这是一个例子,我希望能消除这种模糊。
从字符串拆分创建新数据框后:
bs = fh['basis'].str.split(',',expand = True)
我想通过添加" b"来重命名所有变量。到数字标题。这有效:
n = list(bs)
for x in n:
bs.rename(columns={x : 'b' + str(x)},inplace = True)
但是我怀疑一个lambda函数会更好。但是,这不起作用:
bs.rename(columns=lambda x: x = 'b' + str(x), inplace=True)
我认为lambda是一个函数,所以如果我传入一个列标题,我可以追加一个' b'它。但是" ="抛出错误。任何快速观察将非常感激。 干杯!
答案 0 :(得分:6)
我使用add_prefix():
In [5]: bs = pd.DataFrame(np.random.rand(3,5))
In [6]: bs
Out[6]:
0 1 2 3 4
0 0.521593 0.088293 0.623103 0.099417 0.983149
1 0.009741 0.465654 0.414261 0.024086 0.039543
2 0.476219 0.918162 0.900815 0.126549 0.112388
In [7]: bs.add_prefix('b')
Out[7]:
b0 b1 b2 b3 b4
0 0.521593 0.088293 0.623103 0.099417 0.983149
1 0.009741 0.465654 0.414261 0.024086 0.039543
2 0.476219 0.918162 0.900815 0.126549 0.112388
答案 1 :(得分:5)
使用'b'
转换为str
后,只需将列添加到astype
,就可以更轻松地完成此任务:
In [2]:
df = pd.DataFrame(columns=np.arange(5))
df
Out[2]:
Empty DataFrame
Columns: [0, 1, 2, 3, 4]
Index: []
In [4]:
df.columns = 'b' + df.columns.astype(str)
df.columns
Out[4]:
Index(['b0', 'b1', 'b2', 'b3', 'b4'], dtype='object')
答案 2 :(得分:1)
AHHHH!当然我认为它甚至可以提交它。
bs.rename(columns=lambda x: 'b' + str(x), inplace=True)
当然是答案。等号是多余的,无论是在":"是函数将返回或"等于"。这是正确的想法吗?