考虑以下pandas数据帧:
df = pd.DataFrame({'t': [1,2,3], 'x1': [4,5,6], 'x2': [7,8,9]} )
>>> print(df)
t x1 x2
0 1 4 7
1 2 5 8
2 3 6 9
我想将一个函数(比如乘以2)应用于名称中包含字符' x'
的列这可以通过以下方式完成:
df.filter(regex='x').apply(lambda c: 2*c)
但没有到位。我的解决方案是:
tmp = df.filter(regex='x')
tmp = tmp.apply(lambda c: 2*c)
tmp['t'] = df['t']
df = tmp
其中包含更改列顺序的附加问题。有没有更好的办法?
答案 0 :(得分:3)
IIUC你可以这样做:
In [239]: df.apply(lambda x: x*2 if 'x' in x.name else x)
Out[239]:
t x1 x2
0 1 8 14
1 2 10 16
2 3 12 18
<强>更新强>
In [258]: df.apply(lambda x: x*2 if 'x' in x.name else x) \
.rename(columns=lambda x: 'ytext_{}_moretext'.format(x[-1]) if 'x' in x else x)
Out[258]:
t ytext_1_moretext ytext_2_moretext
0 1 8 14
1 2 10 16
2 3 12 18
答案 1 :(得分:1)
使用df.columns.str.contains('x')
获取布局掩码以切片df
df.loc[:, df.columns.str.contains('x')] *= 2
print(df)
t x1 x2
0 1 8 14
1 2 10 16
2 3 12 18
更通用
def f(x):
return 2 * x
m = df.columns.str.contains('x')
df.loc[:, m] = f(df.loc[:, m])
print(df)
t x1 x2
0 1 8 14
1 2 10 16
2 3 12 18
使用apply
m = df.columns.str.contains('x')
df.loc[:, m] = df.loc[:, m].apply(f)
print(df)
t x1 x2
0 1 8 14
1 2 10 16
2 3 12 18