因此,我有一个带有一些奇怪后缀的数据帧,例如_a或_b映射到某些代码,我想知道如何根据后缀添加前缀,并删除后缀以使其更易于理解。
即:
red_a blue_a green_b
....
....
到
A red A blue B green
....
....
我尝试了
for col in df.columns:
if col.endswith('_a'):
batch_match[col].replace('_a', '')
batch_match[col].add_prefix('A ')
else:
batch_match[col].add_prefix('B ')
但是它返回NaN的df。
答案 0 :(得分:1)
您可以将pandas.DataFrame.rename
与客户映射器一起使用
df = pd.DataFrame(
{"red_a": ['a', 'b', 'c'], "blue_a": [1, 2, 3], 'green_b': ['x', 'y', 'z']}
)
def renamer(col):
if any(col.endswith(suffix) for suffix in ['_a', '_b']):
prefix = col[-1] # use last char as prefix
return prefix.upper() + " " + col[:-2] # add prefix and strip last 2 chars
else:
return col
df = df.rename(mapper=renamer, axis='columns')
print(df)
# A blue B green A red
#0 1 x a
#1 2 y b
#2 3 z c
答案 1 :(得分:0)
我会做什么
df.columns=df.columns.str.split('_').map(lambda x : '{} {}'.format(x[1].upper(),x[0]))
df
Out[512]:
A red A blue B green
0 a 1 x
1 b 2 y
2 c 3 z