Question

因此，我有一个带有一些奇怪后缀的数据帧，例如_a或_b映射到某些代码，我想知道如何根据后缀添加前缀，并删除后缀以使其更易于理解。

即：

    red_a    blue_a    green_b
....
....

到

    A red    A blue   B green
....
....

我尝试了

for col in df.columns:
    if col.endswith('_a'):
        batch_match[col].replace('_a', '')
        batch_match[col].add_prefix('A ')
    else:
        batch_match[col].add_prefix('B ')

但是它返回NaN的df。

Answer 1

您可以将pandas.DataFrame.rename与客户映射器一起使用

df = pd.DataFrame(
    {"red_a": ['a', 'b', 'c'], "blue_a": [1, 2, 3], 'green_b': ['x', 'y', 'z']}
)

def renamer(col):
    if any(col.endswith(suffix) for suffix in ['_a', '_b']):
        prefix = col[-1]                        # use last char as prefix
        return prefix.upper() + " " + col[:-2]  # add prefix and strip last 2 chars
    else:
        return col

df = df.rename(mapper=renamer, axis='columns')
print(df)
#   A blue B green A red
#0       1       x     a
#1       2       y     b
#2       3       z     c

Answer 2

我会做什么

df.columns=df.columns.str.split('_').map(lambda x : '{} {}'.format(x[1].upper(),x[0]))
df
Out[512]: 
  A red  A blue B green
0     a       1       x
1     b       2       y
2     c       3       z

在列名称中添加条件前缀

2 个答案: