如何从数据框中的所有列名称/标题中删除数字

时间:2019-06-10 14:55:03

标签: python pandas iteration renaming

嗨,所以我有一个数据框,其列名以'2018'结尾

我需要从这些列名称中删除年份,并且遇到了一些麻烦。我还需要从这些列名称中删除前导和尾随空格。

我已经尝试了以下方法:

df.columns.str.replace('\d+',"") #to try and remove the numbers from the column names

df.columns = df.columns.str.strip('') #to try and get rid of the spaces

这些对数据框没有任何作用。

我希望列名从“ Stock 2018”变为“ Stock”

但是这没有发生。谢谢您的帮助!

3 个答案:

答案 0 :(得分:0)

您没有使用正确的方法重命名熊猫中的列:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.rename.html

从文档中看来,您可以简单地执行以下操作:

df = df.rename(str.replace('\d+',""), axis='columns')

让我知道这是否适合您。

答案 1 :(得分:0)

您只需要分配给df.columns即可删除数字,也无需将任何内容传递给str.strip()即可删除前导/后缀空白字符。

df.columns=df.columns.str.replace('\d+','').str.strip()

答案 2 :(得分:0)

您也可以尝试使用正则表达式。

示例数据框:

>>> df = pd.DataFrame.from_dict({'Name04': ['Chris', 'Joe', 'Karn', 'Alina'], 'Age04': [14, 16, 18, 21], 'Weight04': [15, 21, 37, 45]})                                 

>>> df
   Age04 Name04  Weight04
0     14  Chris        15
1     16    Joe        21
2     18   Karn        37
3     21  Alina        45

使用regex的结果:

>>> df.columns = df.columns.str.replace(r'\d+', '')
>>> df
   Age   Name  Weight
0   14  Chris      15
1   16    Joe      21
2   18   Karn      37
3   21  Alina      45