嗨,所以我有一个数据框,其列名以'2018'结尾
我需要从这些列名称中删除年份,并且遇到了一些麻烦。我还需要从这些列名称中删除前导和尾随空格。
我已经尝试了以下方法:
df.columns.str.replace('\d+',"") #to try and remove the numbers from the column names
df.columns = df.columns.str.strip('') #to try and get rid of the spaces
这些对数据框没有任何作用。
我希望列名从“ Stock 2018”变为“ Stock”
但是这没有发生。谢谢您的帮助!
答案 0 :(得分:0)
您没有使用正确的方法重命名熊猫中的列:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.rename.html
从文档中看来,您可以简单地执行以下操作:
df = df.rename(str.replace('\d+',""), axis='columns')
让我知道这是否适合您。
答案 1 :(得分:0)
您只需要分配给df.columns
即可删除数字,也无需将任何内容传递给str.strip()
即可删除前导/后缀空白字符。
df.columns=df.columns.str.replace('\d+','').str.strip()
答案 2 :(得分:0)
您也可以尝试使用正则表达式。
>>> df = pd.DataFrame.from_dict({'Name04': ['Chris', 'Joe', 'Karn', 'Alina'], 'Age04': [14, 16, 18, 21], 'Weight04': [15, 21, 37, 45]})
>>> df
Age04 Name04 Weight04
0 14 Chris 15
1 16 Joe 21
2 18 Karn 37
3 21 Alina 45
regex
的结果:>>> df.columns = df.columns.str.replace(r'\d+', '')
>>> df
Age Name Weight
0 14 Chris 15
1 16 Joe 21
2 18 Karn 37
3 21 Alina 45