用定界符分割熊猫列名称

时间:2019-11-07 17:08:22

标签: pandas split

我有一个带有列标题的数据框,我想用定界符'__'进行拆分,并且仅将第一部分用作列名。

例如

开始

    Red__34343    Green__485838384    Blue__3
0
1
2
3

输出

    Red    Green    Blue
0
1
2
3

2 个答案:

答案 0 :(得分:3)

您可以尝试extract

df.columns = df.columns.str.extract('(.*)__')[0]

输出:

0  Red  Green  Blue
0    0    NaN   NaN
1    1    NaN   NaN
2    2    NaN   NaN
3    3    NaN   NaN

答案 1 :(得分:2)

使用str.split

df.columns=df.columns.str.split('__',expand=True).get_level_values(0)
df.columns
#Index(['Red', 'Green', 'Blue'], dtype='object')

或作为 @ anky_91 建议

df.columns=df.columns.str.split('__').str[0]