我有一个带有列标题的数据框,我想用定界符'__'进行拆分,并且仅将第一部分用作列名。
例如
开始
Red__34343 Green__485838384 Blue__3
0
1
2
3
输出
Red Green Blue
0
1
2
3
答案 0 :(得分:3)
您可以尝试extract
:
df.columns = df.columns.str.extract('(.*)__')[0]
输出:
0 Red Green Blue
0 0 NaN NaN
1 1 NaN NaN
2 2 NaN NaN
3 3 NaN NaN
答案 1 :(得分:2)
使用str.split
:
df.columns=df.columns.str.split('__',expand=True).get_level_values(0)
df.columns
#Index(['Red', 'Green', 'Blue'], dtype='object')
或作为 @ anky_91 建议
df.columns=df.columns.str.split('__').str[0]