替换pandas df列名中的字符串

时间:2015-11-05 11:24:40

标签: python regex

我在pandas中有一个数据框,列名为“string_string”,我试图通过删除“_”和后面的字符串来重命名它们。例如,我想将“12527_AC9E5”更改为“12527”。我试过使用各种替换选项,我可以替换字符串的特定部分(例如,我可以替换所有“_”),但是当我引入通配符时,我没有达到预期的结果。

以下是我认为可行的一些事情,但事实并非如此。如果我删除他们工作的外卡(即,他们替换_)。

df = df.rename(columns=lambda x: x.sub('_.+', ''))

df.columns = df.columns.str.replace('_.+','')

任何帮助表示赞赏

1 个答案:

答案 0 :(得分:15)

只需分开' _'并采取第一个元素。你可以利用字典理解:

onResume