Python数据框在特定字符之前删除子字符串

时间:2020-09-03 08:01:33

标签: python dataframe substring strip

我正在尝试删除名称列中“-”之前的数字。但并非所有行都在名称前加上数字。如何删除有数字的行中的数字,并使前面没有数字的行保持不变?

样本df:

country     Name
UK          5413-Marcus
Russia      5841-Natasha
Hong Kong   Keith
China       7777-Wang

所需的df

country     Name
UK          Marcus
Russia      Natasha
Hong Kong   Keith
China       Wang

感谢您的协助!预先感谢!

2 个答案:

答案 0 :(得分:2)

Pandas具有用于系列的字符串访问器。如果拆分并获取结果列表的最后一个元素,即使一行没有分号“-”,您仍然希望该单元素列表的最后一个元素。

df.Name = df.Name.str.split('-').str.get(-1)

答案 1 :(得分:1)

您可以通过以下方式将str.lstrip用于该任务:

import pandas as pd
df = pd.DataFrame({'country':['UK','Russia','Hong Kong','China'],'Name':['5413-Marcus','5841-Natasha','Keith','7777-Wang']})
df['Name'] = df['Name'].str.lstrip('-0123456789')
print(df)

输出:

     country     Name
0         UK   Marcus
1     Russia  Natasha
2  Hong Kong    Keith
3      China     Wang

.lstrip确实删除了前导字符,.rstrip后缀和.strip