Question

我正在尝试删除名称列中“-”之前的数字。但并非所有行都在名称前加上数字。如何删除有数字的行中的数字，并使前面没有数字的行保持不变？

样本df：

country     Name
UK          5413-Marcus
Russia      5841-Natasha
Hong Kong   Keith
China       7777-Wang

所需的df

country     Name
UK          Marcus
Russia      Natasha
Hong Kong   Keith
China       Wang

感谢您的协助！预先感谢！

Answer 1

Pandas具有用于系列的字符串访问器。如果拆分并获取结果列表的最后一个元素，即使一行没有分号“-”，您仍然希望该单元素列表的最后一个元素。

df.Name = df.Name.str.split('-').str.get(-1)

Answer 2

您可以通过以下方式将str.lstrip用于该任务：

import pandas as pd
df = pd.DataFrame({'country':['UK','Russia','Hong Kong','China'],'Name':['5413-Marcus','5841-Natasha','Keith','7777-Wang']})
df['Name'] = df['Name'].str.lstrip('-0123456789')
print(df)

输出：

     country     Name
0         UK   Marcus
1     Russia  Natasha
2  Hong Kong    Keith
3      China     Wang

.lstrip确实删除了前导字符，.rstrip后缀和.strip。

Python数据框在特定字符之前删除子字符串

2 个答案: