Pandas>删除以反斜杠结尾的字符串,并在反斜杠之后保留字符串?

时间:2020-08-25 07:16:26

标签: regex pandas dataframe window

我如何摆脱上一个反斜杠(包括反斜杠)之前的所有字母,我只想保留其余部分。但是我不知道如何编写代码,

*原始数据框(来自xlsx文件) BS1 \ CB \ A2C40001444 42.3 BS1 \ CB \ A2C40006231 32.1 BS1 \ A2C01345300 44.45 BS1 \ A2C01345300 44.45 BS1 \ CB \ A2C01345300 44.4

*必填数据帧 A2C40001444 42.3 A2C40006231 32.1 A2C01345300 44.45 A2C01345300 44.45 A2C01345300 44.4

1 个答案:

答案 0 :(得分:1)

reg expr摘录为您完成

  1. 获取上一个反斜杠之前的所有文本
  2. 将上一个反斜杠之后的所有内容加入比赛组
df = pd.read_csv(io.StringIO("""text val
BS1\CB\A2C40001444 42.3 
BS1\CB\A2C40006231 32.1 
BS1\A2C01345300 44.45 
BS1\A2C01345300 44.45 
BS1\CB\A2C01345300 44.4"""), sep="\s+")

df["text"] = df["text"].str.extract("^[\w\\\]*\\\\(.*)")

print(df.to_string(index=False))

输出

        text    val
 A2C40001444  42.30
 A2C40006231  32.10
 A2C01345300  44.45
 A2C01345300  44.45
 A2C01345300  44.40