Question

我正在尝试删除第1列中存在的第2列中的字符串。例如：

第1列：aBcdefGH
第2栏：aBcdefGHxxxxxzzzaBcdefGH

我只想保留 xxxxxzzz ，因为 aBcdefGH 存在于第1列中。我试图这样做通过如下的替换方法无济于事：

df['Column 2'] = df['Column 2'].replace(df['Column 1'], "")

我什至尝试对其进行迭代，但效果不佳：

for i in df:
    rem_str = df['Column 1']
    df['Column 2'] = df['Column 2'].replace(rem_str, "")

关于如何进行这项工作的任何想法？谢谢

Answer 1

使用list Comprehension（假设没有nan和数据是干净的）：

[y.replace(x,'') for x,y in zip(df['Column 1'], df['Column 2'])]

Answer 2

您做对了，只需使用regex=True：

df['Column 2'].replace(df1['Column 1'], "", regex=True, inplace=True)

# xxxxxzzz