参考:Pandas DataFrame: remove unwanted parts from strings in a column
参考上面链接中提供的答案。我已经研究了一些正则表达式,我打算深入研究,但与此同时我可以使用一些帮助。
我的数据框如下:
DF:
c_contofficeID
0 0109
1 0109
2 3434
3 123434
4 1255N9
5 0109
6 123434
7 55N9
8 5599
9 0109
Psuedo Code
如果前两个字符是12则删除它们。或者,在前两个字符中没有12的字符中添加12。
结果如下:
c_contofficeID
0 0109
1 0109
2 3434
3 3434
4 55N9
5 0109
6 3434
7 55N9
8 5599
9 0109
我使用上面链接中的答案作为起点:
df['contofficeID'].replace(regex=True,inplace=True,to_replace=r'\D',value=r'')
我尝试过以下方法:
尝试1)
df['contofficeID'].replace(regex=True,inplace=True,to_replace=r'[1][2]',value=r'')
尝试2)
df['contofficeID'].replace(regex=True,inplace=True,to_replace=r'$[1][2]',value=r'')
尝试3)
df['contofficeID'].replace(regex=True,inplace=True,to_replace=r'?[1]?[2]',value=r'')