我遇到一种情况,我想以某种方式对一列进行定界,如果应该返回信息,则只能以一定的量来定界。 pandas列具有以下格式的数据:
Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'
我只想从上面得到以下内容:
Office 1
,并且此替换必须应用于列中的每个条目。
我应该如何实现?
答案 0 :(得分:1)
在正则表达式中使用大熊猫string extract:正则表达式将搜索||,提取值,然后您可以去除任何空格。
text = 'Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'
df = pd.DataFrame([text])
df['extract'] = df[0].str.extract(r'((?<=\|\|).*)')
df['extract'] = df['extract'].str.strip()
print(df)
0 extract
0 Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, ||... Office 1
答案 1 :(得分:0)
使用str.split()
text = 'Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'
df = pd.DataFrame([text])
print(df[0].str.split('\|\|', expand=True)[1])
0 Office 1
Name: 1, dtype: object