分隔熊猫列并存储特定值

时间:2020-03-31 12:29:09

标签: python-3.x pandas split delimiter

我遇到一种情况,我想以某种方式对一列进行定界,如果应该返回信息,则只能以一定的量来定界。 pandas列具有以下格式的数据:

Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'

我只想从上面得到以下内容:

Office 1

,并且此替换必须应用于列中的每个条目。

我应该如何实现?

2 个答案:

答案 0 :(得分:1)

在正则表达式中使用大熊猫string extract:正则表达式将搜索||,提取值,然后您可以去除任何空格。

text = 'Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'
df = pd.DataFrame([text])

df['extract'] = df[0].str.extract(r'((?<=\|\|).*)')
df['extract'] = df['extract'].str.strip()
print(df)

       0                                                extract
0   Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, ||...   Office 1

答案 1 :(得分:0)

使用str.split()

text = 'Turkey (A)- ABC - CDESS - CDS DEE 10. AAAA, || Office 1'
df = pd.DataFrame([text])
print(df[0].str.split('\|\|', expand=True)[1])

0     Office 1
Name: 1, dtype: object