从数据框Python中删除子字符串

时间:2016-11-15 03:49:00

标签: python pandas

大家好我是Python的新手,我想从数据框中的一行中删除一些字符。问题是我有几个国家,所有国家都在括号内有不同的信息,所以我尝试过替换和一些通配符,但根本没用。

第1栏 国家(其他信息)

并且想得到:

第1栏 国家

2 个答案:

答案 0 :(得分:3)

选项1
Column 1

中替换
df['Column 1'].str.replace(r'\s*\(.*\)', '')

0    Country
Name: Column 1, dtype: object

选项2
得到整个df

df.stack().str.replace(r'\s*\(.*\)', '').unstack()

enter image description here

答案 1 :(得分:1)

使用.str.split()方法的另一种解决方案:

DF:

In [29]: df
Out[29]:
                                  Column1
0                    Country (Other info)
1  Yet another country (yet another info)

解决方案:

In [30]: df.Column1.str.split(r'\s*\(').str[0]
Out[30]:
0                Country
1    Yet another country
Name: Column1, dtype: object