使用df [' var']。str.extract()(Python)查找多个单词?

时间:2016-04-13 18:55:15

标签: python string pandas dataframe extract

我正在尝试使用str.extract()提取我的数据帧的一行中的任何单词,但我最终只得到一个单词。例如,在我的数据框的一列中:

var1
THIS IS A STRING

当我使用时:

df['words'] = df['var1'].str.extract('([A-Z]\w{0,})')

输出

var1                words
THIS IS A STRING    THIS

如何提取整个短语'这是一个字符串?

谢谢!

1 个答案:

答案 0 :(得分:0)

IIUC您可以使用split任意空格\s+然后apply Series

print df
               var1
0  THIS IS A STRING

print df.var1.str.split('\s+').apply(pd.Series)
      0   1  2       3
0  THIS  IS  A  STRING