标签: python string pandas dataframe extract
我正在尝试使用str.extract()提取我的数据帧的一行中的任何单词,但我最终只得到一个单词。例如,在我的数据框的一列中:
var1 THIS IS A STRING
当我使用时:
df['words'] = df['var1'].str.extract('([A-Z]\w{0,})')
输出
var1 words THIS IS A STRING THIS
如何提取整个短语'这是一个字符串?
谢谢!
答案 0 :(得分:0)
IIUC您可以使用split任意空格\s+然后apply Series:
split
\s+
apply
Series
print df var1 0 THIS IS A STRING print df.var1.str.split('\s+').apply(pd.Series) 0 1 2 3 0 THIS IS A STRING