我正在尝试在pandas中拆分包含文本的列。
此列包含“Alpha”,“Beta”字样。 我需要在这些单词之后拆分此列,这些单词和所有内容之前需要放在一列中以及此后的所有内容都在新列中。
我试过了:
2.0.0
但是在ALPHA之前我失去了一切
答案 0 :(得分:1)
IIUC您可以split
使用正则表达式r'Alpha|Beta'
- 这意味着Alpha
或Beta
:
print df
text
0 aaa Alpha bbb
1 ddd Alpha ccc
2 uuu Beta vvv
split_df = df['text'].str.split(r'Alpha|Beta').apply(pd.Series)
split_df.columns = ['before','after']
print split_df
before after
0 aaa bbb
1 ddd ccc
2 uuu vvv