我有一个熊猫数据框,其中的注释列格式为
import pandas as pd
df = pd.DataFrame({'comment':['aaa bbb ccc not verb ddd']})
df.loc[0,'comment']
'aaa bbb ccc not verb ddd'
我想将not
和它后面的单词连接在一起,在示例verb
中为not_verb
,然后按原样返回该行的其余部分:
'aaa bbb ccc not_verb ddd'
感谢您的帮助。
编辑:
基本上,我想从“ not”连接到其后的单词结尾。
答案 0 :(得分:2)
使用str.replace
:
df.comment.str.replace(r'\b(not\s)', 'not_')
输出:
0 aaa bbb ccc not_verb ddd
Name: comment, dtype: object