我有一个熊猫数据框,我想从我的栏中删除所有停用词
df
tweets
0 hey good morning
1 hey good afternoon
2 hmm this is good.
所需的输出:
tweets
0 good morning
1 good afternoon
2 this good.
答案 0 :(得分:2)
使用str.replace
:
df.tweets.str.replace(r'\b(\w{1,3})\b', '')
0 good morning
1 good afternoon
2 this good.
Name: tweets, dtype: object