在Nltk中,在清理每行中的文本时,如何将备用词组合到同一行中?目前它显示为不同的项目

时间:2016-12-21 10:30:47

标签: nltk

enter image description here

理想情况下,第1行,第2行和第4行应合并为一行。此输出是在完成Stemming,Lemmatizing,BeautifulSoup并使用仅保留字母等的正则表达式之后...

如果有任何方法可以将这些不同的行组合起来实际上意味着相同的话,请帮助我 - 目前看起来不同,因为这些词是互换的。

谢谢&问候 马德汉

0 个答案:

没有答案