标签: python-3.x nlp
我需要在Python3中隔离长自然文本的每个单词。
更有效的方法是什么?
答案 0 :(得分:0)
如果您的文字已经拆分成句子,请使用
tokens = nltk.word_tokenize(sentence)
(参见tokenization的NLTK)。
如果您需要先按句子分割,请查看this part(有代码示例)。