Question

我需要在Python3中隔离长自然文本的每个单词。

更有效的方法是什么？

Answer 1

如果您的文字已经拆分成句子，请使用

tokens = nltk.word_tokenize(sentence)

（参见tokenization的NLTK）。

如果您需要先按句子分割，请查看this part（有代码示例）。