标签: python python-3.x nlp corpus word-frequency
我有一个名为SubIMDB的大型英语语料库,我想列出所有单词的频率。意思是他们在整个语料库中出现了多少。此频率列表应具有一些特征:
我的问题是:
非常感谢您。
答案 0 :(得分:0)
如上所述,问题是基于观点的且含糊不清,但以下是一些指示:
PorterStemmer
spaCy
counter
pickle