Gensim Word2Vec或FastText从频率构建vocab

时间:2019-12-17 05:48:21

标签: python gensim word2vec fasttext

我想知道gensim中的.build_vocab_from_freq()函数实际上是做什么的?不使用时有什么区别?谢谢!

1 个答案:

答案 0 :(得分:0)

它“从单词频率字典构建词汇表”。您需要gensim模型的词汇表。通常,您是从语料库中构建它的。从根本上讲,这是从单词频率词典构建词汇表的替代方法。例如,单词频率通常用于过滤频率低或频率高的单词,这对您的模型没有意义。