存储TfidfVectorizer供将来使用

时间:2018-11-25 06:12:44

标签: python scikit-learn

我需要存储一个TfidfVectorizer以便将来使用。在this post之后,我做了以下操作-

map

然后在单独的烧瓶服务中,我在下面进行

function pyramid(h) {
  return Array(h).fill('*')
    .map((s, i) =>
      ' '.repeat(h - i - 1) +
      s.repeat(i + 1).split('').join(' ') +
      ' '.repeat(h - i - 1))
    .join('\n');
}

console.log(pyramid(3));
console.log(pyramid(4));
console.log(pyramid(5));

但是我遇到了错误

tfidf_vect = TfidfVectorizer(analyzer='word', token_pattern=r'\w{1,}', max_features=5000)
pickle.dump(tfidf_vect, open("vectorizer.pickle", "wb"))

不确定我缺少什么。有人可以建议吗?

1 个答案:

答案 0 :(得分:1)

您忘记首先拟合模型:

tfidf_vect = TfidfVectorizer(analyzer='word', token_pattern=r'\w{1,}', max_features=5000)
tfidf_vect.fit() <-- pass your training data!
pickle.dump(tfidf_vect, open("vectorizer.pickle", "wb"))