我已经使用joblib序列化了TfidfVectorizer。
如果我想在典型的python脚本中再次使用它,我会做类似的事情:
stemmer = PorterStemmer()
minlen = 1
def tokenize(text):
tokens = nltk.word_tokenize(text)
stems = []
for token in tokens:
stem = stemmer.stem(token)
if len(stem) > minlen:
stems.append(stem)
return stems
tfidf = joblib.load('tfidf.pkl')
这可以正常工作,但是当我在flask应用程序中尝试通过在 routes.py 文件中定义方法tokenize()
或作为类方法尝试执行相同操作时,以下错误消息:
AttributeError: module '__main__' has no attribute 'tokenize'
该如何解决?