在已标记化文本上的TFIDF矢量化器

时间:2019-05-23 20:35:58

标签: tfidfvectorizer

我正在进行文本分类,并且我有一个包含文本数据的客户评论数据集,该数据集已经是小写字母,单词标记化和停用词也已删除。现在的问题是,当我尝试fit_transform训练数据集时,我的TFIDF矢量化器抛出错误。

反过来说,是否可以使tfidf矢量化程序与已标记化的文本一起使用?

tf_idf_vectorizer = TfidfVectorizer(ngram_range =(1,2),max_df = 0.50,stop_words = stop_words_english,小写= False)

Features_train_Tfidf = tf_idf_vectorizer.fit_transform(Features_train)

TypeError:预期的字符串或类似字节的对象

0 个答案:

没有答案