我正在进行文本分类,并且我有一个包含文本数据的客户评论数据集,该数据集已经是小写字母,单词标记化和停用词也已删除。现在的问题是,当我尝试fit_transform训练数据集时,我的TFIDF矢量化器抛出错误。
反过来说,是否可以使tfidf矢量化程序与已标记化的文本一起使用?
tf_idf_vectorizer = TfidfVectorizer(ngram_range =(1,2),max_df = 0.50,stop_words = stop_words_english,小写= False)
Features_train_Tfidf = tf_idf_vectorizer.fit_transform(Features_train)
TypeError:预期的字符串或类似字节的对象