TypeError:尝试TfidfVectorizer

时间:2018-06-12 13:47:18

标签: python tfidfvectorizer

任何人都可以告诉我应该改变什么

我试图用英语来应用基本的词干,我的目的是在pandas数据帧列中取每个单词的前4个字母,然后将结果作为输入放入TfidfVectorizer,作为回报我得到:< / p>

  

TypeError:期望的字符串或缓冲区

代码在下面

list_stem=pd_text["newtext"].str.split()

list_stem_df=pd.DataFrame({'text':list_stem.values})

results=[]

results_df=[]

for i in range (0,len(list_stem_df)):
    letters = [word[0:4] for word in list_stem_df["text"][i]]
results.append(letters)
a=' '.join(results[i])
results_df.append(a)
results_df
text_stemming = pd.DataFrame(results_df, columns=['text'])

0 个答案:

没有答案