任何人都可以告诉我应该改变什么
我试图用英语来应用基本的词干,我的目的是在pandas数据帧列中取每个单词的前4个字母,然后将结果作为输入放入TfidfVectorizer
,作为回报我得到:< / p>
TypeError:期望的字符串或缓冲区
代码在下面
list_stem=pd_text["newtext"].str.split()
list_stem_df=pd.DataFrame({'text':list_stem.values})
results=[]
results_df=[]
for i in range (0,len(list_stem_df)):
letters = [word[0:4] for word in list_stem_df["text"][i]]
results.append(letters)
a=' '.join(results[i])
results_df.append(a)
results_df
text_stemming = pd.DataFrame(results_df, columns=['text'])