我正在处理代码,错误发生在第一行 对于for循环块,即使发生错误,语料库变量仍会被某些条目更新 请帮我删除此错误
for i in range (0 ,N):
data = re.sub('[^a-z A-Z]','',reciept['subject'][i])
data=data.lower()
data=data.split()
data=[word for word in data if word not in set(stopwords.words('english'))]
from nltk.stem.porter import PorterStemmer
ps=PorterStemmer()
data=[ps.stem(word) for word in data if word not in set(stopwords.words('english'))]
data=' '.join(data)
corpus_recipt.append(data)
错误如下所示 TypeError:期望的字符串或类似字节的对象
答案 0 :(得分:0)
我的猜测是问题reciept['subject'][i]
没有拉字符串。您可以在该行之前快速print(reciept['subject'][i])
并检查。