Question

我正在处理代码，错误发生在第一行对于for循环块，即使发生错误，语料库变量仍会被某些条目更新请帮我删除此错误

for i in range (0 ,N):
    data = re.sub('[^a-z A-Z]','',reciept['subject'][i])
    data=data.lower()
    data=data.split()
    data=[word for word in data if word not in set(stopwords.words('english'))]
    from nltk.stem.porter import PorterStemmer
    ps=PorterStemmer()
    data=[ps.stem(word) for word in data if word not in set(stopwords.words('english'))]
    data=' '.join(data)
    corpus_recipt.append(data)

错误如下所示 TypeError：期望的字符串或类似字节的对象

Answer 1

我的猜测是问题reciept['subject'][i]没有拉字符串。您可以在该行之前快速print(reciept['subject'][i])并检查。

TypeError：期望的字符串或类似字节

1 个答案: