我建立了一个单词分类模型,将单个单词分类为“术语”或“非术语”。现在我输入的是句子列表。我需要使用我的模型来找出每个句子中有多少个“词”。输入是一个句子列表,经过预处理后,它看起来像这样:
所以我写了代码:
predicted = []
for sentence in dataset.text:
for word in sentence:
predicted.append(Model.predict(word))
我希望输出的结果像是[预测] = [[非项,非项],[非项],[项],[非项],.....]。因此,以后计算每个句子的“术语”数量会更容易。 但是,我遇到了“ ValueError:可对原始文本文档进行迭代,接收到字符串对象”。 如果我只使用一个单词作为输入,例如:
word = ['man']
predicted = Model.predict(word)
print predicted
==>'non-term'
然后正常工作。 如果有人可以帮助我解决此问题,我将不胜感激。谢谢!