文本分类ValueError:可迭代原始文本文档,接收字符串对象

时间:2019-10-12 05:08:35

标签: python nlp text-classification

我建立了一个单词分类模型,将单个单词分类为“术语”或“非术语”。现在我输入的是句子列表。我需要使用我的模型来找出每个句子中有多少个“词”。输入是一个句子列表,经过预处理后,它看起来像这样:enter image description here 所以我写了代码:

predicted = []
for sentence in dataset.text:
    for word in sentence:
        predicted.append(Model.predict(word))

我希望输出的结果像是[预测] = [[非项,非项],[非项],[项],[非项],.....]。因此,以后计算每个句子的“术语”数量会更容易。 但是,我遇到了“ ValueError:可对原始文本文档进行迭代,接​​收到字符串对象”。 如果我只使用一个单词作为输入,例如:

word = ['man']
predicted = Model.predict(word)
print predicted
==>'non-term'

然后正常工作。 如果有人可以帮助我解决此问题,我将不胜感激。谢谢!

0 个答案:

没有答案