所以我一直在尝试使用spacy来标记文本,而且几天前在同一个程序中我能够做到这一点。然而,当我今天尝试使用它时,我发现当我尝试输出(而不仅仅是打印)unicode之外的任何类型的标签时,我只会得到空白。为了确保它与我的程序无关,我打开了一个新的virtualenv,再次导入了spacy,并使用了标记文档代码而没有改变任何东西。确定'doc'变量的所有内容似乎都运行正常,当我在unicode中打印标签(没有下划线)时,它的工作正常。
我仍然无法输出任何类型的标签。在这一点上,我不知道我需要做什么。可能出现什么问题?
import spacy
nlp = spacy.load('en')
doc = nlp(u'They told us to duck.')
for word in doc:
print(word.text, word.lemma, word.lemma_, word.tag, word.tag_, word.pos, word.pos_)