段落:I love apple. I eat one banana a day
句子:I love apple.
,I eat one banana a day
本段中有两个句子I love apple
和I eat one banana a day
。如果我将整个段落放入spaCy,它只会识别一个实体,例如apple
,但如果我将句子逐个放入,spaCy可以识别两个实体apple
和banana
。(这只是表明我的观点的一个例子,实际识别结果可能不同)
在我自己训练模型后,我想评估模型的识别准确性,有两种方法可以将文本传递给spaCy模型:
1.将段落分成句子并逐句传递
for sentence in paragraph:
doc = nlp(sentence)
# retrieve the parsing result
2.立即通过该段落
doc = nlp(paragraph)
# retrieve the parsing result
获取文档后,识别我对文档感兴趣的所有实体。
谢谢!