作为NLP和spaCy的新手,我希望能够确定一个陈述是否描述了一个状态(一个人)或一个动作。
在spaCy的一个简单测试中,我认为所用动词的引理属性有助于表明这一点。我尝试了以下两句话。
1)我是netflix用户 给出了这些令牌结果: 我 - PRON 我 - VERB a - DET netflix - NOUN 订阅者 - NOUN
动词'am'的引理是u'be'
2)我导航到起始页面 给出了这些令牌结果: 我 - PRON 导航 - VERB 到 - ADP - DET 开始 - NOUN 页面 - NOUN
动词'导航'的引理是u'be'。
所以依靠这个引理是行不通的。什么适用于上述例子?一般来说呢?
感谢您的期待。
科林戈德堡答案 0 :(得分:0)
稍后再看这个,我再次测试了第二个语句 - 孤立地。
即。 声明:“我导航到起始页面”
doc = nlp(u'I navigate to the start page')
for token in doc:
print('{} - {}'.format(token, token.pos_))
I - PRON
navigate - VERB
to - ADP
the - DET
start - NOUN
page - NOUN
t = doc[1]
t.lemma_
u'navigate'
即。我现在可以通过使用lemma_函数来区分这两个陈述 - 就我的目标而言。
所以我之前遇到的问题是在测试第二个语句之前没有清除doc的内容。我应该看到过这个,但我没有。同时第二次分配到doc(即doc = nlp(你导航到起始页面))没有覆盖以前的值 - 这对我来说并不明显。
感谢您阅读本文。
科林戈德堡