使用spaCy 2.x,如何根据词性提取名词短语?我想在spaCy的Matcher
中使用模式,但是组合太多,无法手动创建它们。
实际上,按照我的逻辑,名词短语是由一个或多个标记组成的一组,这些标记:
ADJ, PROPN, NOUN
令牌例如:
NOUN ADJ NOUN
NOUN
ADJ ADJ NOUN NOUN
是否有一个“或”运算符,所以我可以使用如下所示的模式(例如,使用匹配的POS数组)?
matcher.add(
'NounPhrases',
None,
[
{'POS': ['ADJ','NOUN','PROPN'], 'OP': '*'},
{'POS': 'NOUN'}
]
)