spaCy的Matcher模式中是否存在OR运算符?

时间:2018-11-21 11:33:40

标签: python-3.x nlp spacy

使用spaCy 2.x,如何根据词性提取名词短语?我想在spaCy的Matcher中使用模式,但是组合太多,无法手动创建它们。

实际上,按照我的逻辑,名词短语是由一个或多个标记组成的一组,这些标记:

  • 必须以NOUN令牌结尾
  • 还可以在结束NOUN令牌之前以任何顺序包含零个,一个或多个ADJ, PROPN, NOUN令牌

例如:

  • NOUN ADJ NOUN
  • NOUN
  • ADJ ADJ NOUN NOUN

是否有一个“或”运算符,所以我可以使用如下所示的模式(例如,使用匹配的POS数组)?

matcher.add(

    'NounPhrases', 
    None, 
    [
        {'POS': ['ADJ','NOUN','PROPN'], 'OP': '*'},
        {'POS': 'NOUN'}
    ]
)

0 个答案:

没有答案