am使用Python和RegexpParser,我想编写这样的语法:
<JJ><NN><anything>
<RB><JJ><not NN nor NNT>
我很难用正则表达式表达(也不,不是...)
...
答案 0 :(得分:0)
例如,下面的语法是:
grammar = """ P: {<NN><VBD><JJ><CC><JJ>}
{<NN><VBD><JJ>}
"""
分块器:
PChunker = RegexpParser(grammar)
句子是:
sentence = ['The', 'pizza', 'was', 'good', 'but', 'pasta', 'was', 'bad']
运行以下代码后:
print("sentence : ",PChunker.parse(pos_tag(sentence)))
结果将是:
sentence : (S
The/DT
(P pizza/NN was/VBD good/JJ)
but/CC
(P pasta/NN was/VBD bad/JJ))