我正在使用NLTK,我正在尝试从以下文本中填充(AIM 20-40-60)
:
text = for more information refer to the Business Reporting Policy (AIM 20-40-60)
目前我正在使用以下大块模式grammar = r"CHUNK:{<NN.*><CD>}"
,它能够完美捕获AIM 20-40-60
部分。
尽管如此,我还希望括号()
也是块的一部分,因为我对正则表达式和分块相对较新,我不知道捕获括号的确切regEX模式。
答案 0 :(得分:0)
解决方案是下面的
grammar = r"CHUNK:{<\(><NNP><CD><\)>}"