使用NLTK进行分块括号

时间:2017-03-31 08:59:48

标签: python regex nltk chunking

我正在使用NLTK,我正在尝试从以下文本中填充(AIM 20-40-60)

text = for more information refer to the Business Reporting Policy (AIM 20-40-60)

目前我正在使用以下大块模式grammar = r"CHUNK:{<NN.*><CD>}",它能够完美捕获AIM 20-40-60部分。

尽管如此,我还希望括号()也是块的一部分,因为我对正则表达式和分块相对较新,我不知道捕获括号的确切regEX模式。

1 个答案:

答案 0 :(得分:0)

解决方案是下面的

grammar = r"CHUNK:{<\(><NNP><CD><\)>}"