如何匹配StanfordNLP regexNER中的括号?

时间:2017-04-06 10:29:18

标签: regex stanford-nlp

我想使用StanfordNLP regexner通过使用字典列表来注释一些数据。 不幸的是,我无法匹配模式中的括号,如:

"Iq (mA) max"

匹配应为"Iq" or "Iq (mA) max"

我尝试了不同的正则表达式,例如

Iq(\s\(\smA\s\)\smax)?  
Iq(\\s\\(\\smA\\s\\)\\smax)?

但没有任何效果。它总是匹配"Iq"
有人可以帮忙吗? 完全可以使用正则表达式吗?

1 个答案:

答案 0 :(得分:1)

您的规则应采用以下格式:

Iq -LRB- mA -RRB- max    ENTITY    MISC    1

如果您希望Iq之后的所有内容都是可选的,我认为最简单的方法就是只用Iq编写一个单独的规则

RegexNER规则开头的空格分隔列表中的每个元素都是一个与TOKEN匹配的正则表达式,因此如果添加问号,可以使模式中的某些标记可​​选,但是我可以不确定是否有一种方法可以将它们全部作为一组选择。