我想使用StanfordNLP regexner通过使用字典列表来注释一些数据。 不幸的是,我无法匹配模式中的括号,如:
"Iq (mA) max"
匹配应为"Iq" or "Iq (mA) max"
我尝试了不同的正则表达式,例如
Iq(\s\(\smA\s\)\smax)?
Iq(\\s\\(\\smA\\s\\)\\smax)?
但没有任何效果。它总是匹配"Iq"
有人可以帮忙吗?
完全可以使用正则表达式吗?
答案 0 :(得分:1)
您的规则应采用以下格式:
Iq -LRB- mA -RRB- max ENTITY MISC 1
如果您希望Iq之后的所有内容都是可选的,我认为最简单的方法就是只用Iq
编写一个单独的规则
RegexNER规则开头的空格分隔列表中的每个元素都是一个与TOKEN匹配的正则表达式,因此如果添加问号,可以使模式中的某些标记可选,但是我可以不确定是否有一种方法可以将它们全部作为一组选择。