我正在使用stanford nlp tokenRegex进行标记化。我正在使用正则表达式文件。以下是我使用的规则。
Rule 1
:
{
ruleType:"tokens",
pattern:([{tag:/NN/}|{tag:/NNP/}]),
result:"Single noun"
}
Rule 2
{
ruleType: "tokens",
pattern:([{tag:/NN.*/}|{tag:/CD*/}]),
result : "Noun with Number"
}
我给出的句子是Take note with the Samsung Notebook 9 Pen
,我得到了以下结果
注意 - >单一名词
Samsung Notebook 9 Pen - >名字用数字
即使三星,笔记本,笔......的POS是NN
,它也被排除在外。
它不会被rule1
捕获,即rule 2
排除的rule 1
被function based view
排除。
有没有办法匹配这两个规则?