这是问题所在。让我们说,我有这条规则:
{
pattern: ( [ner:/DATE|TIME/] ),
action: ( Annotate($0, myNER, "MY_DATETIME" ) )
}
如何指定整个文档,而不是注释捕获组$ 0,而不是这样:
{
pattern: ( [ner:/DATE|TIME/] ),
action: ( Annotate( <document>, myNER, "MY_DATETIME" ) )
}
这可以是一个非常有用的功能,允许在找到特定的标记模式时注释整个文档(或者可能是一个句子)。感谢。
答案 0 :(得分:0)
目前尚未实施此方法。没有通过TokensRegex直接访问代表文档的CoreMap的方法。
每个令牌都必须具有指向文档CoreMap的指针,然后您可以通过查看特定令牌来访问TokensRegex规则中的整个文档,但这需要对代码进行一些更改。 / p>
如果您想打开GitHub问题,我们可以尝试在将来的版本中添加此功能。