TokensRegex规则可以在文档级别上进行注释吗?

时间:2017-02-08 15:49:56

标签: stanford-nlp

这是问题所在。让我们说,我有这条规则:

{
    pattern: ( [ner:/DATE|TIME/] ),
    action: ( Annotate($0, myNER, "MY_DATETIME" ) )
}

如何指定整个文档,而不是注释捕获组$ 0,而不是这样:

{
    pattern: ( [ner:/DATE|TIME/] ),
    action: ( Annotate( <document>, myNER, "MY_DATETIME" ) )
}

这可以是一个非常有用的功能,允许在找到特定的标记模式时注释整个文档(或者可能是一个句子)。感谢。

1 个答案:

答案 0 :(得分:0)

目前尚未实施此方法。没有通过TokensRegex直接访问代表文档的CoreMap的方法。

每个令牌都必须具有指向文档CoreMap的指针,然后您可以通过查看特定令牌来访问TokensRegex规则中的整个文档,但这需要对代码进行一些更改。 / p>

如果您想打开GitHub问题,我们可以尝试在将来的版本中添加此功能。