如何在stanford时间标记器中编写sutime的自定义规则?

时间:2015-10-22 17:43:31

标签: stanford-nlp temporal sutime

斯坦福时间标记器在大多数情况下都能正常工作。例如"明天9点钟我应该在学校。"因为时间有9点钟。但是SUTime没有确定它:(

所以我想基于此添加规则。有什么建议吗?

我正在使用this

1 个答案:

答案 0 :(得分:1)

我在“9点钟”规则下面添加了这条规则:

{ ( (?: /the/ /hour/ /of/?)? ([ $INT & { numcompvalue<=24 } ]) (/'/ /o/ /clock/)) => IsoTime($1[0].numcompvalue, 0, NIL) }

in:

EDU /斯坦福/ NLP /模型/ sutime / english.sutime.txt

并且能够识别您描述的模式。

请注意,tokenizer将“9'o clock”分为[“9”,“'”,“o”,“clock”]。

通常,如果您向该文件添加规则,则可以为要覆盖的案例添加自定义模式。该文件可以在这个jar中找到:

斯坦福-corenlp-3.5.2-models.jar