斯坦福时间标记器在大多数情况下都能正常工作。例如"明天9点钟我应该在学校。"因为时间有9点钟。但是SUTime没有确定它:(
所以我想基于此添加规则。有什么建议吗?
我正在使用this
答案 0 :(得分:1)
我在“9点钟”规则下面添加了这条规则:
{ ( (?: /the/ /hour/ /of/?)? ([ $INT & { numcompvalue<=24 } ]) (/'/ /o/ /clock/)) => IsoTime($1[0].numcompvalue, 0, NIL) }
in:
EDU /斯坦福/ NLP /模型/ sutime / english.sutime.txt
并且能够识别您描述的模式。
请注意,tokenizer将“9'o clock”分为[“9”,“'”,“o”,“clock”]。
通常,如果您向该文件添加规则,则可以为要覆盖的案例添加自定义模式。该文件可以在这个jar中找到:
斯坦福-corenlp-3.5.2-models.jar