Stanford Parser:获得CARD的整数价值?

时间:2015-06-07 19:44:39

标签: java nlp stanford-nlp

我正在使用Stanford Parser运行一个小型测试应用程序。

解析器正确识别红衣主教,例如" 1990","一个","两个","三个"。我正在寻找一种方法来检索带注释的文本的整数值。显然,对于最初不包含诸如"一个","两个"等数字的文本,这尤其令人感兴趣。等

这是否有内置功能?

1 个答案:

答案 0 :(得分:2)

解析器不包含类似的内容,但CoreNLP实际上具有此类功能。

您可以将以下函数应用于每个句子的CoreMap对象,将NumerizedTokensAnnotation添加到句子中,并将NumericValueAnnotation添加到每个令牌。

NumberNormalizer.findAndAnnotateNumericExpressions(sentence);

不幸的是,没有任何关于此功能的文档,但您可以查看NumberNormalizer的来源,其中至少包含一些注释和解释。