我正在使用Stanford Parser运行一个小型测试应用程序。
解析器正确识别红衣主教,例如" 1990","一个","两个","三个"。我正在寻找一种方法来检索带注释的文本的整数值。显然,对于最初不包含诸如"一个","两个"等数字的文本,这尤其令人感兴趣。等
这是否有内置功能?
答案 0 :(得分:2)
解析器不包含类似的内容,但CoreNLP实际上具有此类功能。
您可以将以下函数应用于每个句子的CoreMap
对象,将NumerizedTokensAnnotation
添加到句子中,并将NumericValueAnnotation
添加到每个令牌。
NumberNormalizer.findAndAnnotateNumericExpressions(sentence);
不幸的是,没有任何关于此功能的文档,但您可以查看NumberNormalizer
的来源,其中至少包含一些注释和解释。