Question

我正在使用Stanford Parser运行一个小型测试应用程序。

解析器正确识别红衣主教，例如＆＃34; 1990＆＃34;，＆＃34;一个＆＃34;，＆＃34;两个＆＃34;，＆＃34;三个＆＃34;。我正在寻找一种方法来检索带注释的文本的整数值。显然，对于最初不包含诸如＆＃34;一个＆＃34;，＆＃34;两个＆＃34;等数字的文本，这尤其令人感兴趣。等

这是否有内置功能？

Answer 1

解析器不包含类似的内容，但CoreNLP实际上具有此类功能。

您可以将以下函数应用于每个句子的CoreMap对象，将NumerizedTokensAnnotation添加到句子中，并将NumericValueAnnotation添加到每个令牌。

NumberNormalizer.findAndAnnotateNumericExpressions(sentence);

不幸的是，没有任何关于此功能的文档，但您可以查看NumberNormalizer的来源，其中至少包含一些注释和解释。