Stanford CoreNLP删除NUMBER实体

时间:2016-09-30 03:28:02

标签: java stanford-nlp

我正在尝试使用自定义NER字典映射文件的Stanford CoreNLP。这是相当成功的。但我一直有默认的斯坦福NER实体,如DATE,NUMBER,我的自定义NER字典不包含。是否可以将其关闭?

示例:Toyota Altis 2.0(在自定义NER字典映射文件中找到)

斯坦福大学成绩:丰田:NER =组织,Altis:NER =车辆,2.0:NER = NUMBER

我的预期结果:丰田:NER =组织,Altis:NER =车辆,2.0:NER = 车辆

我是否可以输入任何属性来关闭它以生成实体DATE和NUMBER?

提前致谢!

1 个答案:

答案 0 :(得分:1)

我设法解决了这个问题。要防止数字和日期相关的实体,您需要在Java代码中设置以下参数:

props.put( "ner.useSUTime","false" );//do not load the default SUTime models from Stanford
props.put( "ner.applyNumericClassifiers","false" );//do not use numeric from Stanford

感谢您的观看。