我正在尝试使用自定义NER字典映射文件的Stanford CoreNLP。这是相当成功的。但我一直有默认的斯坦福NER实体,如DATE,NUMBER,我的自定义NER字典不包含。是否可以将其关闭?
示例:Toyota Altis 2.0(在自定义NER字典映射文件中找到)
斯坦福大学成绩:丰田:NER =组织,Altis:NER =车辆,2.0:NER = NUMBER
我的预期结果:丰田:NER =组织,Altis:NER =车辆,2.0:NER = 车辆
我是否可以输入任何属性来关闭它以生成实体DATE和NUMBER?
提前致谢!
答案 0 :(得分:1)
我设法解决了这个问题。要防止数字和日期相关的实体,您需要在Java代码中设置以下参数:
props.put( "ner.useSUTime","false" );//do not load the default SUTime models from Stanford
props.put( "ner.applyNumericClassifiers","false" );//do not use numeric from Stanford
感谢您的观看。