我已经培训了一个OpenNLP名称实体识别器。当我在某些数据上使用它时会产生如下输出:
[0..1) location
我宁愿输出数据中出现的原始名称。
答案 0 :(得分:1)
这是一个Span对象toString()输出。每次调用find(String [])都可以返回多个Spans,因此find()方法返回Span []。 使用此代码获取实际命名的实体
//"tokens" here is the String[] of words in your sentence
Span[] find = nf.find(tokens);
//use the Span's static method to get the String[] of names
String[] namedEntities = Span.spansToStrings(find, tokens);
span只是String []标记的开始和结束索引。