斯坦福NLP / NER - 如何使用提取器和分类器?

时间:2014-06-26 14:14:00

标签: java stanford-nlp named-entity-recognition named-entity-extraction

斯坦福大学的命名实体识别包附带的演示文件显示 分类句子的例子。输出选项是字符串,例如:

"I eat apples with Michael and Jordan on mondays" 

=>

 "I eat apples with <PERSON>Michael</PERSON> and 
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"

或每个单词的分类地图。

是否有一种方法可以将分类图返回给实体列表?

EG:

{
  PERSON : ["Michael", "Peter"]
  DATE : ["mondays"]
}

1 个答案:

答案 0 :(得分:0)

这是一个最小的bash脚本,它将作为后处理执行此操作:

echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'

使用此功能,您将获得与您的示例相同的列表:

date:{mondays}
person:{Michael,Jordan}

您可能想要处理多个条目(&#34; uniq&#34;或计算它们?)。