斯坦福大学的命名实体识别包附带的演示文件显示 分类句子的例子。输出选项是字符串,例如:
"I eat apples with Michael and Jordan on mondays"
=>
"I eat apples with <PERSON>Michael</PERSON> and
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
或每个单词的分类地图。
是否有一种方法可以将分类图返回给实体列表?
EG:
{
PERSON : ["Michael", "Peter"]
DATE : ["mondays"]
}
答案 0 :(得分:0)
这是一个最小的bash脚本,它将作为后处理执行此操作:
echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'
使用此功能,您将获得与您的示例相同的列表:
date:{mondays}
person:{Michael,Jordan}
您可能想要处理多个条目(&#34; uniq&#34;或计算它们?)。