命名实体识别的排名算法是什么,哪个最好?

时间:2011-05-09 13:32:00

标签: algorithm sorting analysis semantic-web

对于NER(名称实体识别)工具,例如DBpedia,Zemanta,OpenCalais,Alchemy等,他们使用的算法是什么,是否有一个首选或常用的算法?

2 个答案:

答案 0 :(得分:2)

检查Soundex - 一个非常好的和众所周知的名称匹配算法(用英语听到)。

答案 1 :(得分:2)

我上次使用Double Metaphone,它使用启发式方法来尝试猜测名称所属的原始语言,从而猜测它应该导致的发音。

但最终,这种认可并不像人们预期的那样好。大多数语言都有音译到拉丁语的规则(也称为韩语的罗马化),所以你可能想先检查一下。