对于NER(名称实体识别)工具,例如DBpedia,Zemanta,OpenCalais,Alchemy等,他们使用的算法是什么,是否有一个首选或常用的算法?
答案 0 :(得分:2)
检查Soundex - 一个非常好的和众所周知的名称匹配算法(用英语听到)。
答案 1 :(得分:2)
我上次使用Double Metaphone,它使用启发式方法来尝试猜测名称所属的原始语言,从而猜测它应该导致的发音。
但最终,这种认可并不像人们预期的那样好。大多数语言都有音译到拉丁语的规则(也称为韩语的罗马化),所以你可能想先检查一下。