如何解析命名实体识别中的同义词?

时间:2013-04-05 13:43:41

标签: nlp nltk named-entity-recognition

在自然语言处理中,命名实体识别是一种挑战,即识别命名实体,例如组织,地点,以及最重要的名称

虽然我称之为 synonymy ,但仍存在一个重大挑战:计数 Dracula 实际上指的是相同的人,但有可能从未在文中直接讨论过。

解决这些同义词的最佳算法是什么?


如果在任何基于Python的库中都有这方面的功能,我很想接受教育。我正在使用NLTK。

1 个答案:

答案 0 :(得分:4)

您正在描述coreference resolution和命名实体链接的问题。我提供单独的链接,因为我不完全确定你的意思。

  • Coreference:Stanford CoreNLP目前有一个最好的实现,但是在Java中。我使用了python bindings并且我不太高兴 - 我最后只通过斯坦福管道运行了一次所有数据,然后在python中加载处理过的XML文件。显然,如果你必须实时处理,这不起作用。
  • 命名实体链接:查看Apache Stanbol以及以下Stackoverflow post中的链接。