在自然语言处理中,命名实体识别是一种挑战,即识别命名实体,例如组织,地点,以及最重要的名称。
虽然我称之为 synonymy ,但仍存在一个重大挑战:计数和 Dracula 实际上指的是相同的人,但有可能从未在文中直接讨论过。
解决这些同义词的最佳算法是什么?
如果在任何基于Python的库中都有这方面的功能,我很想接受教育。我正在使用NLTK。
答案 0 :(得分:4)
您正在描述coreference resolution和命名实体链接的问题。我提供单独的链接,因为我不完全确定你的意思。