我正在尝试建立一个问答系统。我正在尝试分析正在使用的文本。我可以从数据中获取命名实体(使用NLTK,python)。而且在查询方面,我可以找到命名实体并获得焦点问题。现在我想将句子中的关键词与什么,如何,何时等问题联系起来。我的意思是,我想知道从一个句子中找到什么样的答案。
例如,如果一个句子是: 俄罗斯是亚洲最大的国家。
我应该能够得到 俄罗斯 - 什么,哪个 在亚洲 - 哪里
我怎样才能得到这种关系?
答案 0 :(得分:0)
如果我理解正确,您需要从WH单词到命名实体标签的映射吗?如果是这样,我的建议是硬编码映射 - 没有那么多命名实体标签/ WH字对。
您可以尝试的另一种方法是匹配依赖树。例如,“俄罗斯是亚洲最大的国家”中 country 到 Russia (nsubj)的边缘与之间的边缘相同 和俄罗斯在“亚洲最大的国家?”