我想在一组关键词(主要是爱好,最新新闻等等)上实现基于python的语义搜索,人们可能会有兴趣谈论这些关键词。我想知道是否存在相同的开源搜索算法/实现的本体数据库。
EG。我的设置= {谈话,喝酒,推特,Katrina Kaif,Katrina旋风,摇滚收集,收集硬币}
因此,在搜索“累积”时,我可能会收集摇滚和收集硬币作为输出。
编辑: 这些术语可以有多个单词。那就是“总统。美国的巴拉克奥巴马”是一个有效的问题。
答案 0 :(得分:4)
您可能想要使用“随机索引”。它可以完全满足您的需求,它可以为每个单词计算一个特征向量,并定义两个单词之间语义相似性的度量。
您只需获取An Introduction to Random Indexing和semanticvectors包的副本即可开始使用...
我希望这有帮助,如果您需要进一步的建议,请发表评论......
答案 1 :(得分:1)