标签: java algorithm keyword similarity
我正在尝试用几种算法来测量两个句子之间的相似性。我认为如果我对句子进行某种扩展表示会有所帮助。
我们可以通过google / bing搜索获得这种扩展的表示形式,但是将整个句子作为关键字并不会给出好的结果,尤其是如果句子很长。因此我认为在句子中查找关键字并将其用作搜索字词会改善我们的结果。
有人知道在句子中查找关键词的算法吗?
谢谢!
答案 0 :(得分:4)
Lucene可以处理该提取以及比较。