我怎样才能提取相似的短语?

时间:2015-05-08 15:21:08

标签: java lucene

我正在使用Wordnet数据库。它给了我1或2个单词的含义或同义词。如果我想要类似的短语,怎么做?拜托,有人帮我这个。我也在我的代码中使用Lucene。如果用lucene做任何方法吗?。

    WordNetDatabase database = WordNetDatabase.getFileInstance();
        for (int i1 = 0; i1 < list1.size(); i1++) {

            Synset[] synsets = database.getSynsets(list1.get(i1));
            for (int i = 0; i < synsets.length; i++) {
                String[] wordForms = synsets[i].getWordForms();
                for (int j = 0; j < wordForms.length; j++) {
                    out.print(wordForms[j] + "\n");
                }
                out.println(synsets[i].getDefinition() + "\n");
            }
        }

1 个答案:

答案 0 :(得分:0)

Lucene有相似性评分,https://lucene.apache.org/core/4_2_0/core/org/apache/lucene/search/similarities/Similarity.html

这应该允许你相互得分两个字符串,然后指定字符串之间的最小相似性,从而允许你找到类似的字符串。