更多喜欢在Solr中搜索文档中的文本

时间:2015-09-22 09:41:46

标签: c# solr morelikethis

您好我对Solr模块MoreLikeThis感兴趣,但我不知道如何使用它。我有一个字符串,我不想在文档中搜索类似的文本,所以我这样做:

        internal static List<SolrRecord> FindMoreLikeThis(int shopId, string myString)
    {
        var result = new List<SolrRecord>();
        //coś z moreLikeThis
        var query = string.Format("shopid: {0}",shopId);

        var solr = ServiceLocator.Current.GetInstance<ISolrOperations<SolrRecord>>();

        var results3 = solr.MoreLikeThis(
            new SolrMoreLikeThisHandlerQuery(new SolrQuery(query)),
            new MoreLikeThisHandlerQueryOptions(
                new MoreLikeThisHandlerParameters(new string[] { "description" })
                    {
                        MatchInclude = true,
                        MinWordLength = 3,
                    })
                {
                    Rows = 10,
                });
        var baseDocument = results3.Match;
        var interestingTerms = results3.InterestingTerms;
        result.AddRange(results3);
        return result;
    }

我想搜索包含myString的拍卖说明。拍卖说明我没有HTML标签,样式和其他。只有文字。

有人能告诉我它是如何运作的吗?我需要将我的字符串索引到Solr?

@edit 我是这个

        internal static List<SolrRecord> FindMoreLikeThis(int shopId, string myString)
    {
        var result = new List<SolrRecord>();

        var query = string.Format("description: \"{0}\"", myString);
        var solr = ServiceLocator.Current.GetInstance<ISolrOperations<SolrRecord>>();

        ICollection<ISolrQuery> filters = new List<ISolrQuery>();
        filters.Add(new SolrQuery("shopid: 77777"));

        var results = solr.MoreLikeThis(
            new SolrMoreLikeThisHandlerQuery(new SolrQuery(query)),
            new MoreLikeThisHandlerQueryOptions(
                new MoreLikeThisHandlerParameters(new List<string>() { "description" })
                    {
                        MinTermFreq = 1,
                        MinDocFreq = 1
                    })
                {
                    Rows = 5,
                    Fields = new List<string>() { "score", "*" },
                    FilterQueries = filters
                });
        result.AddRange(results);             

        return result;
    }

对于参数myString我添加:&#34;用于运动驾驶&#34;在XML中我有一个文件,其描述中有:&#34;对于运动驾驶梅赛德斯每个班级&#34; ...结果我没有看到这个命题,但myString中的所有单词都等于本文档中的描述。请帮助。

1 个答案:

答案 0 :(得分:1)

首先,您应该索引Solr中的所有文档。

然后我建议你直接打电话给Solr。 完成工作后,您可以编写客户端代码。

MoreLikeThis的示例查询可能是这样的:

http://localhost:8983/solr/select?q=apache&mlt=true&mlt.fl=manu,cat&mlt.mindf=1&mlt.mintf=1&fl=id,score

请参阅文档:https://wiki.apache.org/solr/MoreLikeThis