sitecore搜索同义词文件位置

时间:2016-01-04 04:54:10

标签: lucene sitecore sitecore7

我已将DefaultIndexConfiguration配置文件更改为基于同义词(http://firebreaksice.com/sitecore-synonym-search-with-lucene/)进行搜索,并且工作正常。但是,它基于文件系统中的xml文件

<param hint="engine" type="Sitecore.ContentSearch.LuceneProvider.Analyzers.XmlSynonymEngine, Sitecore.ContentSearch.LuceneProvider">
   <param hint="xmlSynonymFilePath">C:\inetpub\wwwroot\website\Data\synonyms.xml</param>
</param>

我想要做的是在CMS中管理这些数据。 有谁知道如何设置这个xmlSynonymFilePath参数来实现我想要的?或者我错过了什么?

1 个答案:

答案 0 :(得分:5)

最简单的解决方案是使用只有一个名为/sitecore/system/synonyms的多行字段的模板在Sitecore中创建一个项目(例如Synonyms),并将xml保留在此字段中,而不是从文件中读取它。

然后像这样创建ISynonymEngine的自定义实现(这只是最简单的示例 - 它是 NOT 生产就绪代码):

public class CustomSynonymEngine : Sitecore.ContentSearch.LuceneProvider.Analyzers.ISynonymEngine
{
    private readonly List<ReadOnlyCollection<string>> _synonymGroups = new List<ReadOnlyCollection<string>>();

    public CustomSynonymEngine()
    {
        Database database = Sitecore.Context.ContentDatabase ?? Sitecore.Context.Database ?? Database.GetDatabase("web");
        Item item = database.GetItem("/sitecore/system/synonyms"); // or whatever is the path
        XmlDocument xmlDocument = new XmlDocument();
        xmlDocument.LoadXml(item["synonyms"]);
        XmlNodeList xmlNodeList = xmlDocument.SelectNodes("/synonyms/group");

        if (xmlNodeList == null)
            throw new InvalidOperationException("There are no synonym groups in the file.");

        foreach (IEnumerable source in xmlNodeList)
            _synonymGroups.Add(
                new ReadOnlyCollection<string>(
                    source.Cast<XmlNode>().Select(synNode => synNode.InnerText.Trim().ToLower()).ToList()));
    }

    public IEnumerable<string> GetSynonyms(string word)
    {
        Assert.ArgumentNotNull(word, "word");
        foreach (ReadOnlyCollection<string> readOnlyCollection in _synonymGroups)
        {
            if (readOnlyCollection.Contains(word))
                return readOnlyCollection;
        }
        return null;
    }
}

在Sitecore配置中注册引擎而不是默认引擎:

<analyzer type="Sitecore.ContentSearch.LuceneProvider.Analyzers.PerExecutionContextAnalyzer, Sitecore.ContentSearch.LuceneProvider">
  <param desc="defaultAnalyzer" type="Sitecore.ContentSearch.LuceneProvider.Analyzers.DefaultPerFieldAnalyzer, Sitecore.ContentSearch.LuceneProvider">
    <param desc="defaultAnalyzer" type="Sitecore.ContentSearch.LuceneProvider.Analyzers.SynonymAnalyzer, Sitecore.ContentSearch.LuceneProvider">
      <param hint="engine" type="My.Assembly.Namespace.CustomSynonymEngine, My.Assembly">
      </param>
    </param>
  </param>
</analyzer>

这是 NOT 生产就绪代码 - 它只在实例化CustomSynonymsEngine类时读取一次同义词列表(我不知道Sitecore是保留实例还是创建新实例多次)。

您应该扩展此代码以缓存同义词并在每次更改同义词列表时清除缓存。

另外,你应该考虑在Sitecore树中有一个很好的同义词结构,而不是一个很难维护的项目和xml blob。