Sitecore - 页面搜索Vs项目搜索

时间:2017-01-19 19:41:05

标签: lucene web-crawler sitecore

我正在尝试使用sitecore对我的应用程序进行网站搜索。 挑战是 - 虽然我可以使用Lucene做到这一点 - 我能够抓取项目并返回项目而不是实际页面。 Page项可能与实际内容项有很大不同 虽然这看起来像一个非常常见的用例,但我无法找到实现此目的的解决方案。 我确实找到了像Coveo这样可以与Sitecore集成并抓取页面的工具,但是他们没有提供完整的API。 想知道人们如何看待这一点的一般方法。

1 个答案:

答案 0 :(得分:1)

我不确定您希望从Coveo使用哪个API部分,但是当您想要基于页面的搜索时,我通常会推荐Coveo或Google搜索。

使用Lucene / SOLR实现此目的的一种方法是使特定搜索索引具有页面内容的计算字段。确保仅索引作为此索引中页面类型模板的项目。然后,您的计算字段逻辑可以收集页面项上的所有数据源,并创建可用于文本搜索的所有文本的合并集合。

另一种方法是让计算字段包含页面的输出HTML。这里有一个github回购:https://github.com/hermanussen/sitecore-html-crawler

类似的问题: Components not indexed in sitecore lucene search indexes