使用Solr搜索wiki URL

时间:2014-01-28 02:55:44

标签: solr lucene edismax

我正在尝试使用Solr在我们的Intranet上索引和搜索wiki。我或多或少使用edismax,但是我无法让主题页面首先显示在搜索结果中。例如,假设我在数据库中有一些URL:

http://whizbang.com/wiki/Foo/Bar
http://whizbang.com/wiki/Foo/Bar/One
http://whizbang.com/wiki/Foo/Bar/Two
http://whizbang.com/wiki/Foo/Bar/Two/Two_point_one

我希望能够搜索“foo bar”并将第一个链接作为最高结果返回,因为它是wiki中该特定主题的主页。我已尝试在搜索中提升标题和URL字段,但文档的fieldNorm值会影响分数,使得子页面得分更高。在一个特定情况下,主题页面显示在第二个结果页面上。

有没有办法让第一个URL分数显着高于子类别,以便它显示在前5个搜索结果中?

1 个答案:

答案 0 :(得分:1)

尝试一种可能的方法:

  1. 使用您的网址
  2. 创建一个copyField
  3. 仅提取路径(因此,没有主机,没有维基)
  4. 拆分/可能是空格
  5. 小写
  6. 提高短语或双字母或类似的东西。
  7. 如果你有很多关卡,也许你想要一个多值字段,不同的深度(从最后开始)获得单独的条目。这样一个完美的匹配将获得更好的价值。在这里,您应该开始尝试实际搜索。