GSA - 按元数据排序 - 首先按相关性排序 - 缺少结果

时间:2015-10-06 19:00:43

标签: google-search-appliance

嗨同事GSA开发者,

Sort by Metadata

官方文件如下所示,链接上面,

  

排序仅发生在1000个最相关的结果上   具体查询。

     

按元数据排序时,元数据的总长度为attr:value   对不能超过121个字符。超过最大字符   限制导致结果未排序。

我使用下面的GSA查询,这是一个' soryby'没有搜索字词的元数据

http://GSA-HOST/search?
access=p&
site=POC&
output=xml&
client=default_frontend&
q=&
num=1000&
filter=0&
requiredfields=TYPE:car&
partialfields=KEY:12345&
getfields=*&
start=0&
sort=meta:PRODUCT_ORDER&
start=0

我有一个等效的DB Oracle SQL查询,我有一个Order By。当我比较作为我的SQL查询结果的表时,GSA中缺少许多结果。所以,

  • GSA是否意味着丢失的文件是不相关的文件?
  • 我确实打开了那些丢失的文件,发现它们充满了相关的文字
  • 我没有通过任何' q'参数,它是一个简单的现场搜索,所以相关性如何计算?基于什么?
  • 我尝试添加空的' q'在精确短语搜索中带有缺失文档标题的参数,文档显示
  • 现在我无法理解幕后发生的事情,并试图理解丢失文件的原因。
  • 更改'过滤器'参数对各种值没有任何影响。
  • 虽然结果计数不超过1000时一切都按预期工作.GSA能够像DB一样对其进行精确排序
  • 但是添加' rc = 1'给我一个与DB匹配的计数,但GSA排序依据元数据的行为不像SQL ORDER BY

之前有人经历过这个吗?

2 个答案:

答案 0 :(得分:0)

由于您正在执行搜索,因此GSA需要一个查询字词。

您所描述的内容实际上是希望使用GSA执行数据库查询并返回所有结果。

解决此问题的一种方法是,如果您的所有内容源都包含包含公司名称的文档URI,那么您可以将q值设为公司名称。

即如果每个文档URL都是这样的:

http://www.acme.com/blah/blah/blah http://gsa-db-adaptor.acme.com:5959/doc/12345858

如果您的“q”值是“acme”,那么您将获得每个文档的命中,因此在这种情况下按元数据排序应该有效(同样,如果您期望的文档超出了相关性,则可能会出现相关性问题第1000名。

这就是我要解决的问题。

答案 1 :(得分:0)

不确定这是否可以解决您的问题,但您可以尝试使用sitesearch或as_sitesearch或网站请求参数。