搜索标题

时间:2015-05-19 11:33:16

标签: google-search-appliance

我正在我公司设置Google Mini。我们正在使用它来搜索文档管理系统(DMS)中的文档,例如PDF或DOC。

我有一个DOC,只能通过它存储在URL中的ID(某些uuid)找到,但不能通过它的标题“批准”找到。

该文件存储在“http://dms.local/?id=36C71D9C-155D-0010-0117A0E6FC109FF0

我正在使用术语“审批”调用的URL示例

http://googlesearchappliance.local/search?q=Approval&output=xml_no_dtd&client=intranet&site=DMS&ie=UTF-8&oe=UTF-8&filter=0&num=1000

这会返回大约20个文档,在标题或摘要中包含术语“approval”,但不是我正在寻找的文档。

我正在使用ID 调用的网址示例:

http://googlesearchappliance.local/search?q=36C71D9C-155D-0010-0117A0E6FC109FF0&output=xml_no_dtd&client=intranet&site=DMS&ie=UTF-8&oe=UTF-8&filter=0&num=1000

返回此内容:

<RES SN="1" EN="1">
  <M>1</M>
  <XT/>
  <R N="1" MIME="application/octet-stream">
    <U>
      http://dms.local/?id=36C71D9C-155D-0010-0117A0E6FC109FF0
    </U>
    <UE>
      http://dms.local/%3Fid%3D36C71D9C-155D-0010-0117A0E6FC109FF0
    </UE>
    <T>Approval</T>
    <RK>10</RK>
    <CRAWLDATE>18. Mai 2015</CRAWLDATE>
    <FS NAME="date" VALUE="2014-12-19"/>
    <S>
      Approval for something (some text) (some other text<br> even more text). (text <b>...</b>
    </S>
    <LANG>ja</LANG>
    <HAS>
      <L/>
      <C SZ="" CID="TV38Tk04ongJ" ENC="UTF-8"/>
    </HAS>
  </R>
</RES>

这对我没有任何意义,我不知道在哪里搜索。我是否在搜索网址中排除或遗忘了某些内容?

我尝试使用文档中出现的任何其他术语或短语。

我试图重新索引整个文档管理系统。

我还浏览了我们在Google Mini管理控制台中设置的过滤器,但所有文档都共享相同的链接(例如http://dms.local/?id=some-uuid)。

我们的Mini最多有50'000页,但我找不到已经有多少页。

我们的Mini运行在GSA 5.0.4,Build-ID 10000175.0.0

1 个答案:

答案 0 :(得分:1)

我不确定这是否有帮助。试试吧。 将&lr=lang_ja添加到您的第一个查询中。

http://googlesearchappliance.local/search?q=Approval&output=xml_no_dtd&client=intranet&site=DMS&ie=UTF-8&oe=UTF-8&filter=0&num=1000&安培; LR = lang_ja

触发此查询,您应该获得所需的文档。