我正在我公司设置Google Mini。我们正在使用它来搜索文档管理系统(DMS)中的文档,例如PDF或DOC。
我有一个DOC,只能通过它存储在URL中的ID(某些uuid)找到,但不能通过它的标题“批准”找到。
该文件存储在“http://dms.local/?id=36C71D9C-155D-0010-0117A0E6FC109FF0”
我正在使用术语“审批”调用的URL示例
这会返回大约20个文档,在标题或摘要中包含术语“approval”,但不是我正在寻找的文档。
我正在使用ID 调用的网址示例:
返回此内容:
<RES SN="1" EN="1">
<M>1</M>
<XT/>
<R N="1" MIME="application/octet-stream">
<U>
http://dms.local/?id=36C71D9C-155D-0010-0117A0E6FC109FF0
</U>
<UE>
http://dms.local/%3Fid%3D36C71D9C-155D-0010-0117A0E6FC109FF0
</UE>
<T>Approval</T>
<RK>10</RK>
<CRAWLDATE>18. Mai 2015</CRAWLDATE>
<FS NAME="date" VALUE="2014-12-19"/>
<S>
Approval for something (some text) (some other text<br> even more text). (text <b>...</b>
</S>
<LANG>ja</LANG>
<HAS>
<L/>
<C SZ="" CID="TV38Tk04ongJ" ENC="UTF-8"/>
</HAS>
</R>
</RES>
这对我没有任何意义,我不知道在哪里搜索。我是否在搜索网址中排除或遗忘了某些内容?
我尝试使用文档中出现的任何其他术语或短语。
我试图重新索引整个文档管理系统。
我还浏览了我们在Google Mini管理控制台中设置的过滤器,但所有文档都共享相同的链接(例如http://dms.local/?id=some-uuid)。
我们的Mini最多有50'000页,但我找不到已经有多少页。
我们的Mini运行在GSA 5.0.4,Build-ID 10000175.0.0
上答案 0 :(得分:1)
我不确定这是否有帮助。试试吧。
将&lr=lang_ja
添加到您的第一个查询中。
http://googlesearchappliance.local/search?q=Approval&output=xml_no_dtd&client=intranet&site=DMS&ie=UTF-8&oe=UTF-8&filter=0&num=1000的&安培; LR = lang_ja 强>
触发此查询,您应该获得所需的文档。