Google Search Appliance对已爬网数据库内容的断开链接

时间:2013-11-27 13:51:20

标签: sql-server google-search-appliance

我们正在抓取SQL服务器以获取员工详细信息。完成同步,对数据进行爬网和编制索引。从测试中心搜索员工姓名后,我可以看到结果集,但是当我点击结果集时,会打开http://DOMAIN_NAME/db/HOSTNAME/DB_SOURCE_NAME/RANDOM_HASH_ID这样的链接,找不到404。

但是当我点击Cached时,它会正确显示结果。

2 个答案:

答案 0 :(得分:1)

成为6.10我猜你正在使用内置的数据库爬虫,而不是外接连接器。

如果是这种情况,则问题很可能是您配置的服务器查询或服务URL。

关于抓取和索引>在“数据库”页面中,确保“服务查询”或“服务URL字段”中存在有效条目。

答案 1 :(得分:0)

解决方案: 我在Crawl和Index-> Databases-> New / Edit中配置了错误的数据库设置。抓取查询和服务查询在这里不应该相同。如果您的表具有主键'emp_id',则您的抓取查询应为

  

从员工

中选择emp_id,emp_name,emp_address

但您的服务查询应该是

  

从员工中选择emp_id,emp_name,emp_address,其中emp_id =?

,您必须在主键字段中设置'emp_id'。

如果您有多个主键(比如emp_id和emp_name),那么您可以在服务查询中提及过滤器,如

  

从员工中选择emp_id,emp_name,emp_address,其中emp_id =?   和emp_name =?