我是第一次开始工作的GSA盒子。我已经与成功抓取所有行的数据库(用于人员搜索)建立了连接。然后它为我创建了一个Feed,但总是返回“Failed in error”,日志中包含以下内容:
ProcessNode: Does not match patterns, skipping record with URL: googledb://<host>/<Database>/azE9MTIsMQ
所以我尝试将数据库添加到爬网列表中(即来自Google Search Appliance index content from database)。但那总是返回
^googledb:// will not be included because it does not match any of the 'Follow and Crawl Only URLs' pattern
我不能为我的生活找出要放入该部分的内容。我需要在关注和仅抓取网址字段中包含哪些值?
答案 0 :(得分:2)
您需要将其添加到“仅跟踪和抓取具有以下模式的网址:”部分。该模式将允许任何数据库提要。