我已经构建了一个自定义连接器,用于从Web服务获取数据,然后将其编入索引。 Web服务响应仅返回要编制索引的数据。
我想删除索引中的文档,这些文档在爬网过程中不属于Web服务响应,但在上次爬网时已添加到索引中。
有没有办法实现上述目的,或者我可以在连接器代码中以编程方式刷新完整索引,然后将最近的内容添加到索引中。
答案 0 :(得分:0)
Marged是正确的。类型为full的馈送(连接器可以发送到GSA的馈送)将清除现有馈送并替换它。否则,您的连接器将必须按照您的决定管理状态并删除文档。
答案 1 :(得分:0)
感谢Marged和Michael的帮助。我想我必须在连接器中编写自定义逻辑以从索引中删除数据。
答案 2 :(得分:0)
您尝试实现的目标正是您发送"完整"内容提要。这来自documentation:
如果内容Feed的feedtype元素设置为full,系统将删除与数据源关联的所有先前URL。新的饲料含量完全取代了先前的饲料内容。如果Feed包含元数据,则还必须为每条记录提供内容;完整的Feed无法单独推送元数据。您可以通过推送空的完整Feed来删除数据源中的所有文档。
Marged是正确的,v4.x是未来的发展方向,但如果您已经使用3.x连接器框架启动了这个,并且您对此感到满意无需急于升级。所有相关代码都是开源的,3.x不会很快消失,基于它的第三方连接器太多了。