如何将Slack存档导入GSA?

时间:2015-05-01 13:06:03

标签: google-search-appliance slack-api

我想知道如何使用Slack API将消息历史记录提供给GSA(Google Search Appliance)并使其保持最新状态。

有没有人写过这个剧本?

1 个答案:

答案 0 :(得分:0)

我没有现成的剧本,但它应该可以像你想象的那样; IMO(不熟悉松弛的api,但对松散的存档大小有一些了解,即> 500K消息),我认为主要的挑战是识别和提取对你来说重要的信息。松散的存档(如果你过于离散地选择了你的GSA饲料记录元素,它可以很容易地让你用完你的GSA文件索引许可证限制 - 例如,想象每条消息是否是一个单独的饲料记录)。

换句话说,您需要识别离散的Feed记录,使其尽可能保持原子级大,以便将文档许可证使用率降至最低,同时保持它们足够分散以产生准确的结果。

一旦完成,或者您的GSA索引许可证限制不成问题,一种可能的解决方案是通过使用其API从松弛存档读取更新来创建增量/完整订阅源,然后编译新的找到的记录,转换为GSA订阅源格式(您希望能够在适当的时候搜索/忽略标记中包含的信息,以及您需要在结果中显示的信息,包含在html元标记中),并推送这些新记录进入GSA。

另一种解决方案是,如果您能够托管一些可以进行GSA抓取的Web应用程序页面,甚至可以让您通过持续抓取使其索引保持最新状态。为此,您至少需要一个"跳转页面"这只是一个链接列表,每个链接都填充了查询字符串参数,传递给您的详细记录页面,这将用于标识一组您已确定需要的详细信息存档元素ID。索引为离散记录。然后,您需要设置"跳转页面"要由GSA抓取的URL,还要开发XSLT或其他搜索结果使用者服务,以便能够使用元标记中包含的信息读取/呈现返回的结果。注意:当消费者服务对GSA进行搜索呼叫时,它需要传入"& getfields = *"查询字符串参数以使GSA返回元标记中包含的所有信息。

我希望我的措辞不是太深奥,并且在某种程度上帮助您设计解决方案。