我们想索引客户网站并将所有数据存储在IBM Watson Discovery service中。然后,当用户提出与客户数据有关的问题时(我们将发现与Watson Assistant连接起来)。聊天机器人应该连接到Discovery并获取数据以进行响应。
问题: 客户网站有多个链接,每个链接将有更多链接,我们希望从网站中检索所有数据并建立索引并将其存储在Watson Discovery服务中。我们尝试对网站进行爬网,但是发现服务需要花费很多时间来对网站进行爬网,并且它在1周后也未完成任务。 请让我们知道如何更好更快地实现这一目标。
答案 0 :(得分:0)
请注意,网络抓取是当前的Beta版,Watson Discovery documentation for web crawl指出,根据网站的不同,它不会提取所有数据。
我在与您类似的情况下在Discovery中使用了Web爬网,并使用通过Watson Assistant建立的聊天查询我的网站。您应该做什么: