我完全不知所措并向我们寻求帮助!
我使用Import.io抓取工具从TripAdvisor提取评论。然而,当我训练爬虫时,"更多"按钮无效。
以下是完整评论的X路:// * [@ id =" UR288083139"] / div [2] / div / div [3]
到更多按钮: // * [@ id中=" review_288083139"] / DIV [1] / DIV [2] / DIV / DIV / DIV [3] / P /跨度
是否可以使用Xpath,以便完整审核包含在Import.io中?
答案 0 :(得分:1)
您可以通过使用Crawler然后使用Extractor来实现此目的。这会将过程分为两部分。
创建一个您可以训练的抓取工具,以捕获网页上每次审核的链接。确保为列选择 link 。
创建一个Extractor,以从您从抓取工具获得的链接中捕获完整的评论。
瞧!你收到了所有评论!
注意:如果您已经拥有了需要评论的页面的所有链接,那么最好使用Extractor而不是Crawler。这样,您可以将API链接到其他提取器。如果您不了解所有链接,则只需要一个抓取工具。
希望这有帮助!