我正在尝试将XPath用作数据抓取器的一部分,以便从reddit中抓取项目的随机注释。问题是,评论表单具有唯一的ID,这些ID在每个页面和评论缩进级别内都会发生变化。我不确定如何使用这些不同的ID使XPath成为所有注释字段的目标。
示例如下所示:
//form[@id='form-t1_cj8cyupxa3']/div
//form[@id='form-t1_cj8e0iyx6w']/div
答案 0 :(得分:1)
如果ID存在某种模式,请尝试例如//form[starts-with(@id, 'form-')]/div