如何使用xpath从html中提取数据

时间:2016-01-11 11:23:26

标签: excel xpath google-sheets google-shopping

我试图通过Google电子表格从 Google购物提取产品价格

=IMPORTXML("https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0";"/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b")

我的 xpath查询是:

/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b

但我没有结果。

错在哪里?

来自Google购物的HTML Google Shopping

2 个答案:

答案 0 :(得分:1)

因为谷歌实际上没有返回HTML。请参阅页面的源代码

  • view-source:https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0

答案 1 :(得分:1)

从Google获取HTML时尝试使用User Agent。这是我几天前遇到的一个问题,通过模仿用户代理成为Chrome浏览器来解决这个问题。 您可以在Google上找到模仿User-Agent的不同方法(无双关语)。