Google工作表上的IMPORTxml

时间:2015-10-03 18:51:02

标签: html web-scraping google-sheets

尝试在Google工作表上制作一个电子表格,用于从网站上抓取数据。

我试图从rsbuddy exchange获得商品的售价,例如:

https://rsbuddy.com/exchange/?id=1745

我在google工作表上的代码为:

=IMPORTxml("https://rsbuddy.com/exchange/?id=1745","//*[@id='sell-price']")

但是,不是向我显示1734gp,而是在工作表上显示---。 我已经尝试在/text()的查询末尾添加importxml,但它并没有改变任何内容。

我猜测解决方案类似吗?

2 个答案:

答案 0 :(得分:1)

我不相信你可以用xpath做到这一点,因为它是动态填充的。如果您查看完整的源代码,那么您将获得所有内容。它确实是---

您可以看到JSON中的源数据here,看起来与页面网址ID相关联。 Google表格本身并不支持json,而是this good person wrote a script,它似乎在我的example sheet中运行良好。

答案 1 :(得分:0)

您需要通过JSON进行此操作,但无法通过Google表单本机导入.JSON。如果您将此库作为代码添加到工作表(通过脚本编辑器),那么您可以使用= IMPORTJSON(具有不同的参数)来获取所需的数据。

http://blog.fastfedora.com/projects/import-json