为什么在尝试刮取kickstarter.com时,ImportXML不能用于特定字段?

时间:2013-09-04 16:35:19

标签: web-scraping screen-scraping google-sheets

我正试图筛选特定Kickstarter项目的资金状况。 我在我的Google电子表格中使用以下公式,我在这里尝试的是获得项目资金状态的$ $:

=ImportXML("http://www.kickstarter.com/projects/1904431672/trsst-a-distributed-secure-blog-platform-for-the-o","//data[@class='Project942741362']")

它在单元格中返回#N / A,并带有注释:

  

错误:xPath查询未返回任何数据。

当我尝试在同一网页的其他部分使用ImportXML时,它似乎运行得非常好。有人可以指出我在这里做错了吗?

1 个答案:

答案 0 :(得分:0)

似乎没有正确解析标签“data”。

可选择的解决方法可能是:

=REGEXEXTRACT(IMPORTXML("http://...", "//div[@id='pledged']"), "^\S*")