用Sheets抓取数据会引发错误

时间:2020-04-02 12:55:07

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我遇到错误:

导入的内容为空

当我这样使用importxml时:

=IMPORTXML("https://pvpoke.com/rankings/all/1500/overall/","//div[@class='rankings-container clear']/div/div[2]/span[2]")

我已经在Xpath助手中测试了查询,并获得了所需的确切结果。只有当它将数据发送到Google表格时,才起作用。

2 个答案:

答案 0 :(得分:1)

您要抓取的网站受JavaScript控制。 Google表格无法导入JS元素。您可以通过禁用给定站点的JavaScript来简单地对此进行测试,然后将剩下的内容进行抓取。就您而言,只有您在这里看到的内容:

0

答案 1 :(得分:0)

备用选项。使用自定义脚本直接加载JSON数据。

使用GoogleSheets导入JSON数据的脚本(归Paul Gambill授予):https://gist.github.com/paulgambill/cacd19da95a1421d3164

数据:

https://pvpoke.com/data/all/overall/rankings-1500.json?v=1.14.5.2

输出:

PokemonData

编辑

仅输出口袋妖怪的名称:

=UNIQUE(QUERY(ImportJSON("https://pvpoke.com/data/all/overall/rankings-1500.json?v=1.14.5.2");"SELECT Col1";1))