使用ImportHTML和Google表格进行网页抓取

时间:2020-06-15 12:35:38

标签: web-scraping google-sheets google-sheets-formula google-sheets-importxml

我正在尝试使用Google表格和ImportHTML(及其类似ImportXML和ImportData的变体)从网页上抓取股票报价。它适用于某些网页,但不适用于其他网页。我无法从中导入数据的网页示例为https://www.barchart.com/stocks/performance/price-change/advances

我使用了以下代码: =IMPORTHTML("https://www.barchart.com/stocks/performance/price-change/advances","table",0)。有没有下载或抓取这些数据的方法?

2 个答案:

答案 0 :(得分:0)

您还有其他选择。您可以使用python或JS用任何语言编写用于网络抓取的简单脚本,也可以尝试免费使用barchart API。

https://www.barchart.com/ondemand/free-market-data-api

答案 1 :(得分:0)

Tl; IMPORTHMTL,IMPORTXML和IMPORTDATA博士无法从引用的网页导入数据,因为它要求在网络浏览器中启用JavaScript。


IMPORTHMTL,IMPORTXML和IMPORTDATA能够从Web上文件的源代码获取数据。

前两个要求HTML格式正确,它们不能从动态页面获取数据。

参考