使用Google表格+ IMPORTXML提取财务报表数据

时间:2019-12-13 19:09:35

标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

我正试图从财务报表中将几千家公司的上一季度的研发费用导入Google表格。虽然我想从财务报表中导入几个不同的元素,但当前有关上一季度的研发费用(可能也涉及前三个季度)。

我尝试了几个不同的站点(雅虎财经,彭博社等),但是最简单的URL似乎来自stockrow.com,因为我可以简单地自动替换URL中的股票报价器。

要获取xpath,请检查元素并使用浏览器(已在Chrome和Firefox上尝试过)复制xpath。

我正在googlesheets上使用IMPORTXML,最后一次尝试使用以下输入:=IMPORTXML("https://stockrow.com/JNJ/financials/income/quarterly","/html/body/div[1]/div/div/section/div/div[2]/div[1]/section[4]/div/div[3]/div/div/div[3]/div/div/div[11]/div/span")

我已经尝试了与元素相关的网站,浏览器和xpath的各种组合,但是无论我做什么,我总是会遇到相同的错误“导入的内容为空”。

我读过xpath google sheet importxml,但无法理解xpath更改中发生的事情或如何解决此特殊挑战。

因为我希望这在Google表格中的多个股票行情自动收录器中可重复,所以我希望研发费用(以及财务报表中的其他元素)的“位置”在所有页面上都保持一致,而不仅仅是一个特定页面解决此挑战的方法。

期待得到指导。谢谢!

1 个答案:

答案 0 :(得分:0)

您需要其他来源。 Google表格不支持抓取JavaScript元素。您只需在给定的站点上禁用JS,即可测试JS依赖关系,剩下的可以被清除。在您的情况下,什么都没有:

0