我正在尝试对Yahoo财务数据进行网络抓取。我找到了一种适用于某些数据的解决方案...但是我不知道如何实现季度数据的飞跃。我想知道我是否走错了道路。这是一个对我有用的解决方案,但我不知道如何实现季度数据而非年度数据的飞跃: R: web scraping yahoo.finance after 2019 change
答案 0 :(得分:0)
抓取该页面的问题之一是它默认为“年度数据”。用户单击“季度”按钮后,季度数据将加载到浏览器中。虽然这对抓取不利,但对拦截API请求却有利。如果在浏览器中打开开发人员的控制台,请转到“网络”选项卡,然后选择“季度”按钮,您将看到一个请求(由于URL的确很长,所以将其放在底部)。该请求将返回JSON数据。
免责声明:我对R并不了解很多。但是,在进行了一些研究之后,我发现R有几个允许您读取JSON数据的程序包,您可以执行以下操作:< / p>
# using rjson
url = "<get from down below>"
data = rjson::readJSON(file=url)
# using jsonlite
library(jsonlite)
url = "<get from down below>"
data <- readJSON(url)
以下是网址:
您可以使用另一个URL来获取季度损益表数据,但在美国以外的公司使用时似乎有些不规律: