无法使用 rvest 和 blscrapeR 从 2011 年之前的 bls 网站抓取数据

时间:2021-02-18 18:59:54

标签: r

嗨,我正在尝试抓取以下网站

https://data.bls.gov/timeseries/CUURS49FSA0 使用以下代码

library(rvest)

url <- read_html("https://data.bls.gov/timeseries/CUURS49FSA0")

xpath_node <- '//*[(@id = "table0")]//td | //*[(@id = "table0")]//th'

yr_CPI_pre2018.df <- url %>%
html_nodes(xpath = xpath_node) %>%
html_text() %>% 
matrix(nrow = 16) %>%
t() %>% 
data.frame() 

colnames(yr_CPI_pre2018.df) <- yr_CPI_pre2018.df[1, ]

yr_CPI_pre2018.df <- yr_CPI_pre2018.df %>% 
slice(-1)

我的代码只能下载2011年到2021年的数据,但我想获取2000年到2021年的数据

我也尝试过使用 blscrapeR,但该库不会查询 2018 年之前的数据集。

month_HI_CPI_post2018.df <- bls_api("CUURS49FSA0", startyear = 2000, endyear = 2000)

0 个答案:

没有答案