嗨,我正在尝试抓取以下网站
https://data.bls.gov/timeseries/CUURS49FSA0
使用以下代码
library(rvest)
url <- read_html("https://data.bls.gov/timeseries/CUURS49FSA0")
xpath_node <- '//*[(@id = "table0")]//td | //*[(@id = "table0")]//th'
yr_CPI_pre2018.df <- url %>%
html_nodes(xpath = xpath_node) %>%
html_text() %>%
matrix(nrow = 16) %>%
t() %>%
data.frame()
colnames(yr_CPI_pre2018.df) <- yr_CPI_pre2018.df[1, ]
yr_CPI_pre2018.df <- yr_CPI_pre2018.df %>%
slice(-1)
我的代码只能下载2011年到2021年的数据,但我想获取2000年到2021年的数据
我也尝试过使用 blscrapeR
,但该库不会查询 2018 年之前的数据集。
month_HI_CPI_post2018.df <- bls_api("CUURS49FSA0", startyear = 2000, endyear = 2000)