我正在尝试设置一个网络抓取工具,以从下面url中引用的网站中提取数据。我在r中使用rvest
包,现在是following the instructions here。
到目前为止,我具有以下代码来提取第一个数据点,但是在执行character(0)
错误消息时得到statustext
响应。有什么建议吗?
url <- 'https://www.ttbonline.gov/colasonline/viewColaDetails.do?action=publicDisplaySearchAdvanced&ttbid=10328001000040'
#This url will be modified to scrape multiple unique urls.
#Reading the HTML code from the website
webpage <- read_html(url)
#Using CSS selectors to scrape the status section
status <- html_nodes(webpage,'.box tr:nth-of-type(3) td[valign]')
#Converting the status data to text
statustext <- html_text(status)
statustext