使用rvest进行抓取-无法识别html节点

时间:2019-09-05 03:39:12

标签: html r web-scraping rvest

我正在尝试设置一个网络抓取工具,以从下面url中引用的网站中提取数据。我在r中使用rvest包,现在是following the instructions here

到目前为止,我具有以下代码来提取第一个数据点,但是在执行character(0)错误消息时得到statustext响应。有什么建议吗?

url <- 'https://www.ttbonline.gov/colasonline/viewColaDetails.do?action=publicDisplaySearchAdvanced&ttbid=10328001000040'
#This url will be modified to scrape multiple unique urls. 

#Reading the HTML code from the website
webpage <- read_html(url)

#Using CSS selectors to scrape the status section
status <- html_nodes(webpage,'.box tr:nth-of-type(3) td[valign]')

#Converting the status data to text
statustext <- html_text(status)

statustext

显示屏幕截图的修改。 enter image description here

0 个答案:

没有答案